Initial comdat implementation.
[oota-llvm.git] / lib / MC / MCParser / ELFAsmParser.cpp
1 //===- ELFAsmParser.cpp - ELF Assembly Parser -----------------------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 #include "llvm/MC/MCParser/MCAsmParserExtension.h"
11 #include "llvm/ADT/StringSwitch.h"
12 #include "llvm/ADT/Twine.h"
13 #include "llvm/MC/MCAsmInfo.h"
14 #include "llvm/MC/MCContext.h"
15 #include "llvm/MC/MCExpr.h"
16 #include "llvm/MC/MCParser/MCAsmLexer.h"
17 #include "llvm/MC/MCSectionELF.h"
18 #include "llvm/MC/MCStreamer.h"
19 using namespace llvm;
20
21 namespace {
22
23 class ELFAsmParser : public MCAsmParserExtension {
24   template<bool (ELFAsmParser::*Handler)(StringRef, SMLoc)>
25   void AddDirectiveHandler(StringRef Directive) {
26     getParser().AddDirectiveHandler(this, Directive,
27                                     HandleDirective<ELFAsmParser, Handler>);
28   }
29
30   bool ParseSectionSwitch(StringRef Section, unsigned Type,
31                           unsigned Flags, SectionKind Kind);
32
33 public:
34   ELFAsmParser() {}
35
36   virtual void Initialize(MCAsmParser &Parser) {
37     // Call the base implementation.
38     this->MCAsmParserExtension::Initialize(Parser);
39
40     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveData>(".data");
41     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveText>(".text");
42     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveBSS>(".bss");
43     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveRoData>(".rodata");
44     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveTData>(".tdata");
45     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveTBSS>(".tbss");
46     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveDataRel>(".data.rel");
47     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveDataRelRo>(".data.rel.ro");
48     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveDataRelRoLocal>(".data.rel.ro.local");
49     AddDirectiveHandler<&ELFAsmParser::ParseSectionDirectiveEhFrame>(".eh_frame");
50     AddDirectiveHandler<&ELFAsmParser::ParseDirectiveSection>(".section");
51     AddDirectiveHandler<&ELFAsmParser::ParseDirectiveSize>(".size");
52     AddDirectiveHandler<&ELFAsmParser::ParseDirectivePrevious>(".previous");
53     AddDirectiveHandler<&ELFAsmParser::ParseDirectiveType>(".type");
54     AddDirectiveHandler<&ELFAsmParser::ParseDirectiveIdent>(".ident");
55     AddDirectiveHandler<&ELFAsmParser::ParseDirectiveSymver>(".symver");
56     AddDirectiveHandler<&ELFAsmParser::ParseDirectiveWeakref>(".weakref");
57   }
58
59   // FIXME: Part of this logic is duplicated in the MCELFStreamer. What is
60   // the best way for us to get access to it?
61   bool ParseSectionDirectiveData(StringRef, SMLoc) {
62     return ParseSectionSwitch(".data", MCSectionELF::SHT_PROGBITS,
63                               MCSectionELF::SHF_WRITE |MCSectionELF::SHF_ALLOC,
64                               SectionKind::getDataRel());
65   }
66   bool ParseSectionDirectiveText(StringRef, SMLoc) {
67     return ParseSectionSwitch(".text", MCSectionELF::SHT_PROGBITS,
68                               MCSectionELF::SHF_EXECINSTR |
69                               MCSectionELF::SHF_ALLOC, SectionKind::getText());
70   }
71   bool ParseSectionDirectiveBSS(StringRef, SMLoc) {
72     return ParseSectionSwitch(".bss", MCSectionELF::SHT_NOBITS,
73                               MCSectionELF::SHF_WRITE |
74                               MCSectionELF::SHF_ALLOC, SectionKind::getBSS());
75   }
76   bool ParseSectionDirectiveRoData(StringRef, SMLoc) {
77     return ParseSectionSwitch(".rodata", MCSectionELF::SHT_PROGBITS,
78                               MCSectionELF::SHF_ALLOC,
79                               SectionKind::getReadOnly());
80   }
81   bool ParseSectionDirectiveTData(StringRef, SMLoc) {
82     return ParseSectionSwitch(".tdata", MCSectionELF::SHT_PROGBITS,
83                               MCSectionELF::SHF_ALLOC |
84                               MCSectionELF::SHF_TLS | MCSectionELF::SHF_WRITE,
85                               SectionKind::getThreadData());
86   }
87   bool ParseSectionDirectiveTBSS(StringRef, SMLoc) {
88     return ParseSectionSwitch(".tbss", MCSectionELF::SHT_NOBITS,
89                               MCSectionELF::SHF_ALLOC |
90                               MCSectionELF::SHF_TLS | MCSectionELF::SHF_WRITE,
91                               SectionKind::getThreadBSS());
92   }
93   bool ParseSectionDirectiveDataRel(StringRef, SMLoc) {
94     return ParseSectionSwitch(".data.rel", MCSectionELF::SHT_PROGBITS,
95                               MCSectionELF::SHF_ALLOC |
96                               MCSectionELF::SHF_WRITE,
97                               SectionKind::getDataRel());
98   }
99   bool ParseSectionDirectiveDataRelRo(StringRef, SMLoc) {
100     return ParseSectionSwitch(".data.rel.ro", MCSectionELF::SHT_PROGBITS,
101                               MCSectionELF::SHF_ALLOC |
102                               MCSectionELF::SHF_WRITE,
103                               SectionKind::getReadOnlyWithRel());
104   }
105   bool ParseSectionDirectiveDataRelRoLocal(StringRef, SMLoc) {
106     return ParseSectionSwitch(".data.rel.ro.local", MCSectionELF::SHT_PROGBITS,
107                               MCSectionELF::SHF_ALLOC |
108                               MCSectionELF::SHF_WRITE,
109                               SectionKind::getReadOnlyWithRelLocal());
110   }
111   bool ParseSectionDirectiveEhFrame(StringRef, SMLoc) {
112     return ParseSectionSwitch(".eh_frame", MCSectionELF::SHT_PROGBITS,
113                               MCSectionELF::SHF_ALLOC |
114                               MCSectionELF::SHF_WRITE,
115                               SectionKind::getDataRel());
116   }
117   bool ParseDirectiveSection(StringRef, SMLoc);
118   bool ParseDirectiveSize(StringRef, SMLoc);
119   bool ParseDirectivePrevious(StringRef, SMLoc);
120   bool ParseDirectiveType(StringRef, SMLoc);
121   bool ParseDirectiveIdent(StringRef, SMLoc);
122   bool ParseDirectiveSymver(StringRef, SMLoc);
123   bool ParseDirectiveWeakref(StringRef, SMLoc);
124
125 private:
126   bool ParseSectionName(StringRef &SectionName);
127 };
128
129 }
130
131 bool ELFAsmParser::ParseSectionSwitch(StringRef Section, unsigned Type,
132                                       unsigned Flags, SectionKind Kind) {
133   if (getLexer().isNot(AsmToken::EndOfStatement))
134     return TokError("unexpected token in section switching directive");
135   Lex();
136
137   getStreamer().SwitchSection(getContext().getELFSection(
138                                 Section, Type, Flags, Kind));
139
140   return false;
141 }
142
143 bool ELFAsmParser::ParseDirectiveSize(StringRef, SMLoc) {
144   StringRef Name;
145   if (getParser().ParseIdentifier(Name))
146     return TokError("expected identifier in directive");
147   MCSymbol *Sym = getContext().GetOrCreateSymbol(Name);;
148
149   if (getLexer().isNot(AsmToken::Comma))
150     return TokError("unexpected token in directive");
151   Lex();
152
153   const MCExpr *Expr;
154   if (getParser().ParseExpression(Expr))
155     return true;
156
157   if (getLexer().isNot(AsmToken::EndOfStatement))
158     return TokError("unexpected token in directive");
159
160   getStreamer().EmitELFSize(Sym, Expr);
161   return false;
162 }
163
164 bool ELFAsmParser::ParseSectionName(StringRef &SectionName) {
165   // A section name can contain -, so we cannot just use
166   // ParseIdentifier.
167   SMLoc FirstLoc = getLexer().getLoc();
168   unsigned Size = 0;
169
170   for (;;) {
171     StringRef Tmp;
172     unsigned CurSize;
173
174     SMLoc PrevLoc = getLexer().getLoc();
175     if (getLexer().is(AsmToken::Minus)) {
176       CurSize = 1;
177       Lex(); // Consume the "-".
178     } else if (!getParser().ParseIdentifier(Tmp))
179       CurSize = Tmp.size();
180     else
181       break;
182
183     Size += CurSize;
184     SectionName = StringRef(FirstLoc.getPointer(), Size);
185
186     // Make sure the following token is adjacent.
187     if (PrevLoc.getPointer() + CurSize != getTok().getLoc().getPointer())
188       break;
189   }
190   if (Size == 0)
191     return true;
192
193   return false;
194 }
195
196 // FIXME: This is a work in progress.
197 bool ELFAsmParser::ParseDirectiveSection(StringRef, SMLoc) {
198   StringRef SectionName;
199
200   if (ParseSectionName(SectionName))
201     return TokError("expected identifier in directive");
202
203   StringRef FlagsStr;
204   StringRef TypeName;
205   int64_t Size = 0;
206   StringRef GroupName;
207   if (getLexer().is(AsmToken::Comma)) {
208     Lex();
209
210     if (getLexer().isNot(AsmToken::String))
211       return TokError("expected string in directive");
212
213     FlagsStr = getTok().getStringContents();
214     Lex();
215
216     AsmToken::TokenKind TypeStartToken;
217     if (getContext().getAsmInfo().getCommentString()[0] == '@')
218       TypeStartToken = AsmToken::Percent;
219     else
220       TypeStartToken = AsmToken::At;
221
222     bool Mergeable = FlagsStr.find('M') != StringRef::npos;
223     bool Group = FlagsStr.find('G') != StringRef::npos;
224
225     if (getLexer().isNot(AsmToken::Comma)) {
226       if (Mergeable)
227         return TokError("Mergeable section must specify the type");
228       if (Group)
229         return TokError("Group section must specify the type");
230     } else {
231       Lex();
232       if (getLexer().isNot(TypeStartToken))
233         return TokError("expected the type");
234
235       Lex();
236       if (getParser().ParseIdentifier(TypeName))
237         return TokError("expected identifier in directive");
238
239       if (Mergeable) {
240         if (getLexer().isNot(AsmToken::Comma))
241           return TokError("expected the entry size");
242         Lex();
243         if (getParser().ParseAbsoluteExpression(Size))
244           return true;
245         if (Size <= 0)
246           return TokError("entry size must be positive");
247       }
248
249       if (Group) {
250         if (getLexer().isNot(AsmToken::Comma))
251           return TokError("expected group name");
252         Lex();
253         if (getParser().ParseIdentifier(GroupName))
254           return true;
255         if (getLexer().is(AsmToken::Comma)) {
256           Lex();
257           StringRef Linkage;
258           if (getParser().ParseIdentifier(Linkage))
259             return true;
260           if (Linkage != "comdat")
261             return TokError("Linkage must be 'comdat'");
262         }
263       }
264     }
265   }
266
267   if (getLexer().isNot(AsmToken::EndOfStatement))
268     return TokError("unexpected token in directive");
269
270   unsigned Flags = 0;
271   unsigned Type = MCSectionELF::SHT_NULL;
272
273   // Set the defaults first.
274   if (SectionName == ".fini" || SectionName == ".init" || SectionName == ".rodata") {
275     Type = MCSectionELF::SHT_PROGBITS;
276     Flags |= MCSectionELF::SHF_ALLOC;
277   }
278   if (SectionName == ".fini" || SectionName == ".init") {
279     Flags |= MCSectionELF::SHF_EXECINSTR;
280   }
281
282   for (unsigned i = 0; i < FlagsStr.size(); i++) {
283     switch (FlagsStr[i]) {
284     case 'a':
285       Flags |= MCSectionELF::SHF_ALLOC;
286       break;
287     case 'x':
288       Flags |= MCSectionELF::SHF_EXECINSTR;
289       break;
290     case 'w':
291       Flags |= MCSectionELF::SHF_WRITE;
292       break;
293     case 'M':
294       Flags |= MCSectionELF::SHF_MERGE;
295       break;
296     case 'S':
297       Flags |= MCSectionELF::SHF_STRINGS;
298       break;
299     case 'T':
300       Flags |= MCSectionELF::SHF_TLS;
301       break;
302     case 'c':
303       Flags |= MCSectionELF::XCORE_SHF_CP_SECTION;
304       break;
305     case 'd':
306       Flags |= MCSectionELF::XCORE_SHF_DP_SECTION;
307       break;
308     case 'G':
309       Flags |= MCSectionELF::SHF_GROUP;
310       break;
311     default:
312       return TokError("unknown flag");
313     }
314   }
315
316   if (!TypeName.empty()) {
317     if (TypeName == "init_array")
318       Type = MCSectionELF::SHT_INIT_ARRAY;
319     else if (TypeName == "fini_array")
320       Type = MCSectionELF::SHT_FINI_ARRAY;
321     else if (TypeName == "preinit_array")
322       Type = MCSectionELF::SHT_PREINIT_ARRAY;
323     else if (TypeName == "nobits")
324       Type = MCSectionELF::SHT_NOBITS;
325     else if (TypeName == "progbits")
326       Type = MCSectionELF::SHT_PROGBITS;
327     else
328       return TokError("unknown section type");
329   }
330
331   SectionKind Kind = (Flags & MCSectionELF::SHF_EXECINSTR)
332                      ? SectionKind::getText()
333                      : SectionKind::getDataRel();
334   getStreamer().SwitchSection(getContext().getELFSection(SectionName, Type,
335                                                          Flags, Kind, Size,
336                                                          GroupName));
337   return false;
338 }
339
340 bool ELFAsmParser::ParseDirectivePrevious(StringRef DirName, SMLoc) {
341   const MCSection *PreviousSection = getStreamer().getPreviousSection();
342   if (PreviousSection != NULL)
343     getStreamer().SwitchSection(PreviousSection);
344
345   return false;
346 }
347
348 /// ParseDirectiveELFType
349 ///  ::= .type identifier , @attribute
350 bool ELFAsmParser::ParseDirectiveType(StringRef, SMLoc) {
351   StringRef Name;
352   if (getParser().ParseIdentifier(Name))
353     return TokError("expected identifier in directive");
354
355   // Handle the identifier as the key symbol.
356   MCSymbol *Sym = getContext().GetOrCreateSymbol(Name);
357
358   if (getLexer().isNot(AsmToken::Comma))
359     return TokError("unexpected token in '.type' directive");
360   Lex();
361
362   if (getLexer().isNot(AsmToken::At))
363     return TokError("expected '@' before type");
364   Lex();
365
366   StringRef Type;
367   SMLoc TypeLoc;
368
369   TypeLoc = getLexer().getLoc();
370   if (getParser().ParseIdentifier(Type))
371     return TokError("expected symbol type in directive");
372
373   MCSymbolAttr Attr = StringSwitch<MCSymbolAttr>(Type)
374     .Case("function", MCSA_ELF_TypeFunction)
375     .Case("object", MCSA_ELF_TypeObject)
376     .Case("tls_object", MCSA_ELF_TypeTLS)
377     .Case("common", MCSA_ELF_TypeCommon)
378     .Case("notype", MCSA_ELF_TypeNoType)
379     .Default(MCSA_Invalid);
380
381   if (Attr == MCSA_Invalid)
382     return Error(TypeLoc, "unsupported attribute in '.type' directive");
383
384   if (getLexer().isNot(AsmToken::EndOfStatement))
385     return TokError("unexpected token in '.type' directive");
386
387   Lex();
388
389   getStreamer().EmitSymbolAttribute(Sym, Attr);
390
391   return false;
392 }
393
394 /// ParseDirectiveIdent
395 ///  ::= .ident string
396 bool ELFAsmParser::ParseDirectiveIdent(StringRef, SMLoc) {
397   if (getLexer().isNot(AsmToken::String))
398     return TokError("unexpected token in '.ident' directive");
399
400   StringRef Data = getTok().getIdentifier();
401
402   Lex();
403
404   const MCSection *OldSection = getStreamer().getCurrentSection();
405   const MCSection *Comment =
406     getContext().getELFSection(".comment", MCSectionELF::SHT_PROGBITS,
407                                MCSectionELF::SHF_MERGE |
408                                MCSectionELF::SHF_STRINGS,
409                                SectionKind::getReadOnly(),
410                                1, "");
411
412   static bool First = true;
413
414   getStreamer().SwitchSection(Comment);
415   if (First)
416     getStreamer().EmitIntValue(0, 1);
417   First = false;
418   getStreamer().EmitBytes(Data, 0);
419   getStreamer().EmitIntValue(0, 1);
420   getStreamer().SwitchSection(OldSection);
421   return false;
422 }
423
424 /// ParseDirectiveSymver
425 ///  ::= .symver foo, bar2@zed
426 bool ELFAsmParser::ParseDirectiveSymver(StringRef, SMLoc) {
427   StringRef Name;
428   if (getParser().ParseIdentifier(Name))
429     return TokError("expected identifier in directive");
430
431   if (getLexer().isNot(AsmToken::Comma))
432     return TokError("expected a comma");
433
434   Lex();
435
436   StringRef AliasName;
437   if (getParser().ParseIdentifier(AliasName))
438     return TokError("expected identifier in directive");
439
440   if (AliasName.find('@') == StringRef::npos)
441     return TokError("expected a '@' in the name");
442
443   MCSymbol *Alias = getContext().GetOrCreateSymbol(AliasName);
444   MCSymbol *Sym = getContext().GetOrCreateSymbol(Name);
445   const MCExpr *Value = MCSymbolRefExpr::Create(Sym, getContext());
446
447   getStreamer().EmitAssignment(Alias, Value);
448   return false;
449 }
450
451 /// ParseDirectiveWeakref
452 ///  ::= .weakref foo, bar
453 bool ELFAsmParser::ParseDirectiveWeakref(StringRef, SMLoc) {
454   // FIXME: Share code with the other alias building directives.
455
456   StringRef AliasName;
457   if (getParser().ParseIdentifier(AliasName))
458     return TokError("expected identifier in directive");
459
460   if (getLexer().isNot(AsmToken::Comma))
461     return TokError("expected a comma");
462
463   Lex();
464
465   StringRef Name;
466   if (getParser().ParseIdentifier(Name))
467     return TokError("expected identifier in directive");
468
469   MCSymbol *Alias = getContext().GetOrCreateSymbol(AliasName);
470
471   MCSymbol *Sym = getContext().GetOrCreateSymbol(Name);
472
473   getStreamer().EmitWeakReference(Alias, Sym);
474   return false;
475 }
476
477 namespace llvm {
478
479 MCAsmParserExtension *createELFAsmParser() {
480   return new ELFAsmParser;
481 }
482
483 }