Try to resolve symbol differences early, and if successful create a plain
[oota-llvm.git] / lib / MC / MCExpr.cpp
1 //===- MCExpr.cpp - Assembly Level Expression Implementation --------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 #define DEBUG_TYPE "mcexpr"
11 #include "llvm/MC/MCExpr.h"
12 #include "llvm/ADT/Statistic.h"
13 #include "llvm/ADT/StringSwitch.h"
14 #include "llvm/MC/MCAsmLayout.h"
15 #include "llvm/MC/MCAssembler.h"
16 #include "llvm/MC/MCContext.h"
17 #include "llvm/MC/MCObjectFormat.h"
18 #include "llvm/MC/MCSymbol.h"
19 #include "llvm/MC/MCValue.h"
20 #include "llvm/Support/Debug.h"
21 #include "llvm/Support/raw_ostream.h"
22 #include "llvm/Target/TargetAsmBackend.h"
23 using namespace llvm;
24
25 namespace {
26 namespace stats {
27 STATISTIC(MCExprEvaluate, "Number of MCExpr evaluations");
28 }
29 }
30
31 void MCExpr::print(raw_ostream &OS) const {
32   switch (getKind()) {
33   case MCExpr::Target:
34     return cast<MCTargetExpr>(this)->PrintImpl(OS);
35   case MCExpr::Constant:
36     OS << cast<MCConstantExpr>(*this).getValue();
37     return;
38
39   case MCExpr::SymbolRef: {
40     const MCSymbolRefExpr &SRE = cast<MCSymbolRefExpr>(*this);
41     const MCSymbol &Sym = SRE.getSymbol();
42     // Parenthesize names that start with $ so that they don't look like
43     // absolute names.
44     bool UseParens = Sym.getName()[0] == '$';
45
46     if (SRE.getKind() == MCSymbolRefExpr::VK_ARM_HI16 ||
47         SRE.getKind() == MCSymbolRefExpr::VK_ARM_LO16)
48       OS << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
49
50     if (SRE.getKind() == MCSymbolRefExpr::VK_PPC_HA16 ||
51         SRE.getKind() == MCSymbolRefExpr::VK_PPC_LO16) {
52       OS << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
53       UseParens = true;
54     }
55
56     if (UseParens)
57       OS << '(' << Sym << ')';
58     else
59       OS << Sym;
60
61     if (SRE.getKind() == MCSymbolRefExpr::VK_ARM_PLT ||
62         SRE.getKind() == MCSymbolRefExpr::VK_ARM_TLSGD ||
63         SRE.getKind() == MCSymbolRefExpr::VK_ARM_GOT ||
64         SRE.getKind() == MCSymbolRefExpr::VK_ARM_GOTOFF ||
65         SRE.getKind() == MCSymbolRefExpr::VK_ARM_TPOFF ||
66         SRE.getKind() == MCSymbolRefExpr::VK_ARM_GOTTPOFF)
67       OS << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
68     else if (SRE.getKind() != MCSymbolRefExpr::VK_None &&
69              SRE.getKind() != MCSymbolRefExpr::VK_ARM_HI16 &&
70              SRE.getKind() != MCSymbolRefExpr::VK_ARM_LO16 &&
71              SRE.getKind() != MCSymbolRefExpr::VK_PPC_HA16 &&
72              SRE.getKind() != MCSymbolRefExpr::VK_PPC_LO16)
73       OS << '@' << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
74
75     return;
76   }
77
78   case MCExpr::Unary: {
79     const MCUnaryExpr &UE = cast<MCUnaryExpr>(*this);
80     switch (UE.getOpcode()) {
81     default: assert(0 && "Invalid opcode!");
82     case MCUnaryExpr::LNot:  OS << '!'; break;
83     case MCUnaryExpr::Minus: OS << '-'; break;
84     case MCUnaryExpr::Not:   OS << '~'; break;
85     case MCUnaryExpr::Plus:  OS << '+'; break;
86     }
87     OS << *UE.getSubExpr();
88     return;
89   }
90
91   case MCExpr::Binary: {
92     const MCBinaryExpr &BE = cast<MCBinaryExpr>(*this);
93
94     // Only print parens around the LHS if it is non-trivial.
95     if (isa<MCConstantExpr>(BE.getLHS()) || isa<MCSymbolRefExpr>(BE.getLHS())) {
96       OS << *BE.getLHS();
97     } else {
98       OS << '(' << *BE.getLHS() << ')';
99     }
100
101     switch (BE.getOpcode()) {
102     default: assert(0 && "Invalid opcode!");
103     case MCBinaryExpr::Add:
104       // Print "X-42" instead of "X+-42".
105       if (const MCConstantExpr *RHSC = dyn_cast<MCConstantExpr>(BE.getRHS())) {
106         if (RHSC->getValue() < 0) {
107           OS << RHSC->getValue();
108           return;
109         }
110       }
111
112       OS <<  '+';
113       break;
114     case MCBinaryExpr::And:  OS <<  '&'; break;
115     case MCBinaryExpr::Div:  OS <<  '/'; break;
116     case MCBinaryExpr::EQ:   OS << "=="; break;
117     case MCBinaryExpr::GT:   OS <<  '>'; break;
118     case MCBinaryExpr::GTE:  OS << ">="; break;
119     case MCBinaryExpr::LAnd: OS << "&&"; break;
120     case MCBinaryExpr::LOr:  OS << "||"; break;
121     case MCBinaryExpr::LT:   OS <<  '<'; break;
122     case MCBinaryExpr::LTE:  OS << "<="; break;
123     case MCBinaryExpr::Mod:  OS <<  '%'; break;
124     case MCBinaryExpr::Mul:  OS <<  '*'; break;
125     case MCBinaryExpr::NE:   OS << "!="; break;
126     case MCBinaryExpr::Or:   OS <<  '|'; break;
127     case MCBinaryExpr::Shl:  OS << "<<"; break;
128     case MCBinaryExpr::Shr:  OS << ">>"; break;
129     case MCBinaryExpr::Sub:  OS <<  '-'; break;
130     case MCBinaryExpr::Xor:  OS <<  '^'; break;
131     }
132
133     // Only print parens around the LHS if it is non-trivial.
134     if (isa<MCConstantExpr>(BE.getRHS()) || isa<MCSymbolRefExpr>(BE.getRHS())) {
135       OS << *BE.getRHS();
136     } else {
137       OS << '(' << *BE.getRHS() << ')';
138     }
139     return;
140   }
141   }
142
143   assert(0 && "Invalid expression kind!");
144 }
145
146 void MCExpr::dump() const {
147   print(dbgs());
148   dbgs() << '\n';
149 }
150
151 /* *** */
152
153 const MCBinaryExpr *MCBinaryExpr::Create(Opcode Opc, const MCExpr *LHS,
154                                          const MCExpr *RHS, MCContext &Ctx) {
155   return new (Ctx) MCBinaryExpr(Opc, LHS, RHS);
156 }
157
158 const MCUnaryExpr *MCUnaryExpr::Create(Opcode Opc, const MCExpr *Expr,
159                                        MCContext &Ctx) {
160   return new (Ctx) MCUnaryExpr(Opc, Expr);
161 }
162
163 const MCConstantExpr *MCConstantExpr::Create(int64_t Value, MCContext &Ctx) {
164   return new (Ctx) MCConstantExpr(Value);
165 }
166
167 /* *** */
168
169 const MCSymbolRefExpr *MCSymbolRefExpr::Create(const MCSymbol *Sym,
170                                                VariantKind Kind,
171                                                MCContext &Ctx) {
172   return new (Ctx) MCSymbolRefExpr(Sym, Kind);
173 }
174
175 const MCSymbolRefExpr *MCSymbolRefExpr::Create(StringRef Name, VariantKind Kind,
176                                                MCContext &Ctx) {
177   return Create(Ctx.GetOrCreateSymbol(Name), Kind, Ctx);
178 }
179
180 StringRef MCSymbolRefExpr::getVariantKindName(VariantKind Kind) {
181   switch (Kind) {
182   default:
183   case VK_Invalid: return "<<invalid>>";
184   case VK_None: return "<<none>>";
185
186   case VK_GOT: return "GOT";
187   case VK_GOTOFF: return "GOTOFF";
188   case VK_GOTPCREL: return "GOTPCREL";
189   case VK_GOTTPOFF: return "GOTTPOFF";
190   case VK_INDNTPOFF: return "INDNTPOFF";
191   case VK_NTPOFF: return "NTPOFF";
192   case VK_GOTNTPOFF: return "GOTNTPOFF";
193   case VK_PLT: return "PLT";
194   case VK_TLSGD: return "TLSGD";
195   case VK_TLSLD: return "TLSLD";
196   case VK_TLSLDM: return "TLSLDM";
197   case VK_TPOFF: return "TPOFF";
198   case VK_DTPOFF: return "DTPOFF";
199   case VK_TLVP: return "TLVP";
200   case VK_ARM_HI16: return ":upper16:";
201   case VK_ARM_LO16: return ":lower16:";
202   case VK_ARM_PLT: return "(PLT)";
203   case VK_ARM_GOT: return "(GOT)";
204   case VK_ARM_GOTOFF: return "(GOTOFF)";
205   case VK_ARM_TPOFF: return "(tpoff)";
206   case VK_ARM_GOTTPOFF: return "(gottpoff)";
207   case VK_ARM_TLSGD: return "(tlsgd)";
208   case VK_PPC_TOC: return "toc";
209   case VK_PPC_HA16: return "ha16";
210   case VK_PPC_LO16: return "lo16";
211   }
212 }
213
214 MCSymbolRefExpr::VariantKind
215 MCSymbolRefExpr::getVariantKindForName(StringRef Name) {
216   return StringSwitch<VariantKind>(Name)
217     .Case("GOT", VK_GOT)
218     .Case("GOTOFF", VK_GOTOFF)
219     .Case("GOTPCREL", VK_GOTPCREL)
220     .Case("GOTTPOFF", VK_GOTTPOFF)
221     .Case("INDNTPOFF", VK_INDNTPOFF)
222     .Case("NTPOFF", VK_NTPOFF)
223     .Case("GOTNTPOFF", VK_GOTNTPOFF)
224     .Case("PLT", VK_PLT)
225     .Case("TLSGD", VK_TLSGD)
226     .Case("TLSLD", VK_TLSLD)
227     .Case("TLSLDM", VK_TLSLDM)
228     .Case("TPOFF", VK_TPOFF)
229     .Case("DTPOFF", VK_DTPOFF)
230     .Case("TLVP", VK_TLVP)
231     .Default(VK_Invalid);
232 }
233
234 /* *** */
235
236 void MCTargetExpr::Anchor() {}
237
238 /* *** */
239
240 bool MCExpr::EvaluateAsAbsolute(int64_t &Res) const {
241   return EvaluateAsAbsolute(Res, 0, 0);
242 }
243
244 bool MCExpr::EvaluateAsAbsolute(int64_t &Res,
245                                 const MCAsmLayout *Layout) const {
246   if (Layout)
247     return EvaluateAsAbsolute(Res, &Layout->getAssembler(), Layout);
248   else
249     return EvaluateAsAbsolute(Res, 0, 0);
250 }
251
252 bool MCExpr::EvaluateAsAbsolute(int64_t &Res, const MCAssembler *Asm) const {
253   return EvaluateAsAbsolute(Res, Asm, 0);
254 }
255
256 bool MCExpr::EvaluateAsAbsolute(int64_t &Res, const MCAssembler *Asm,
257                                 const MCAsmLayout *Layout) const {
258   MCValue Value;
259
260   // Fast path constants.
261   if (const MCConstantExpr *CE = dyn_cast<MCConstantExpr>(this)) {
262     Res = CE->getValue();
263     return true;
264   }
265
266   if (!EvaluateAsRelocatableImpl(Value, Asm, Layout, false) ||
267       !Value.isAbsolute()) {
268     // EvaluateAsAbsolute is defined to return the "current value" of
269     // the expression if we are given a Layout object, even in cases
270     // when the value is not fixed.
271     if (Layout) {
272       Res = Value.getConstant();
273       if (Value.getSymA()) {
274         Res += Layout->getSymbolAddress(
275           &Layout->getAssembler().getSymbolData(Value.getSymA()->getSymbol()));
276       }
277       if (Value.getSymB()) {
278         Res -= Layout->getSymbolAddress(
279           &Layout->getAssembler().getSymbolData(Value.getSymB()->getSymbol()));
280       }
281     }
282     return false;
283   }
284
285   Res = Value.getConstant();
286   return true;
287 }
288
289 static bool EvaluateSymbolicAdd(const MCAsmLayout *Layout,
290                                 const MCAssembler *Asm,
291                                 bool InSet,
292                                 const MCValue &LHS,const MCSymbolRefExpr *RHS_A,
293                                 const MCSymbolRefExpr *RHS_B, int64_t RHS_Cst,
294                                 MCValue &Res) {
295   // We can't add or subtract two symbols.
296   if ((LHS.getSymA() && RHS_A) ||
297       (LHS.getSymB() && RHS_B))
298     return false;
299
300   const MCSymbolRefExpr *A = LHS.getSymA() ? LHS.getSymA() : RHS_A;
301   const MCSymbolRefExpr *B = LHS.getSymB() ? LHS.getSymB() : RHS_B;
302   if (B) {
303     // If we have a negated symbol, then we must have also have a non-negated
304     // symbol in order to encode the expression. We can do this check later to
305     // permit expressions which eventually fold to a representable form -- such
306     // as (a + (0 - b)) -- if necessary.
307     if (!A)
308       return false;
309   }
310
311   // Absolutize symbol differences between defined symbols when we have a
312   // layout object and the target requests it.
313
314   assert(!(Layout && !Asm));
315
316   if ((Layout || Asm) && A && B) {
317     const MCSymbol &SA = A->getSymbol();
318     const MCSymbol &SB = B->getSymbol();
319     const MCObjectFormat &F = Asm->getBackend().getObjectFormat();
320     if (SA.isDefined() && SB.isDefined() && F.isAbsolute(InSet, SA, SB)) {
321       MCSymbolData &AD = Asm->getSymbolData(A->getSymbol());
322       MCSymbolData &BD = Asm->getSymbolData(B->getSymbol());
323
324       if (AD.getFragment() == BD.getFragment()) {
325         Res = MCValue::get(+ AD.getOffset()
326                            - BD.getOffset()
327                            + LHS.getConstant()
328                            + RHS_Cst);
329         return true;
330       }
331
332       if (Layout) {
333         Res = MCValue::get(+ Layout->getSymbolAddress(&AD)
334                            - Layout->getSymbolAddress(&BD)
335                            + LHS.getConstant()
336                            + RHS_Cst);
337         return true;
338       }
339     }
340   }
341
342   Res = MCValue::get(A, B, LHS.getConstant() + RHS_Cst);
343   return true;
344 }
345
346 bool MCExpr::EvaluateAsRelocatable(MCValue &Res,
347                                    const MCAsmLayout *Layout) const {
348   if (Layout)
349     return EvaluateAsRelocatableImpl(Res, &Layout->getAssembler(), Layout,
350                                      false);
351   else
352     return EvaluateAsRelocatableImpl(Res, 0, 0, false);
353 }
354
355 bool MCExpr::EvaluateAsRelocatableImpl(MCValue &Res,
356                                        const MCAssembler *Asm,
357                                        const MCAsmLayout *Layout,
358                                        bool InSet) const {
359   ++stats::MCExprEvaluate;
360
361   switch (getKind()) {
362   case Target:
363     return cast<MCTargetExpr>(this)->EvaluateAsRelocatableImpl(Res, Layout);
364
365   case Constant:
366     Res = MCValue::get(cast<MCConstantExpr>(this)->getValue());
367     return true;
368
369   case SymbolRef: {
370     const MCSymbolRefExpr *SRE = cast<MCSymbolRefExpr>(this);
371     const MCSymbol &Sym = SRE->getSymbol();
372
373     // Evaluate recursively if this is a variable.
374     if (Sym.isVariable() && SRE->getKind() == MCSymbolRefExpr::VK_None) {
375       bool Ret = Sym.getVariableValue()->EvaluateAsRelocatableImpl(Res, Asm,
376                                                                    Layout,
377                                                                    true);
378       // If we failed to simplify this to a constant, let the target
379       // handle it.
380       if (Ret && !Res.getSymA() && !Res.getSymB())
381         return true;
382     }
383
384     Res = MCValue::get(SRE, 0, 0);
385     return true;
386   }
387
388   case Unary: {
389     const MCUnaryExpr *AUE = cast<MCUnaryExpr>(this);
390     MCValue Value;
391
392     if (!AUE->getSubExpr()->EvaluateAsRelocatableImpl(Value, Asm, Layout,
393                                                       InSet))
394       return false;
395
396     switch (AUE->getOpcode()) {
397     case MCUnaryExpr::LNot:
398       if (!Value.isAbsolute())
399         return false;
400       Res = MCValue::get(!Value.getConstant());
401       break;
402     case MCUnaryExpr::Minus:
403       /// -(a - b + const) ==> (b - a - const)
404       if (Value.getSymA() && !Value.getSymB())
405         return false;
406       Res = MCValue::get(Value.getSymB(), Value.getSymA(),
407                          -Value.getConstant());
408       break;
409     case MCUnaryExpr::Not:
410       if (!Value.isAbsolute())
411         return false;
412       Res = MCValue::get(~Value.getConstant());
413       break;
414     case MCUnaryExpr::Plus:
415       Res = Value;
416       break;
417     }
418
419     return true;
420   }
421
422   case Binary: {
423     const MCBinaryExpr *ABE = cast<MCBinaryExpr>(this);
424     MCValue LHSValue, RHSValue;
425
426     if (!ABE->getLHS()->EvaluateAsRelocatableImpl(LHSValue, Asm, Layout,
427                                                   InSet) ||
428         !ABE->getRHS()->EvaluateAsRelocatableImpl(RHSValue, Asm, Layout,
429                                                   InSet))
430       return false;
431
432     // We only support a few operations on non-constant expressions, handle
433     // those first.
434     if (!LHSValue.isAbsolute() || !RHSValue.isAbsolute()) {
435       switch (ABE->getOpcode()) {
436       default:
437         return false;
438       case MCBinaryExpr::Sub:
439         // Negate RHS and add.
440         return EvaluateSymbolicAdd(Layout, Asm, InSet, LHSValue,
441                                    RHSValue.getSymB(), RHSValue.getSymA(),
442                                    -RHSValue.getConstant(),
443                                    Res);
444
445       case MCBinaryExpr::Add:
446         return EvaluateSymbolicAdd(Layout, Asm, InSet, LHSValue,
447                                    RHSValue.getSymA(), RHSValue.getSymB(),
448                                    RHSValue.getConstant(),
449                                    Res);
450       }
451     }
452
453     // FIXME: We need target hooks for the evaluation. It may be limited in
454     // width, and gas defines the result of comparisons and right shifts
455     // differently from Apple as.
456     int64_t LHS = LHSValue.getConstant(), RHS = RHSValue.getConstant();
457     int64_t Result = 0;
458     switch (ABE->getOpcode()) {
459     case MCBinaryExpr::Add:  Result = LHS + RHS; break;
460     case MCBinaryExpr::And:  Result = LHS & RHS; break;
461     case MCBinaryExpr::Div:  Result = LHS / RHS; break;
462     case MCBinaryExpr::EQ:   Result = LHS == RHS; break;
463     case MCBinaryExpr::GT:   Result = LHS > RHS; break;
464     case MCBinaryExpr::GTE:  Result = LHS >= RHS; break;
465     case MCBinaryExpr::LAnd: Result = LHS && RHS; break;
466     case MCBinaryExpr::LOr:  Result = LHS || RHS; break;
467     case MCBinaryExpr::LT:   Result = LHS < RHS; break;
468     case MCBinaryExpr::LTE:  Result = LHS <= RHS; break;
469     case MCBinaryExpr::Mod:  Result = LHS % RHS; break;
470     case MCBinaryExpr::Mul:  Result = LHS * RHS; break;
471     case MCBinaryExpr::NE:   Result = LHS != RHS; break;
472     case MCBinaryExpr::Or:   Result = LHS | RHS; break;
473     case MCBinaryExpr::Shl:  Result = LHS << RHS; break;
474     case MCBinaryExpr::Shr:  Result = LHS >> RHS; break;
475     case MCBinaryExpr::Sub:  Result = LHS - RHS; break;
476     case MCBinaryExpr::Xor:  Result = LHS ^ RHS; break;
477     }
478
479     Res = MCValue::get(Result);
480     return true;
481   }
482   }
483
484   assert(0 && "Invalid assembly expression kind!");
485   return false;
486 }