MC/Expr: Simplify.
[oota-llvm.git] / lib / MC / MCExpr.cpp
1 //===- MCExpr.cpp - Assembly Level Expression Implementation --------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 #define DEBUG_TYPE "mcexpr"
11 #include "llvm/MC/MCExpr.h"
12 #include "llvm/ADT/Statistic.h"
13 #include "llvm/ADT/StringSwitch.h"
14 #include "llvm/MC/MCAsmLayout.h"
15 #include "llvm/MC/MCAssembler.h"
16 #include "llvm/MC/MCContext.h"
17 #include "llvm/MC/MCObjectFormat.h"
18 #include "llvm/MC/MCSymbol.h"
19 #include "llvm/MC/MCValue.h"
20 #include "llvm/Support/Debug.h"
21 #include "llvm/Support/raw_ostream.h"
22 #include "llvm/Target/TargetAsmBackend.h"
23 using namespace llvm;
24
25 namespace {
26 namespace stats {
27 STATISTIC(MCExprEvaluate, "Number of MCExpr evaluations");
28 }
29 }
30
31 void MCExpr::print(raw_ostream &OS) const {
32   switch (getKind()) {
33   case MCExpr::Target:
34     return cast<MCTargetExpr>(this)->PrintImpl(OS);
35   case MCExpr::Constant:
36     OS << cast<MCConstantExpr>(*this).getValue();
37     return;
38
39   case MCExpr::SymbolRef: {
40     const MCSymbolRefExpr &SRE = cast<MCSymbolRefExpr>(*this);
41     const MCSymbol &Sym = SRE.getSymbol();
42     // Parenthesize names that start with $ so that they don't look like
43     // absolute names.
44     bool UseParens = Sym.getName()[0] == '$';
45
46     if (SRE.getKind() == MCSymbolRefExpr::VK_ARM_HI16 ||
47         SRE.getKind() == MCSymbolRefExpr::VK_ARM_LO16)
48       OS << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
49
50     if (SRE.getKind() == MCSymbolRefExpr::VK_PPC_HA16 ||
51         SRE.getKind() == MCSymbolRefExpr::VK_PPC_LO16) {
52       OS << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
53       UseParens = true;
54     }
55
56     if (UseParens)
57       OS << '(' << Sym << ')';
58     else
59       OS << Sym;
60
61     if (SRE.getKind() == MCSymbolRefExpr::VK_ARM_PLT ||
62         SRE.getKind() == MCSymbolRefExpr::VK_ARM_TLSGD ||
63         SRE.getKind() == MCSymbolRefExpr::VK_ARM_GOT ||
64         SRE.getKind() == MCSymbolRefExpr::VK_ARM_GOTOFF ||
65         SRE.getKind() == MCSymbolRefExpr::VK_ARM_TPOFF ||
66         SRE.getKind() == MCSymbolRefExpr::VK_ARM_GOTTPOFF)
67       OS << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
68     else if (SRE.getKind() != MCSymbolRefExpr::VK_None &&
69              SRE.getKind() != MCSymbolRefExpr::VK_ARM_HI16 &&
70              SRE.getKind() != MCSymbolRefExpr::VK_ARM_LO16 &&
71              SRE.getKind() != MCSymbolRefExpr::VK_PPC_HA16 &&
72              SRE.getKind() != MCSymbolRefExpr::VK_PPC_LO16)
73       OS << '@' << MCSymbolRefExpr::getVariantKindName(SRE.getKind());
74
75     return;
76   }
77
78   case MCExpr::Unary: {
79     const MCUnaryExpr &UE = cast<MCUnaryExpr>(*this);
80     switch (UE.getOpcode()) {
81     default: assert(0 && "Invalid opcode!");
82     case MCUnaryExpr::LNot:  OS << '!'; break;
83     case MCUnaryExpr::Minus: OS << '-'; break;
84     case MCUnaryExpr::Not:   OS << '~'; break;
85     case MCUnaryExpr::Plus:  OS << '+'; break;
86     }
87     OS << *UE.getSubExpr();
88     return;
89   }
90
91   case MCExpr::Binary: {
92     const MCBinaryExpr &BE = cast<MCBinaryExpr>(*this);
93
94     // Only print parens around the LHS if it is non-trivial.
95     if (isa<MCConstantExpr>(BE.getLHS()) || isa<MCSymbolRefExpr>(BE.getLHS())) {
96       OS << *BE.getLHS();
97     } else {
98       OS << '(' << *BE.getLHS() << ')';
99     }
100
101     switch (BE.getOpcode()) {
102     default: assert(0 && "Invalid opcode!");
103     case MCBinaryExpr::Add:
104       // Print "X-42" instead of "X+-42".
105       if (const MCConstantExpr *RHSC = dyn_cast<MCConstantExpr>(BE.getRHS())) {
106         if (RHSC->getValue() < 0) {
107           OS << RHSC->getValue();
108           return;
109         }
110       }
111
112       OS <<  '+';
113       break;
114     case MCBinaryExpr::And:  OS <<  '&'; break;
115     case MCBinaryExpr::Div:  OS <<  '/'; break;
116     case MCBinaryExpr::EQ:   OS << "=="; break;
117     case MCBinaryExpr::GT:   OS <<  '>'; break;
118     case MCBinaryExpr::GTE:  OS << ">="; break;
119     case MCBinaryExpr::LAnd: OS << "&&"; break;
120     case MCBinaryExpr::LOr:  OS << "||"; break;
121     case MCBinaryExpr::LT:   OS <<  '<'; break;
122     case MCBinaryExpr::LTE:  OS << "<="; break;
123     case MCBinaryExpr::Mod:  OS <<  '%'; break;
124     case MCBinaryExpr::Mul:  OS <<  '*'; break;
125     case MCBinaryExpr::NE:   OS << "!="; break;
126     case MCBinaryExpr::Or:   OS <<  '|'; break;
127     case MCBinaryExpr::Shl:  OS << "<<"; break;
128     case MCBinaryExpr::Shr:  OS << ">>"; break;
129     case MCBinaryExpr::Sub:  OS <<  '-'; break;
130     case MCBinaryExpr::Xor:  OS <<  '^'; break;
131     }
132
133     // Only print parens around the LHS if it is non-trivial.
134     if (isa<MCConstantExpr>(BE.getRHS()) || isa<MCSymbolRefExpr>(BE.getRHS())) {
135       OS << *BE.getRHS();
136     } else {
137       OS << '(' << *BE.getRHS() << ')';
138     }
139     return;
140   }
141   }
142
143   assert(0 && "Invalid expression kind!");
144 }
145
146 void MCExpr::dump() const {
147   print(dbgs());
148   dbgs() << '\n';
149 }
150
151 /* *** */
152
153 const MCBinaryExpr *MCBinaryExpr::Create(Opcode Opc, const MCExpr *LHS,
154                                          const MCExpr *RHS, MCContext &Ctx) {
155   return new (Ctx) MCBinaryExpr(Opc, LHS, RHS);
156 }
157
158 const MCUnaryExpr *MCUnaryExpr::Create(Opcode Opc, const MCExpr *Expr,
159                                        MCContext &Ctx) {
160   return new (Ctx) MCUnaryExpr(Opc, Expr);
161 }
162
163 const MCConstantExpr *MCConstantExpr::Create(int64_t Value, MCContext &Ctx) {
164   return new (Ctx) MCConstantExpr(Value);
165 }
166
167 /* *** */
168
169 const MCSymbolRefExpr *MCSymbolRefExpr::Create(const MCSymbol *Sym,
170                                                VariantKind Kind,
171                                                MCContext &Ctx) {
172   return new (Ctx) MCSymbolRefExpr(Sym, Kind);
173 }
174
175 const MCSymbolRefExpr *MCSymbolRefExpr::Create(StringRef Name, VariantKind Kind,
176                                                MCContext &Ctx) {
177   return Create(Ctx.GetOrCreateSymbol(Name), Kind, Ctx);
178 }
179
180 StringRef MCSymbolRefExpr::getVariantKindName(VariantKind Kind) {
181   switch (Kind) {
182   default:
183   case VK_Invalid: return "<<invalid>>";
184   case VK_None: return "<<none>>";
185
186   case VK_GOT: return "GOT";
187   case VK_GOTOFF: return "GOTOFF";
188   case VK_GOTPCREL: return "GOTPCREL";
189   case VK_GOTTPOFF: return "GOTTPOFF";
190   case VK_INDNTPOFF: return "INDNTPOFF";
191   case VK_NTPOFF: return "NTPOFF";
192   case VK_GOTNTPOFF: return "GOTNTPOFF";
193   case VK_PLT: return "PLT";
194   case VK_TLSGD: return "TLSGD";
195   case VK_TLSLD: return "TLSLD";
196   case VK_TLSLDM: return "TLSLDM";
197   case VK_TPOFF: return "TPOFF";
198   case VK_DTPOFF: return "DTPOFF";
199   case VK_TLVP: return "TLVP";
200   case VK_ARM_HI16: return ":upper16:";
201   case VK_ARM_LO16: return ":lower16:";
202   case VK_ARM_PLT: return "(PLT)";
203   case VK_ARM_GOT: return "(GOT)";
204   case VK_ARM_GOTOFF: return "(GOTOFF)";
205   case VK_ARM_TPOFF: return "(tpoff)";
206   case VK_ARM_GOTTPOFF: return "(gottpoff)";
207   case VK_ARM_TLSGD: return "(tlsgd)";
208   case VK_PPC_TOC: return "toc";
209   case VK_PPC_HA16: return "ha16";
210   case VK_PPC_LO16: return "lo16";
211   }
212 }
213
214 MCSymbolRefExpr::VariantKind
215 MCSymbolRefExpr::getVariantKindForName(StringRef Name) {
216   return StringSwitch<VariantKind>(Name)
217     .Case("GOT", VK_GOT)
218     .Case("GOTOFF", VK_GOTOFF)
219     .Case("GOTPCREL", VK_GOTPCREL)
220     .Case("GOTTPOFF", VK_GOTTPOFF)
221     .Case("INDNTPOFF", VK_INDNTPOFF)
222     .Case("NTPOFF", VK_NTPOFF)
223     .Case("GOTNTPOFF", VK_GOTNTPOFF)
224     .Case("PLT", VK_PLT)
225     .Case("TLSGD", VK_TLSGD)
226     .Case("TLSLD", VK_TLSLD)
227     .Case("TLSLDM", VK_TLSLDM)
228     .Case("TPOFF", VK_TPOFF)
229     .Case("DTPOFF", VK_DTPOFF)
230     .Case("TLVP", VK_TLVP)
231     .Default(VK_Invalid);
232 }
233
234 /* *** */
235
236 void MCTargetExpr::Anchor() {}
237
238 /* *** */
239
240 bool MCExpr::EvaluateAsAbsolute(int64_t &Res, const MCAsmLayout *Layout,
241                                 const SectionAddrMap *Addrs) const {
242   MCValue Value;
243
244   // Fast path constants.
245   if (const MCConstantExpr *CE = dyn_cast<MCConstantExpr>(this)) {
246     Res = CE->getValue();
247     return true;
248   }
249
250   // FIXME: This use of Addrs is wrong, right?
251   if (!EvaluateAsRelocatableImpl(Value, Layout, Addrs, /*InSet=*/Addrs) ||
252       !Value.isAbsolute()) {
253     // EvaluateAsAbsolute is defined to return the "current value" of
254     // the expression if we are given a Layout object, even in cases
255     // when the value is not fixed.
256     if (Layout) {
257       Res = Value.getConstant();
258       if (Value.getSymA()) {
259        Res += Layout->getSymbolOffset(
260           &Layout->getAssembler().getSymbolData(Value.getSymA()->getSymbol()));
261       }
262       if (Value.getSymB()) {
263        Res -= Layout->getSymbolOffset(
264           &Layout->getAssembler().getSymbolData(Value.getSymB()->getSymbol()));
265       }
266     }
267     return false;
268   }
269
270   Res = Value.getConstant();
271   return true;
272 }
273
274 /// \brief Evaluate the result of an add between (conceptually) two MCValues.
275 ///
276 /// This routine conceptually attempts to construct an MCValue:
277 ///   Result = (Result_A - Result_B + Result_Cst)
278 /// from two MCValue's LHS and RHS where
279 ///   Result = LHS + RHS
280 /// and
281 ///   Result = (LHS_A - LHS_B + LHS_Cst) + (RHS_A - RHS_B + RHS_Cst).
282 ///
283 /// This routine attempts to aggresively fold the operands such that the result
284 /// is representable in an MCValue, but may not always succeed.
285 ///
286 /// \returns True on success, false if the result is not representable in an
287 /// MCValue.
288 static bool EvaluateSymbolicAdd(const MCAsmLayout *Layout,
289                                 const SectionAddrMap *Addrs,
290                                 bool InSet,
291                                 const MCValue &LHS,const MCSymbolRefExpr *RHS_A,
292                                 const MCSymbolRefExpr *RHS_B, int64_t RHS_Cst,
293                                 MCValue &Res) {
294   // FIXME: This routine (and other evaluation parts) are *incredibly* sloppy
295   // about dealing with modifiers. This will ultimately bite us, one day.
296   const MCSymbolRefExpr *LHS_A = LHS.getSymA();
297   const MCSymbolRefExpr *LHS_B = LHS.getSymB();
298   int64_t LHS_Cst = LHS.getConstant();
299
300   // Fold the result constant immediately.
301   int64_t Result_Cst = LHS_Cst + RHS_Cst;
302
303   // We can't represent the addition or subtraction of two symbols.
304   if ((LHS_A && RHS_A) || (LHS_B && RHS_B))
305     return false;
306
307   const MCSymbolRefExpr *A = LHS_A ? LHS_A : RHS_A;
308   const MCSymbolRefExpr *B = LHS_B ? LHS_B : RHS_B;
309   if (B) {
310     // If we have a negated symbol, then we must have also have a non-negated
311     // symbol in order to encode the expression. We can do this check later to
312     // permit expressions which eventually fold to a representable form -- such
313     // as (a + (0 - b)) -- if necessary.
314     if (!A)
315       return false;
316   }
317
318   // Absolutize symbol differences between defined symbols when we have a
319   // layout object and the target requests it.
320   if (Layout && A && B) {
321     const MCAssembler &Asm = Layout->getAssembler();
322     const MCSymbol &SA = A->getSymbol();
323     const MCSymbol &SB = B->getSymbol();
324     const MCObjectFormat &F = Asm.getBackend().getObjectFormat();
325     if (SA.isDefined() && SB.isDefined() && F.isAbsolute(InSet, SA, SB)) {
326       MCSymbolData &AD = Asm.getSymbolData(A->getSymbol());
327       MCSymbolData &BD = Asm.getSymbolData(B->getSymbol());
328
329       if (AD.getFragment() == BD.getFragment()) {
330         Res = MCValue::get(+ AD.getOffset()
331                            - BD.getOffset()
332                            + Result_Cst);
333         return true;
334       }
335
336       if (Layout) {
337         const MCSectionData &SecA = *AD.getFragment()->getParent();
338         const MCSectionData &SecB = *BD.getFragment()->getParent();
339         int64_t Val = + Layout->getSymbolOffset(&AD)
340                       - Layout->getSymbolOffset(&BD)
341                       + Result_Cst;
342         if (&SecA != &SecB) {
343           if (!Addrs)
344             return false;
345           Val += Addrs->lookup(&SecA);
346           Val -= Addrs->lookup(&SecB);
347         }
348         Res = MCValue::get(Val);
349         return true;
350       }
351     }
352   }
353
354   Res = MCValue::get(A, B, Result_Cst);
355   return true;
356 }
357
358 bool MCExpr::EvaluateAsRelocatableImpl(MCValue &Res,
359                                        const MCAsmLayout *Layout,
360                                        const SectionAddrMap *Addrs,
361                                        bool InSet) const {
362   ++stats::MCExprEvaluate;
363
364   switch (getKind()) {
365   case Target:
366     return cast<MCTargetExpr>(this)->EvaluateAsRelocatableImpl(Res, Layout);
367
368   case Constant:
369     Res = MCValue::get(cast<MCConstantExpr>(this)->getValue());
370     return true;
371
372   case SymbolRef: {
373     const MCSymbolRefExpr *SRE = cast<MCSymbolRefExpr>(this);
374     const MCSymbol &Sym = SRE->getSymbol();
375
376     // Evaluate recursively if this is a variable.
377     if (Sym.isVariable() && SRE->getKind() == MCSymbolRefExpr::VK_None) {
378       bool Ret = Sym.getVariableValue()->EvaluateAsRelocatableImpl(Res, Layout,
379                                                                    Addrs, true);
380       // If we failed to simplify this to a constant, let the target
381       // handle it.
382       if (Ret && !Res.getSymA() && !Res.getSymB())
383         return true;
384     }
385
386     Res = MCValue::get(SRE, 0, 0);
387     return true;
388   }
389
390   case Unary: {
391     const MCUnaryExpr *AUE = cast<MCUnaryExpr>(this);
392     MCValue Value;
393
394     if (!AUE->getSubExpr()->EvaluateAsRelocatableImpl(Value, Layout,
395                                                       Addrs, InSet))
396       return false;
397
398     switch (AUE->getOpcode()) {
399     case MCUnaryExpr::LNot:
400       if (!Value.isAbsolute())
401         return false;
402       Res = MCValue::get(!Value.getConstant());
403       break;
404     case MCUnaryExpr::Minus:
405       /// -(a - b + const) ==> (b - a - const)
406       if (Value.getSymA() && !Value.getSymB())
407         return false;
408       Res = MCValue::get(Value.getSymB(), Value.getSymA(),
409                          -Value.getConstant());
410       break;
411     case MCUnaryExpr::Not:
412       if (!Value.isAbsolute())
413         return false;
414       Res = MCValue::get(~Value.getConstant());
415       break;
416     case MCUnaryExpr::Plus:
417       Res = Value;
418       break;
419     }
420
421     return true;
422   }
423
424   case Binary: {
425     const MCBinaryExpr *ABE = cast<MCBinaryExpr>(this);
426     MCValue LHSValue, RHSValue;
427
428     if (!ABE->getLHS()->EvaluateAsRelocatableImpl(LHSValue, Layout,
429                                                   Addrs, InSet) ||
430         !ABE->getRHS()->EvaluateAsRelocatableImpl(RHSValue, Layout,
431                                                   Addrs, InSet))
432       return false;
433
434     // We only support a few operations on non-constant expressions, handle
435     // those first.
436     if (!LHSValue.isAbsolute() || !RHSValue.isAbsolute()) {
437       switch (ABE->getOpcode()) {
438       default:
439         return false;
440       case MCBinaryExpr::Sub:
441         // Negate RHS and add.
442         return EvaluateSymbolicAdd(Layout, Addrs, InSet, LHSValue,
443                                    RHSValue.getSymB(), RHSValue.getSymA(),
444                                    -RHSValue.getConstant(),
445                                    Res);
446
447       case MCBinaryExpr::Add:
448         return EvaluateSymbolicAdd(Layout, Addrs, InSet, LHSValue,
449                                    RHSValue.getSymA(), RHSValue.getSymB(),
450                                    RHSValue.getConstant(),
451                                    Res);
452       }
453     }
454
455     // FIXME: We need target hooks for the evaluation. It may be limited in
456     // width, and gas defines the result of comparisons and right shifts
457     // differently from Apple as.
458     int64_t LHS = LHSValue.getConstant(), RHS = RHSValue.getConstant();
459     int64_t Result = 0;
460     switch (ABE->getOpcode()) {
461     case MCBinaryExpr::Add:  Result = LHS + RHS; break;
462     case MCBinaryExpr::And:  Result = LHS & RHS; break;
463     case MCBinaryExpr::Div:  Result = LHS / RHS; break;
464     case MCBinaryExpr::EQ:   Result = LHS == RHS; break;
465     case MCBinaryExpr::GT:   Result = LHS > RHS; break;
466     case MCBinaryExpr::GTE:  Result = LHS >= RHS; break;
467     case MCBinaryExpr::LAnd: Result = LHS && RHS; break;
468     case MCBinaryExpr::LOr:  Result = LHS || RHS; break;
469     case MCBinaryExpr::LT:   Result = LHS < RHS; break;
470     case MCBinaryExpr::LTE:  Result = LHS <= RHS; break;
471     case MCBinaryExpr::Mod:  Result = LHS % RHS; break;
472     case MCBinaryExpr::Mul:  Result = LHS * RHS; break;
473     case MCBinaryExpr::NE:   Result = LHS != RHS; break;
474     case MCBinaryExpr::Or:   Result = LHS | RHS; break;
475     case MCBinaryExpr::Shl:  Result = LHS << RHS; break;
476     case MCBinaryExpr::Shr:  Result = LHS >> RHS; break;
477     case MCBinaryExpr::Sub:  Result = LHS - RHS; break;
478     case MCBinaryExpr::Xor:  Result = LHS ^ RHS; break;
479     }
480
481     Res = MCValue::get(Result);
482     return true;
483   }
484   }
485
486   assert(0 && "Invalid assembly expression kind!");
487   return false;
488 }