Layout helper function.
[oota-llvm.git] / lib / MC / MCAssembler.cpp
1 //===- lib/MC/MCAssembler.cpp - Assembler Backend Implementation ----------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 #define DEBUG_TYPE "assembler"
11 #include "llvm/MC/MCAssembler.h"
12 #include "llvm/MC/MCAsmLayout.h"
13 #include "llvm/MC/MCCodeEmitter.h"
14 #include "llvm/MC/MCExpr.h"
15 #include "llvm/MC/MCObjectWriter.h"
16 #include "llvm/MC/MCSymbol.h"
17 #include "llvm/MC/MCValue.h"
18 #include "llvm/ADT/OwningPtr.h"
19 #include "llvm/ADT/Statistic.h"
20 #include "llvm/ADT/StringExtras.h"
21 #include "llvm/ADT/Twine.h"
22 #include "llvm/Support/Debug.h"
23 #include "llvm/Support/ErrorHandling.h"
24 #include "llvm/Support/raw_ostream.h"
25 #include "llvm/Target/TargetRegistry.h"
26 #include "llvm/Target/TargetAsmBackend.h"
27
28 #include <vector>
29 using namespace llvm;
30
31 namespace {
32 namespace stats {
33 STATISTIC(EmittedFragments, "Number of emitted assembler fragments");
34 STATISTIC(EvaluateFixup, "Number of evaluated fixups");
35 STATISTIC(FragmentLayouts, "Number of fragment layouts");
36 STATISTIC(ObjectBytes, "Number of emitted object file bytes");
37 STATISTIC(RelaxationSteps, "Number of assembler layout and relaxation steps");
38 STATISTIC(RelaxedInstructions, "Number of relaxed instructions");
39 STATISTIC(SectionLayouts, "Number of section layouts");
40 }
41 }
42
43 // FIXME FIXME FIXME: There are number of places in this file where we convert
44 // what is a 64-bit assembler value used for computation into a value in the
45 // object file, which may truncate it. We should detect that truncation where
46 // invalid and report errors back.
47
48 /* *** */
49
50 MCAsmLayout::MCAsmLayout(MCAssembler &Asm)
51   : Assembler(Asm), LastValidFragment(0)
52  {
53   // Compute the section layout order. Virtual sections must go last.
54   for (MCAssembler::iterator it = Asm.begin(), ie = Asm.end(); it != ie; ++it)
55     if (!Asm.getBackend().isVirtualSection(it->getSection()))
56       SectionOrder.push_back(&*it);
57   for (MCAssembler::iterator it = Asm.begin(), ie = Asm.end(); it != ie; ++it)
58     if (Asm.getBackend().isVirtualSection(it->getSection()))
59       SectionOrder.push_back(&*it);
60 }
61
62 bool MCAsmLayout::isSectionUpToDate(const MCSectionData *SD) const {
63   // The first section is always up-to-date.
64   unsigned Index = SD->getLayoutOrder();
65   if (!Index)
66     return true;
67
68   // Otherwise, sections are always implicitly computed when the preceeding
69   // fragment is layed out.
70   const MCSectionData *Prev = getSectionOrder()[Index - 1];
71   return isFragmentUpToDate(&(Prev->getFragmentList().back()));
72 }
73
74 bool MCAsmLayout::isFragmentUpToDate(const MCFragment *F) const {
75   return (LastValidFragment &&
76           F->getLayoutOrder() <= LastValidFragment->getLayoutOrder());
77 }
78
79 void MCAsmLayout::UpdateForSlide(MCFragment *F, int SlideAmount) {
80   // If this fragment wasn't already up-to-date, we don't need to do anything.
81   if (!isFragmentUpToDate(F))
82     return;
83
84   // Otherwise, reset the last valid fragment to the predecessor of the
85   // invalidated fragment.
86   LastValidFragment = F->getPrevNode();
87   if (!LastValidFragment) {
88     unsigned Index = F->getParent()->getLayoutOrder();
89     if (Index != 0) {
90       MCSectionData *Prev = getSectionOrder()[Index - 1];
91       LastValidFragment = &(Prev->getFragmentList().back());
92     }
93   }
94 }
95
96 void MCAsmLayout::EnsureValid(const MCFragment *F) const {
97   // Advance the layout position until the fragment is up-to-date.
98   while (!isFragmentUpToDate(F)) {
99     // Advance to the next fragment.
100     MCFragment *Cur = LastValidFragment;
101     if (Cur)
102       Cur = Cur->getNextNode();
103     if (!Cur) {
104       unsigned NextIndex = 0;
105       if (LastValidFragment)
106         NextIndex = LastValidFragment->getParent()->getLayoutOrder() + 1;
107       Cur = SectionOrder[NextIndex]->begin();
108     }
109
110     const_cast<MCAsmLayout*>(this)->LayoutFragment(Cur);
111   }
112 }
113
114 void MCAsmLayout::FragmentReplaced(MCFragment *Src, MCFragment *Dst) {
115   if (LastValidFragment == Src)
116     LastValidFragment = Dst;
117
118   Dst->Offset = Src->Offset;
119   Dst->EffectiveSize = Src->EffectiveSize;
120 }
121
122 uint64_t MCAsmLayout::getFragmentAddress(const MCFragment *F) const {
123   assert(F->getParent() && "Missing section()!");
124   return getSectionAddress(F->getParent()) + getFragmentOffset(F);
125 }
126
127 uint64_t MCAsmLayout::getFragmentEffectiveSize(const MCFragment *F) const {
128   EnsureValid(F);
129   assert(F->EffectiveSize != ~UINT64_C(0) && "Address not set!");
130   return F->EffectiveSize;
131 }
132
133 uint64_t MCAsmLayout::getFragmentOffset(const MCFragment *F) const {
134   EnsureValid(F);
135   assert(F->Offset != ~UINT64_C(0) && "Address not set!");
136   return F->Offset;
137 }
138
139 uint64_t MCAsmLayout::getSymbolAddress(const MCSymbolData *SD) const {
140   assert(SD->getFragment() && "Invalid getAddress() on undefined symbol!");
141   return getFragmentAddress(SD->getFragment()) + SD->getOffset();
142 }
143
144 uint64_t MCAsmLayout::getSectionAddress(const MCSectionData *SD) const {
145   EnsureValid(SD->begin());
146   assert(SD->Address != ~UINT64_C(0) && "Address not set!");
147   return SD->Address;
148 }
149
150 uint64_t MCAsmLayout::getSectionAddressSize(const MCSectionData *SD) const {
151   // The size is the last fragment's end offset.
152   const MCFragment &F = SD->getFragmentList().back();
153   return getFragmentOffset(&F) + getFragmentEffectiveSize(&F);
154 }
155
156 uint64_t MCAsmLayout::getSectionFileSize(const MCSectionData *SD) const {
157   // Virtual sections have no file size.
158   if (getAssembler().getBackend().isVirtualSection(SD->getSection()))
159     return 0;
160
161   // Otherwise, the file size is the same as the address space size.
162   return getSectionAddressSize(SD);
163 }
164
165 uint64_t MCAsmLayout::getSectionSize(const MCSectionData *SD) const {
166   // The logical size is the address space size minus any tail padding.
167   uint64_t Size = getSectionAddressSize(SD);
168   const MCAlignFragment *AF =
169     dyn_cast<MCAlignFragment>(&(SD->getFragmentList().back()));
170   if (AF && AF->hasOnlyAlignAddress())
171     Size -= getFragmentEffectiveSize(AF);
172
173   return Size;
174 }
175
176 /* *** */
177
178 MCFragment::MCFragment() : Kind(FragmentType(~0)) {
179 }
180
181 MCFragment::~MCFragment() {
182 }
183
184 MCFragment::MCFragment(FragmentType _Kind, MCSectionData *_Parent)
185   : Kind(_Kind), Parent(_Parent), Atom(0), Offset(~UINT64_C(0)),
186     EffectiveSize(~UINT64_C(0))
187 {
188   if (Parent)
189     Parent->getFragmentList().push_back(this);
190 }
191
192 /* *** */
193
194 MCSectionData::MCSectionData() : Section(0) {}
195
196 MCSectionData::MCSectionData(const MCSection &_Section, MCAssembler *A)
197   : Section(&_Section),
198     Alignment(1),
199     Address(~UINT64_C(0)),
200     HasInstructions(false)
201 {
202   if (A)
203     A->getSectionList().push_back(this);
204 }
205
206 /* *** */
207
208 MCSymbolData::MCSymbolData() : Symbol(0) {}
209
210 MCSymbolData::MCSymbolData(const MCSymbol &_Symbol, MCFragment *_Fragment,
211                            uint64_t _Offset, MCAssembler *A)
212   : Symbol(&_Symbol), Fragment(_Fragment), Offset(_Offset),
213     IsExternal(false), IsPrivateExtern(false),
214     CommonSize(0), SymbolSize(0), CommonAlign(0),
215     Flags(0), Index(0)
216 {
217   if (A)
218     A->getSymbolList().push_back(this);
219 }
220
221 /* *** */
222
223 MCAssembler::MCAssembler(MCContext &_Context, TargetAsmBackend &_Backend,
224                          MCCodeEmitter &_Emitter, raw_ostream &_OS)
225   : Context(_Context), Backend(_Backend), Emitter(_Emitter),
226     OS(_OS), RelaxAll(false), SubsectionsViaSymbols(false)
227 {
228 }
229
230 MCAssembler::~MCAssembler() {
231 }
232
233 static bool isScatteredFixupFullyResolvedSimple(const MCAssembler &Asm,
234                                                 const MCFixup &Fixup,
235                                                 const MCValue Target,
236                                                 const MCSection *BaseSection) {
237   // The effective fixup address is
238   //     addr(atom(A)) + offset(A)
239   //   - addr(atom(B)) - offset(B)
240   //   - addr(<base symbol>) + <fixup offset from base symbol>
241   // and the offsets are not relocatable, so the fixup is fully resolved when
242   //  addr(atom(A)) - addr(atom(B)) - addr(<base symbol>)) == 0.
243   //
244   // The simple (Darwin, except on x86_64) way of dealing with this was to
245   // assume that any reference to a temporary symbol *must* be a temporary
246   // symbol in the same atom, unless the sections differ. Therefore, any PCrel
247   // relocation to a temporary symbol (in the same section) is fully
248   // resolved. This also works in conjunction with absolutized .set, which
249   // requires the compiler to use .set to absolutize the differences between
250   // symbols which the compiler knows to be assembly time constants, so we don't
251   // need to worry about considering symbol differences fully resolved.
252
253   // Non-relative fixups are only resolved if constant.
254   if (!BaseSection)
255     return Target.isAbsolute();
256
257   // Otherwise, relative fixups are only resolved if not a difference and the
258   // target is a temporary in the same section.
259   if (Target.isAbsolute() || Target.getSymB())
260     return false;
261
262   const MCSymbol *A = &Target.getSymA()->getSymbol();
263   if (!A->isTemporary() || !A->isInSection() ||
264       &A->getSection() != BaseSection)
265     return false;
266
267   return true;
268 }
269
270 static bool isScatteredFixupFullyResolved(const MCAssembler &Asm,
271                                           const MCAsmLayout &Layout,
272                                           const MCFixup &Fixup,
273                                           const MCValue Target,
274                                           const MCSymbolData *BaseSymbol) {
275   // The effective fixup address is
276   //     addr(atom(A)) + offset(A)
277   //   - addr(atom(B)) - offset(B)
278   //   - addr(BaseSymbol) + <fixup offset from base symbol>
279   // and the offsets are not relocatable, so the fixup is fully resolved when
280   //  addr(atom(A)) - addr(atom(B)) - addr(BaseSymbol) == 0.
281   //
282   // Note that "false" is almost always conservatively correct (it means we emit
283   // a relocation which is unnecessary), except when it would force us to emit a
284   // relocation which the target cannot encode.
285
286   const MCSymbolData *A_Base = 0, *B_Base = 0;
287   if (const MCSymbolRefExpr *A = Target.getSymA()) {
288     // Modified symbol references cannot be resolved.
289     if (A->getKind() != MCSymbolRefExpr::VK_None)
290       return false;
291
292     A_Base = Asm.getAtom(Layout, &Asm.getSymbolData(A->getSymbol()));
293     if (!A_Base)
294       return false;
295   }
296
297   if (const MCSymbolRefExpr *B = Target.getSymB()) {
298     // Modified symbol references cannot be resolved.
299     if (B->getKind() != MCSymbolRefExpr::VK_None)
300       return false;
301
302     B_Base = Asm.getAtom(Layout, &Asm.getSymbolData(B->getSymbol()));
303     if (!B_Base)
304       return false;
305   }
306
307   // If there is no base, A and B have to be the same atom for this fixup to be
308   // fully resolved.
309   if (!BaseSymbol)
310     return A_Base == B_Base;
311
312   // Otherwise, B must be missing and A must be the base.
313   return !B_Base && BaseSymbol == A_Base;
314 }
315
316 bool MCAssembler::isSymbolLinkerVisible(const MCSymbol &Symbol) const {
317   // Non-temporary labels should always be visible to the linker.
318   if (!Symbol.isTemporary())
319     return true;
320
321   // Absolute temporary labels are never visible.
322   if (!Symbol.isInSection())
323     return false;
324
325   // Otherwise, check if the section requires symbols even for temporary labels.
326   return getBackend().doesSectionRequireSymbols(Symbol.getSection());
327 }
328
329 const MCSymbolData *MCAssembler::getAtom(const MCAsmLayout &Layout,
330                                          const MCSymbolData *SD) const {
331   // Linker visible symbols define atoms.
332   if (isSymbolLinkerVisible(SD->getSymbol()))
333     return SD;
334
335   // Absolute and undefined symbols have no defining atom.
336   if (!SD->getFragment())
337     return 0;
338
339   // Non-linker visible symbols in sections which can't be atomized have no
340   // defining atom.
341   if (!getBackend().isSectionAtomizable(
342         SD->getFragment()->getParent()->getSection()))
343     return 0;
344
345   // Otherwise, return the atom for the containing fragment.
346   return SD->getFragment()->getAtom();
347 }
348
349 bool MCAssembler::EvaluateFixup(const MCAsmLayout &Layout,
350                                 const MCFixup &Fixup, const MCFragment *DF,
351                                 MCValue &Target, uint64_t &Value) const {
352   ++stats::EvaluateFixup;
353
354   if (!Fixup.getValue()->EvaluateAsRelocatable(Target, &Layout))
355     report_fatal_error("expected relocatable expression");
356
357   // FIXME: How do non-scattered symbols work in ELF? I presume the linker
358   // doesn't support small relocations, but then under what criteria does the
359   // assembler allow symbol differences?
360
361   Value = Target.getConstant();
362
363   bool IsPCRel = Emitter.getFixupKindInfo(
364     Fixup.getKind()).Flags & MCFixupKindInfo::FKF_IsPCRel;
365   bool IsResolved = true;
366   if (const MCSymbolRefExpr *A = Target.getSymA()) {
367     if (A->getSymbol().isDefined())
368       Value += Layout.getSymbolAddress(&getSymbolData(A->getSymbol()));
369     else
370       IsResolved = false;
371   }
372   if (const MCSymbolRefExpr *B = Target.getSymB()) {
373     if (B->getSymbol().isDefined())
374       Value -= Layout.getSymbolAddress(&getSymbolData(B->getSymbol()));
375     else
376       IsResolved = false;
377   }
378
379   // If we are using scattered symbols, determine whether this value is actually
380   // resolved; scattering may cause atoms to move.
381   if (IsResolved && getBackend().hasScatteredSymbols()) {
382     if (getBackend().hasReliableSymbolDifference()) {
383       // If this is a PCrel relocation, find the base atom (identified by its
384       // symbol) that the fixup value is relative to.
385       const MCSymbolData *BaseSymbol = 0;
386       if (IsPCRel) {
387         BaseSymbol = DF->getAtom();
388         if (!BaseSymbol)
389           IsResolved = false;
390       }
391
392       if (IsResolved)
393         IsResolved = isScatteredFixupFullyResolved(*this, Layout, Fixup, Target,
394                                                    BaseSymbol);
395     } else {
396       const MCSection *BaseSection = 0;
397       if (IsPCRel)
398         BaseSection = &DF->getParent()->getSection();
399
400       IsResolved = isScatteredFixupFullyResolvedSimple(*this, Fixup, Target,
401                                                        BaseSection);
402     }
403   }
404
405   if (IsPCRel)
406     Value -= Layout.getFragmentAddress(DF) + Fixup.getOffset();
407
408   return IsResolved;
409 }
410
411 uint64_t MCAssembler::ComputeFragmentSize(MCAsmLayout &Layout,
412                                           const MCFragment &F,
413                                           uint64_t SectionAddress,
414                                           uint64_t FragmentOffset) const {
415   switch (F.getKind()) {
416   case MCFragment::FT_Data:
417     return cast<MCDataFragment>(F).getContents().size();
418   case MCFragment::FT_Fill:
419     return cast<MCFillFragment>(F).getSize();
420   case MCFragment::FT_Inst:
421     return cast<MCInstFragment>(F).getInstSize();
422
423   case MCFragment::FT_Align: {
424     const MCAlignFragment &AF = cast<MCAlignFragment>(F);
425
426     assert((!AF.hasOnlyAlignAddress() || !AF.getNextNode()) &&
427            "Invalid OnlyAlignAddress bit, not the last fragment!");
428
429     uint64_t Size = OffsetToAlignment(SectionAddress + FragmentOffset,
430                                       AF.getAlignment());
431
432     // Honor MaxBytesToEmit.
433     if (Size > AF.getMaxBytesToEmit())
434       return 0;
435
436     return Size;
437   }
438
439   case MCFragment::FT_Org: {
440     const MCOrgFragment &OF = cast<MCOrgFragment>(F);
441
442     // FIXME: We should compute this sooner, we don't want to recurse here, and
443     // we would like to be more functional.
444     int64_t TargetLocation;
445     if (!OF.getOffset().EvaluateAsAbsolute(TargetLocation, &Layout))
446       report_fatal_error("expected assembly-time absolute expression");
447
448     // FIXME: We need a way to communicate this error.
449     int64_t Offset = TargetLocation - FragmentOffset;
450     if (Offset < 0)
451       report_fatal_error("invalid .org offset '" + Twine(TargetLocation) +
452                          "' (at offset '" + Twine(FragmentOffset) + "'");
453
454     return Offset;
455   }
456   }
457
458   assert(0 && "invalid fragment kind");
459   return 0;
460 }
461
462 void MCAsmLayout::LayoutFile() {
463   // Initialize the first section and set the valid fragment layout point. All
464   // actual layout computations are done lazily.
465   LastValidFragment = 0;
466   if (!getSectionOrder().empty())
467     getSectionOrder().front()->Address = 0;
468 }
469
470 void MCAsmLayout::LayoutFragment(MCFragment *F) {
471   MCFragment *Prev = F->getPrevNode();
472
473   // We should never try to recompute something which is up-to-date.
474   assert(!isFragmentUpToDate(F) && "Attempt to recompute up-to-date fragment!");
475   // We should never try to compute the fragment layout if the section isn't
476   // up-to-date.
477   assert(isSectionUpToDate(F->getParent()) &&
478          "Attempt to compute fragment before it's section!");
479   // We should never try to compute the fragment layout if it's predecessor
480   // isn't up-to-date.
481   assert((!Prev || isFragmentUpToDate(Prev)) &&
482          "Attempt to compute fragment before it's predecessor!");
483
484   ++stats::FragmentLayouts;
485
486   // Compute the fragment start address.
487   uint64_t StartAddress = F->getParent()->Address;
488   uint64_t Address = StartAddress;
489   if (Prev)
490     Address += Prev->Offset + Prev->EffectiveSize;
491
492   // Compute fragment offset and size.
493   F->Offset = Address - StartAddress;
494   F->EffectiveSize = getAssembler().ComputeFragmentSize(*this, *F, StartAddress,
495                                                         F->Offset);
496   LastValidFragment = F;
497
498   // If this is the last fragment in a section, update the next section address.
499   if (!F->getNextNode()) {
500     unsigned NextIndex = F->getParent()->getLayoutOrder() + 1;
501     if (NextIndex != getSectionOrder().size())
502       LayoutSection(getSectionOrder()[NextIndex]);
503   }
504 }
505
506 void MCAsmLayout::LayoutSection(MCSectionData *SD) {
507   unsigned SectionOrderIndex = SD->getLayoutOrder();
508
509   ++stats::SectionLayouts;
510
511   // Compute the section start address.
512   uint64_t StartAddress = 0;
513   if (SectionOrderIndex) {
514     MCSectionData *Prev = getSectionOrder()[SectionOrderIndex - 1];
515     StartAddress = getSectionAddress(Prev) + getSectionAddressSize(Prev);
516   }
517
518   // Honor the section alignment requirements.
519   StartAddress = RoundUpToAlignment(StartAddress, SD->getAlignment());
520
521   // Set the section address.
522   SD->Address = StartAddress;
523 }
524
525 /// WriteFragmentData - Write the \arg F data to the output file.
526 static void WriteFragmentData(const MCAssembler &Asm, const MCAsmLayout &Layout,
527                               const MCFragment &F, MCObjectWriter *OW) {
528   uint64_t Start = OW->getStream().tell();
529   (void) Start;
530
531   ++stats::EmittedFragments;
532
533   // FIXME: Embed in fragments instead?
534   uint64_t FragmentSize = Layout.getFragmentEffectiveSize(&F);
535   switch (F.getKind()) {
536   case MCFragment::FT_Align: {
537     MCAlignFragment &AF = cast<MCAlignFragment>(F);
538     uint64_t Count = FragmentSize / AF.getValueSize();
539
540     assert(AF.getValueSize() && "Invalid virtual align in concrete fragment!");
541
542     // FIXME: This error shouldn't actually occur (the front end should emit
543     // multiple .align directives to enforce the semantics it wants), but is
544     // severe enough that we want to report it. How to handle this?
545     if (Count * AF.getValueSize() != FragmentSize)
546       report_fatal_error("undefined .align directive, value size '" +
547                         Twine(AF.getValueSize()) +
548                         "' is not a divisor of padding size '" +
549                         Twine(FragmentSize) + "'");
550
551     // See if we are aligning with nops, and if so do that first to try to fill
552     // the Count bytes.  Then if that did not fill any bytes or there are any
553     // bytes left to fill use the the Value and ValueSize to fill the rest.
554     // If we are aligning with nops, ask that target to emit the right data.
555     if (AF.hasEmitNops()) {
556       if (!Asm.getBackend().WriteNopData(Count, OW))
557         report_fatal_error("unable to write nop sequence of " +
558                           Twine(Count) + " bytes");
559       break;
560     }
561
562     // Otherwise, write out in multiples of the value size.
563     for (uint64_t i = 0; i != Count; ++i) {
564       switch (AF.getValueSize()) {
565       default:
566         assert(0 && "Invalid size!");
567       case 1: OW->Write8 (uint8_t (AF.getValue())); break;
568       case 2: OW->Write16(uint16_t(AF.getValue())); break;
569       case 4: OW->Write32(uint32_t(AF.getValue())); break;
570       case 8: OW->Write64(uint64_t(AF.getValue())); break;
571       }
572     }
573     break;
574   }
575
576   case MCFragment::FT_Data: {
577     MCDataFragment &DF = cast<MCDataFragment>(F);
578     assert(FragmentSize == DF.getContents().size() && "Invalid size!");
579     OW->WriteBytes(DF.getContents().str());
580     break;
581   }
582
583   case MCFragment::FT_Fill: {
584     MCFillFragment &FF = cast<MCFillFragment>(F);
585
586     assert(FF.getValueSize() && "Invalid virtual align in concrete fragment!");
587
588     for (uint64_t i = 0, e = FF.getSize() / FF.getValueSize(); i != e; ++i) {
589       switch (FF.getValueSize()) {
590       default:
591         assert(0 && "Invalid size!");
592       case 1: OW->Write8 (uint8_t (FF.getValue())); break;
593       case 2: OW->Write16(uint16_t(FF.getValue())); break;
594       case 4: OW->Write32(uint32_t(FF.getValue())); break;
595       case 8: OW->Write64(uint64_t(FF.getValue())); break;
596       }
597     }
598     break;
599   }
600
601   case MCFragment::FT_Inst:
602     llvm_unreachable("unexpected inst fragment after lowering");
603     break;
604
605   case MCFragment::FT_Org: {
606     MCOrgFragment &OF = cast<MCOrgFragment>(F);
607
608     for (uint64_t i = 0, e = FragmentSize; i != e; ++i)
609       OW->Write8(uint8_t(OF.getValue()));
610
611     break;
612   }
613   }
614
615   assert(OW->getStream().tell() - Start == FragmentSize);
616 }
617
618 void MCAssembler::WriteSectionData(const MCSectionData *SD,
619                                    const MCAsmLayout &Layout,
620                                    MCObjectWriter *OW) const {
621   // Ignore virtual sections.
622   if (getBackend().isVirtualSection(SD->getSection())) {
623     assert(Layout.getSectionFileSize(SD) == 0 && "Invalid size for section!");
624
625     // Check that contents are only things legal inside a virtual section.
626     for (MCSectionData::const_iterator it = SD->begin(),
627            ie = SD->end(); it != ie; ++it) {
628       switch (it->getKind()) {
629       default:
630         assert(0 && "Invalid fragment in virtual section!");
631       case MCFragment::FT_Align:
632         assert(!cast<MCAlignFragment>(it)->getValueSize() &&
633                "Invalid align in virtual section!");
634         break;
635       case MCFragment::FT_Fill:
636         assert(!cast<MCFillFragment>(it)->getValueSize() &&
637                "Invalid fill in virtual section!");
638         break;
639       }
640     }
641
642     return;
643   }
644
645   uint64_t Start = OW->getStream().tell();
646   (void) Start;
647
648   for (MCSectionData::const_iterator it = SD->begin(),
649          ie = SD->end(); it != ie; ++it)
650     WriteFragmentData(*this, Layout, *it, OW);
651
652   assert(OW->getStream().tell() - Start == Layout.getSectionFileSize(SD));
653 }
654
655 void MCAssembler::AddSectionToTheEnd(MCSectionData &SD, MCAsmLayout &Layout) {
656   // Create dummy fragments and assign section ordinals.
657   unsigned SectionIndex = 0;
658   for (MCAssembler::iterator it = begin(), ie = end(); it != ie; ++it)
659     SectionIndex++;
660
661   SD.setOrdinal(SectionIndex);
662
663   // Assign layout order indices to sections and fragments.
664   unsigned FragmentIndex = 0;
665   unsigned i = 0;
666   for (unsigned e = Layout.getSectionOrder().size(); i != e; ++i) {
667     MCSectionData *SD = Layout.getSectionOrder()[i];
668
669     for (MCSectionData::iterator it2 = SD->begin(),
670            ie2 = SD->end(); it2 != ie2; ++it2)
671       FragmentIndex++;
672   }
673
674   SD.setLayoutOrder(i);
675   for (MCSectionData::iterator it2 = SD.begin(),
676          ie2 = SD.end(); it2 != ie2; ++it2) {
677     it2->setLayoutOrder(FragmentIndex++);
678   }
679   Layout.getSectionOrder().push_back(&SD);
680
681   Layout.LayoutSection(&SD);
682
683   // Layout until everything fits.
684   while (LayoutOnce(Layout))
685     continue;
686
687 }
688
689 void MCAssembler::Finish(MCObjectWriter *Writer) {
690   DEBUG_WITH_TYPE("mc-dump", {
691       llvm::errs() << "assembler backend - pre-layout\n--\n";
692       dump(); });
693
694   // Create the layout object.
695   MCAsmLayout Layout(*this);
696
697   // Insert additional align fragments for concrete sections to explicitly pad
698   // the previous section to match their alignment requirements. This is for
699   // 'gas' compatibility, it shouldn't strictly be necessary.
700   //
701   // FIXME: This may be Mach-O specific.
702   for (unsigned i = 1, e = Layout.getSectionOrder().size(); i < e; ++i) {
703     MCSectionData *SD = Layout.getSectionOrder()[i];
704
705     // Ignore sections without alignment requirements.
706     unsigned Align = SD->getAlignment();
707     if (Align <= 1)
708       continue;
709
710     // Ignore virtual sections, they don't cause file size modifications.
711     if (getBackend().isVirtualSection(SD->getSection()))
712       continue;
713
714     // Otherwise, create a new align fragment at the end of the previous
715     // section.
716     MCAlignFragment *AF = new MCAlignFragment(Align, 0, 1, Align,
717                                               Layout.getSectionOrder()[i - 1]);
718     AF->setOnlyAlignAddress(true);
719   }
720
721   // Create dummy fragments and assign section ordinals.
722   unsigned SectionIndex = 0;
723   for (MCAssembler::iterator it = begin(), ie = end(); it != ie; ++it) {
724     // Create dummy fragments to eliminate any empty sections, this simplifies
725     // layout.
726     if (it->getFragmentList().empty())
727       new MCFillFragment(0, 1, 0, it);
728
729     it->setOrdinal(SectionIndex++);
730   }
731
732   // Assign layout order indices to sections and fragments.
733   unsigned FragmentIndex = 0;
734   for (unsigned i = 0, e = Layout.getSectionOrder().size(); i != e; ++i) {
735     MCSectionData *SD = Layout.getSectionOrder()[i];
736     SD->setLayoutOrder(i);
737
738     for (MCSectionData::iterator it2 = SD->begin(),
739            ie2 = SD->end(); it2 != ie2; ++it2)
740       it2->setLayoutOrder(FragmentIndex++);
741   }
742
743   // Layout until everything fits.
744   while (LayoutOnce(Layout))
745     continue;
746
747   DEBUG_WITH_TYPE("mc-dump", {
748       llvm::errs() << "assembler backend - post-relaxation\n--\n";
749       dump(); });
750
751   // Finalize the layout, including fragment lowering.
752   FinishLayout(Layout);
753
754   DEBUG_WITH_TYPE("mc-dump", {
755       llvm::errs() << "assembler backend - final-layout\n--\n";
756       dump(); });
757
758   uint64_t StartOffset = OS.tell();
759
760   llvm::OwningPtr<MCObjectWriter> OwnWriter(0);
761   if (Writer == 0) {
762     //no custom Writer_ : create the default one life-managed by OwningPtr
763     OwnWriter.reset(getBackend().createObjectWriter(OS));
764     Writer = OwnWriter.get();
765     if (!Writer)
766       report_fatal_error("unable to create object writer!");
767   }
768
769   // Allow the object writer a chance to perform post-layout binding (for
770   // example, to set the index fields in the symbol data).
771   Writer->ExecutePostLayoutBinding(*this);
772
773   // Evaluate and apply the fixups, generating relocation entries as necessary.
774   for (MCAssembler::iterator it = begin(), ie = end(); it != ie; ++it) {
775     for (MCSectionData::iterator it2 = it->begin(),
776            ie2 = it->end(); it2 != ie2; ++it2) {
777       MCDataFragment *DF = dyn_cast<MCDataFragment>(it2);
778       if (!DF)
779         continue;
780
781       for (MCDataFragment::fixup_iterator it3 = DF->fixup_begin(),
782              ie3 = DF->fixup_end(); it3 != ie3; ++it3) {
783         MCFixup &Fixup = *it3;
784
785         // Evaluate the fixup.
786         MCValue Target;
787         uint64_t FixedValue;
788         if (!EvaluateFixup(Layout, Fixup, DF, Target, FixedValue)) {
789           // The fixup was unresolved, we need a relocation. Inform the object
790           // writer of the relocation, and give it an opportunity to adjust the
791           // fixup value if need be.
792           Writer->RecordRelocation(*this, Layout, DF, Fixup, Target,FixedValue);
793         }
794
795         getBackend().ApplyFixup(Fixup, *DF, FixedValue);
796       }
797     }
798   }
799
800   // Write the object file.
801   Writer->WriteObject(*this, Layout);
802
803   stats::ObjectBytes += OS.tell() - StartOffset;
804 }
805
806 bool MCAssembler::FixupNeedsRelaxation(const MCFixup &Fixup,
807                                        const MCFragment *DF,
808                                        const MCAsmLayout &Layout) const {
809   if (getRelaxAll())
810     return true;
811
812   // If we cannot resolve the fixup value, it requires relaxation.
813   MCValue Target;
814   uint64_t Value;
815   if (!EvaluateFixup(Layout, Fixup, DF, Target, Value))
816     return true;
817
818   // Otherwise, relax if the value is too big for a (signed) i8.
819   //
820   // FIXME: This is target dependent!
821   return int64_t(Value) != int64_t(int8_t(Value));
822 }
823
824 bool MCAssembler::FragmentNeedsRelaxation(const MCInstFragment *IF,
825                                           const MCAsmLayout &Layout) const {
826   // If this inst doesn't ever need relaxation, ignore it. This occurs when we
827   // are intentionally pushing out inst fragments, or because we relaxed a
828   // previous instruction to one that doesn't need relaxation.
829   if (!getBackend().MayNeedRelaxation(IF->getInst()))
830     return false;
831
832   for (MCInstFragment::const_fixup_iterator it = IF->fixup_begin(),
833          ie = IF->fixup_end(); it != ie; ++it)
834     if (FixupNeedsRelaxation(*it, IF, Layout))
835       return true;
836
837   return false;
838 }
839
840 bool MCAssembler::LayoutOnce(MCAsmLayout &Layout) {
841   ++stats::RelaxationSteps;
842
843   // Layout the sections in order.
844   Layout.LayoutFile();
845
846   // Scan for fragments that need relaxation.
847   bool WasRelaxed = false;
848   for (iterator it = begin(), ie = end(); it != ie; ++it) {
849     MCSectionData &SD = *it;
850
851     for (MCSectionData::iterator it2 = SD.begin(),
852            ie2 = SD.end(); it2 != ie2; ++it2) {
853       // Check if this is an instruction fragment that needs relaxation.
854       MCInstFragment *IF = dyn_cast<MCInstFragment>(it2);
855       if (!IF || !FragmentNeedsRelaxation(IF, Layout))
856         continue;
857
858       ++stats::RelaxedInstructions;
859
860       // FIXME-PERF: We could immediately lower out instructions if we can tell
861       // they are fully resolved, to avoid retesting on later passes.
862
863       // Relax the fragment.
864
865       MCInst Relaxed;
866       getBackend().RelaxInstruction(IF->getInst(), Relaxed);
867
868       // Encode the new instruction.
869       //
870       // FIXME-PERF: If it matters, we could let the target do this. It can
871       // probably do so more efficiently in many cases.
872       SmallVector<MCFixup, 4> Fixups;
873       SmallString<256> Code;
874       raw_svector_ostream VecOS(Code);
875       getEmitter().EncodeInstruction(Relaxed, VecOS, Fixups);
876       VecOS.flush();
877
878       // Update the instruction fragment.
879       int SlideAmount = Code.size() - IF->getInstSize();
880       IF->setInst(Relaxed);
881       IF->getCode() = Code;
882       IF->getFixups().clear();
883       // FIXME: Eliminate copy.
884       for (unsigned i = 0, e = Fixups.size(); i != e; ++i)
885         IF->getFixups().push_back(Fixups[i]);
886
887       // Update the layout, and remember that we relaxed.
888       Layout.UpdateForSlide(IF, SlideAmount);
889       WasRelaxed = true;
890     }
891   }
892
893   return WasRelaxed;
894 }
895
896 void MCAssembler::FinishLayout(MCAsmLayout &Layout) {
897   // Lower out any instruction fragments, to simplify the fixup application and
898   // output.
899   //
900   // FIXME-PERF: We don't have to do this, but the assumption is that it is
901   // cheap (we will mostly end up eliminating fragments and appending on to data
902   // fragments), so the extra complexity downstream isn't worth it. Evaluate
903   // this assumption.
904   for (iterator it = begin(), ie = end(); it != ie; ++it) {
905     MCSectionData &SD = *it;
906
907     for (MCSectionData::iterator it2 = SD.begin(),
908            ie2 = SD.end(); it2 != ie2; ++it2) {
909       MCInstFragment *IF = dyn_cast<MCInstFragment>(it2);
910       if (!IF)
911         continue;
912
913       // Create a new data fragment for the instruction.
914       //
915       // FIXME-PERF: Reuse previous data fragment if possible.
916       MCDataFragment *DF = new MCDataFragment();
917       SD.getFragmentList().insert(it2, DF);
918
919       // Update the data fragments layout data.
920       DF->setParent(IF->getParent());
921       DF->setAtom(IF->getAtom());
922       DF->setLayoutOrder(IF->getLayoutOrder());
923       Layout.FragmentReplaced(IF, DF);
924
925       // Copy in the data and the fixups.
926       DF->getContents().append(IF->getCode().begin(), IF->getCode().end());
927       for (unsigned i = 0, e = IF->getFixups().size(); i != e; ++i)
928         DF->getFixups().push_back(IF->getFixups()[i]);
929
930       // Delete the instruction fragment and update the iterator.
931       SD.getFragmentList().erase(IF);
932       it2 = DF;
933     }
934   }
935 }
936
937 // Debugging methods
938
939 namespace llvm {
940
941 raw_ostream &operator<<(raw_ostream &OS, const MCFixup &AF) {
942   OS << "<MCFixup" << " Offset:" << AF.getOffset()
943      << " Value:" << *AF.getValue()
944      << " Kind:" << AF.getKind() << ">";
945   return OS;
946 }
947
948 }
949
950 void MCFragment::dump() {
951   raw_ostream &OS = llvm::errs();
952
953   OS << "<";
954   switch (getKind()) {
955   case MCFragment::FT_Align: OS << "MCAlignFragment"; break;
956   case MCFragment::FT_Data:  OS << "MCDataFragment"; break;
957   case MCFragment::FT_Fill:  OS << "MCFillFragment"; break;
958   case MCFragment::FT_Inst:  OS << "MCInstFragment"; break;
959   case MCFragment::FT_Org:   OS << "MCOrgFragment"; break;
960   }
961
962   OS << "<MCFragment " << (void*) this << " LayoutOrder:" << LayoutOrder
963      << " Offset:" << Offset << " EffectiveSize:" << EffectiveSize << ">";
964
965   switch (getKind()) {
966   case MCFragment::FT_Align: {
967     const MCAlignFragment *AF = cast<MCAlignFragment>(this);
968     if (AF->hasEmitNops())
969       OS << " (emit nops)";
970     if (AF->hasOnlyAlignAddress())
971       OS << " (only align section)";
972     OS << "\n       ";
973     OS << " Alignment:" << AF->getAlignment()
974        << " Value:" << AF->getValue() << " ValueSize:" << AF->getValueSize()
975        << " MaxBytesToEmit:" << AF->getMaxBytesToEmit() << ">";
976     break;
977   }
978   case MCFragment::FT_Data:  {
979     const MCDataFragment *DF = cast<MCDataFragment>(this);
980     OS << "\n       ";
981     OS << " Contents:[";
982     const SmallVectorImpl<char> &Contents = DF->getContents();
983     for (unsigned i = 0, e = Contents.size(); i != e; ++i) {
984       if (i) OS << ",";
985       OS << hexdigit((Contents[i] >> 4) & 0xF) << hexdigit(Contents[i] & 0xF);
986     }
987     OS << "] (" << Contents.size() << " bytes)";
988
989     if (!DF->getFixups().empty()) {
990       OS << ",\n       ";
991       OS << " Fixups:[";
992       for (MCDataFragment::const_fixup_iterator it = DF->fixup_begin(),
993              ie = DF->fixup_end(); it != ie; ++it) {
994         if (it != DF->fixup_begin()) OS << ",\n                ";
995         OS << *it;
996       }
997       OS << "]";
998     }
999     break;
1000   }
1001   case MCFragment::FT_Fill:  {
1002     const MCFillFragment *FF = cast<MCFillFragment>(this);
1003     OS << " Value:" << FF->getValue() << " ValueSize:" << FF->getValueSize()
1004        << " Size:" << FF->getSize();
1005     break;
1006   }
1007   case MCFragment::FT_Inst:  {
1008     const MCInstFragment *IF = cast<MCInstFragment>(this);
1009     OS << "\n       ";
1010     OS << " Inst:";
1011     IF->getInst().dump_pretty(OS);
1012     break;
1013   }
1014   case MCFragment::FT_Org:  {
1015     const MCOrgFragment *OF = cast<MCOrgFragment>(this);
1016     OS << "\n       ";
1017     OS << " Offset:" << OF->getOffset() << " Value:" << OF->getValue();
1018     break;
1019   }
1020   }
1021   OS << ">";
1022 }
1023
1024 void MCSectionData::dump() {
1025   raw_ostream &OS = llvm::errs();
1026
1027   OS << "<MCSectionData";
1028   OS << " Alignment:" << getAlignment() << " Address:" << Address
1029      << " Fragments:[\n      ";
1030   for (iterator it = begin(), ie = end(); it != ie; ++it) {
1031     if (it != begin()) OS << ",\n      ";
1032     it->dump();
1033   }
1034   OS << "]>";
1035 }
1036
1037 void MCSymbolData::dump() {
1038   raw_ostream &OS = llvm::errs();
1039
1040   OS << "<MCSymbolData Symbol:" << getSymbol()
1041      << " Fragment:" << getFragment() << " Offset:" << getOffset()
1042      << " Flags:" << getFlags() << " Index:" << getIndex();
1043   if (isCommon())
1044     OS << " (common, size:" << getCommonSize()
1045        << " align: " << getCommonAlignment() << ")";
1046   if (isExternal())
1047     OS << " (external)";
1048   if (isPrivateExtern())
1049     OS << " (private extern)";
1050   OS << ">";
1051 }
1052
1053 void MCAssembler::dump() {
1054   raw_ostream &OS = llvm::errs();
1055
1056   OS << "<MCAssembler\n";
1057   OS << "  Sections:[\n    ";
1058   for (iterator it = begin(), ie = end(); it != ie; ++it) {
1059     if (it != begin()) OS << ",\n    ";
1060     it->dump();
1061   }
1062   OS << "],\n";
1063   OS << "  Symbols:[";
1064
1065   for (symbol_iterator it = symbol_begin(), ie = symbol_end(); it != ie; ++it) {
1066     if (it != symbol_begin()) OS << ",\n           ";
1067     it->dump();
1068   }
1069   OS << "]>\n";
1070 }