MC: Create dummy fragments to avoid ever having empty sections, which simplifies...
[oota-llvm.git] / lib / MC / MCAssembler.cpp
1 //===- lib/MC/MCAssembler.cpp - Assembler Backend Implementation ----------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 #define DEBUG_TYPE "assembler"
11 #include "llvm/MC/MCAssembler.h"
12 #include "llvm/MC/MCAsmLayout.h"
13 #include "llvm/MC/MCCodeEmitter.h"
14 #include "llvm/MC/MCExpr.h"
15 #include "llvm/MC/MCObjectWriter.h"
16 #include "llvm/MC/MCSymbol.h"
17 #include "llvm/MC/MCValue.h"
18 #include "llvm/ADT/OwningPtr.h"
19 #include "llvm/ADT/Statistic.h"
20 #include "llvm/ADT/StringExtras.h"
21 #include "llvm/ADT/Twine.h"
22 #include "llvm/Support/Debug.h"
23 #include "llvm/Support/ErrorHandling.h"
24 #include "llvm/Support/raw_ostream.h"
25 #include "llvm/Target/TargetRegistry.h"
26 #include "llvm/Target/TargetAsmBackend.h"
27
28 #include <vector>
29 using namespace llvm;
30
31 namespace {
32 namespace stats {
33 STATISTIC(EmittedFragments, "Number of emitted assembler fragments");
34 STATISTIC(EvaluateFixup, "Number of evaluated fixups");
35 STATISTIC(FragmentLayouts, "Number of fragment layouts");
36 STATISTIC(ObjectBytes, "Number of emitted object file bytes");
37 STATISTIC(RelaxationSteps, "Number of assembler layout and relaxation steps");
38 STATISTIC(RelaxedInstructions, "Number of relaxed instructions");
39 STATISTIC(SectionLayouts, "Number of section layouts");
40 }
41 }
42
43 // FIXME FIXME FIXME: There are number of places in this file where we convert
44 // what is a 64-bit assembler value used for computation into a value in the
45 // object file, which may truncate it. We should detect that truncation where
46 // invalid and report errors back.
47
48 /* *** */
49
50 MCAsmLayout::MCAsmLayout(MCAssembler &Asm) : Assembler(Asm) {
51   // Compute the section layout order. Virtual sections must go last.
52   for (MCAssembler::iterator it = Asm.begin(), ie = Asm.end(); it != ie; ++it)
53     if (!Asm.getBackend().isVirtualSection(it->getSection()))
54       SectionOrder.push_back(&*it);
55   for (MCAssembler::iterator it = Asm.begin(), ie = Asm.end(); it != ie; ++it)
56     if (Asm.getBackend().isVirtualSection(it->getSection()))
57       SectionOrder.push_back(&*it);
58 }
59
60 void MCAsmLayout::UpdateForSlide(MCFragment *F, int SlideAmount) {
61   // We shouldn't have to do anything special to support negative slides, and it
62   // is a perfectly valid thing to do as long as other parts of the system can
63   // guarantee convergence.
64   assert(SlideAmount >= 0 && "Negative slides not yet supported");
65
66   // Update the layout by simply recomputing the layout for the entire
67   // file. This is trivially correct, but very slow.
68   //
69   // FIXME-PERF: This is O(N^2), but will be eliminated once we get smarter.
70
71   // Layout the sections in order.
72   for (unsigned i = 0, e = getSectionOrder().size(); i != e; ++i)
73     getAssembler().LayoutSection(*this, i);
74 }
75
76 void MCAsmLayout::FragmentReplaced(MCFragment *Src, MCFragment *Dst) {
77   Dst->Offset = Src->Offset;
78   Dst->EffectiveSize = Src->EffectiveSize;
79 }
80
81 uint64_t MCAsmLayout::getFragmentAddress(const MCFragment *F) const {
82   assert(F->getParent() && "Missing section()!");
83   return getSectionAddress(F->getParent()) + getFragmentOffset(F);
84 }
85
86 uint64_t MCAsmLayout::getFragmentEffectiveSize(const MCFragment *F) const {
87   assert(F->EffectiveSize != ~UINT64_C(0) && "Address not set!");
88   return F->EffectiveSize;
89 }
90
91 void MCAsmLayout::setFragmentEffectiveSize(MCFragment *F, uint64_t Value) {
92   F->EffectiveSize = Value;
93 }
94
95 uint64_t MCAsmLayout::getFragmentOffset(const MCFragment *F) const {
96   assert(F->Offset != ~UINT64_C(0) && "Address not set!");
97   return F->Offset;
98 }
99
100 void MCAsmLayout::setFragmentOffset(MCFragment *F, uint64_t Value) {
101   F->Offset = Value;
102 }
103
104 uint64_t MCAsmLayout::getSymbolAddress(const MCSymbolData *SD) const {
105   assert(SD->getFragment() && "Invalid getAddress() on undefined symbol!");
106   return getFragmentAddress(SD->getFragment()) + SD->getOffset();
107 }
108
109 uint64_t MCAsmLayout::getSectionAddress(const MCSectionData *SD) const {
110   assert(SD->Address != ~UINT64_C(0) && "Address not set!");
111   return SD->Address;
112 }
113
114 void MCAsmLayout::setSectionAddress(MCSectionData *SD, uint64_t Value) {
115   SD->Address = Value;
116 }
117
118 uint64_t MCAsmLayout::getSectionAddressSize(const MCSectionData *SD) const {
119   // Otherwise, the size is the last fragment's end offset.
120   const MCFragment &F = SD->getFragmentList().back();
121   return getFragmentOffset(&F) + getFragmentEffectiveSize(&F);
122 }
123
124 uint64_t MCAsmLayout::getSectionFileSize(const MCSectionData *SD) const {
125   // Virtual sections have no file size.
126   if (getAssembler().getBackend().isVirtualSection(SD->getSection()))
127     return 0;
128
129   // Otherwise, the file size is the same as the address space size.
130   return getSectionAddressSize(SD);
131 }
132
133 uint64_t MCAsmLayout::getSectionSize(const MCSectionData *SD) const {
134   // The logical size is the address space size minus any tail padding.
135   uint64_t Size = getSectionAddressSize(SD);
136   const MCAlignFragment *AF =
137     dyn_cast<MCAlignFragment>(&(SD->getFragmentList().back()));
138   if (AF && AF->hasOnlyAlignAddress())
139     Size -= getFragmentEffectiveSize(AF);
140
141   return Size;
142 }
143
144 /* *** */
145
146 MCFragment::MCFragment() : Kind(FragmentType(~0)) {
147 }
148
149 MCFragment::MCFragment(FragmentType _Kind, MCSectionData *_Parent)
150   : Kind(_Kind), Parent(_Parent), Atom(0), EffectiveSize(~UINT64_C(0))
151 {
152   if (Parent)
153     Parent->getFragmentList().push_back(this);
154 }
155
156 MCFragment::~MCFragment() {
157 }
158
159 /* *** */
160
161 MCSectionData::MCSectionData() : Section(0) {}
162
163 MCSectionData::MCSectionData(const MCSection &_Section, MCAssembler *A)
164   : Section(&_Section),
165     Alignment(1),
166     Address(~UINT64_C(0)),
167     HasInstructions(false)
168 {
169   if (A)
170     A->getSectionList().push_back(this);
171 }
172
173 /* *** */
174
175 MCSymbolData::MCSymbolData() : Symbol(0) {}
176
177 MCSymbolData::MCSymbolData(const MCSymbol &_Symbol, MCFragment *_Fragment,
178                            uint64_t _Offset, MCAssembler *A)
179   : Symbol(&_Symbol), Fragment(_Fragment), Offset(_Offset),
180     IsExternal(false), IsPrivateExtern(false),
181     CommonSize(0), CommonAlign(0), Flags(0), Index(0)
182 {
183   if (A)
184     A->getSymbolList().push_back(this);
185 }
186
187 /* *** */
188
189 MCAssembler::MCAssembler(MCContext &_Context, TargetAsmBackend &_Backend,
190                          MCCodeEmitter &_Emitter, raw_ostream &_OS)
191   : Context(_Context), Backend(_Backend), Emitter(_Emitter),
192     OS(_OS), RelaxAll(false), SubsectionsViaSymbols(false)
193 {
194 }
195
196 MCAssembler::~MCAssembler() {
197 }
198
199 static bool isScatteredFixupFullyResolvedSimple(const MCAssembler &Asm,
200                                                 const MCAsmFixup &Fixup,
201                                                 const MCValue Target,
202                                                 const MCSection *BaseSection) {
203   // The effective fixup address is
204   //     addr(atom(A)) + offset(A)
205   //   - addr(atom(B)) - offset(B)
206   //   - addr(<base symbol>) + <fixup offset from base symbol>
207   // and the offsets are not relocatable, so the fixup is fully resolved when
208   //  addr(atom(A)) - addr(atom(B)) - addr(<base symbol>)) == 0.
209   //
210   // The simple (Darwin, except on x86_64) way of dealing with this was to
211   // assume that any reference to a temporary symbol *must* be a temporary
212   // symbol in the same atom, unless the sections differ. Therefore, any PCrel
213   // relocation to a temporary symbol (in the same section) is fully
214   // resolved. This also works in conjunction with absolutized .set, which
215   // requires the compiler to use .set to absolutize the differences between
216   // symbols which the compiler knows to be assembly time constants, so we don't
217   // need to worry about considering symbol differences fully resolved.
218
219   // Non-relative fixups are only resolved if constant.
220   if (!BaseSection)
221     return Target.isAbsolute();
222
223   // Otherwise, relative fixups are only resolved if not a difference and the
224   // target is a temporary in the same section.
225   if (Target.isAbsolute() || Target.getSymB())
226     return false;
227
228   const MCSymbol *A = &Target.getSymA()->getSymbol();
229   if (!A->isTemporary() || !A->isInSection() ||
230       &A->getSection() != BaseSection)
231     return false;
232
233   return true;
234 }
235
236 static bool isScatteredFixupFullyResolved(const MCAssembler &Asm,
237                                           const MCAsmLayout &Layout,
238                                           const MCAsmFixup &Fixup,
239                                           const MCValue Target,
240                                           const MCSymbolData *BaseSymbol) {
241   // The effective fixup address is
242   //     addr(atom(A)) + offset(A)
243   //   - addr(atom(B)) - offset(B)
244   //   - addr(BaseSymbol) + <fixup offset from base symbol>
245   // and the offsets are not relocatable, so the fixup is fully resolved when
246   //  addr(atom(A)) - addr(atom(B)) - addr(BaseSymbol) == 0.
247   //
248   // Note that "false" is almost always conservatively correct (it means we emit
249   // a relocation which is unnecessary), except when it would force us to emit a
250   // relocation which the target cannot encode.
251
252   const MCSymbolData *A_Base = 0, *B_Base = 0;
253   if (const MCSymbolRefExpr *A = Target.getSymA()) {
254     // Modified symbol references cannot be resolved.
255     if (A->getKind() != MCSymbolRefExpr::VK_None)
256       return false;
257
258     A_Base = Asm.getAtom(Layout, &Asm.getSymbolData(A->getSymbol()));
259     if (!A_Base)
260       return false;
261   }
262
263   if (const MCSymbolRefExpr *B = Target.getSymB()) {
264     // Modified symbol references cannot be resolved.
265     if (B->getKind() != MCSymbolRefExpr::VK_None)
266       return false;
267
268     B_Base = Asm.getAtom(Layout, &Asm.getSymbolData(B->getSymbol()));
269     if (!B_Base)
270       return false;
271   }
272
273   // If there is no base, A and B have to be the same atom for this fixup to be
274   // fully resolved.
275   if (!BaseSymbol)
276     return A_Base == B_Base;
277
278   // Otherwise, B must be missing and A must be the base.
279   return !B_Base && BaseSymbol == A_Base;
280 }
281
282 bool MCAssembler::isSymbolLinkerVisible(const MCSymbolData *SD) const {
283   // Non-temporary labels should always be visible to the linker.
284   if (!SD->getSymbol().isTemporary())
285     return true;
286
287   // Absolute temporary labels are never visible.
288   if (!SD->getFragment())
289     return false;
290
291   // Otherwise, check if the section requires symbols even for temporary labels.
292   return getBackend().doesSectionRequireSymbols(
293     SD->getFragment()->getParent()->getSection());
294 }
295
296 const MCSymbolData *MCAssembler::getAtom(const MCAsmLayout &Layout,
297                                          const MCSymbolData *SD) const {
298   // Linker visible symbols define atoms.
299   if (isSymbolLinkerVisible(SD))
300     return SD;
301
302   // Absolute and undefined symbols have no defining atom.
303   if (!SD->getFragment())
304     return 0;
305
306   // Non-linker visible symbols in sections which can't be atomized have no
307   // defining atom.
308   if (!getBackend().isSectionAtomizable(
309         SD->getFragment()->getParent()->getSection()))
310     return 0;
311
312   // Otherwise, return the atom for the containing fragment.
313   return SD->getFragment()->getAtom();
314 }
315
316 bool MCAssembler::EvaluateFixup(const MCAsmLayout &Layout,
317                                 const MCAsmFixup &Fixup, const MCFragment *DF,
318                                 MCValue &Target, uint64_t &Value) const {
319   ++stats::EvaluateFixup;
320
321   if (!Fixup.Value->EvaluateAsRelocatable(Target, &Layout))
322     report_fatal_error("expected relocatable expression");
323
324   // FIXME: How do non-scattered symbols work in ELF? I presume the linker
325   // doesn't support small relocations, but then under what criteria does the
326   // assembler allow symbol differences?
327
328   Value = Target.getConstant();
329
330   bool IsPCRel =
331     Emitter.getFixupKindInfo(Fixup.Kind).Flags & MCFixupKindInfo::FKF_IsPCRel;
332   bool IsResolved = true;
333   if (const MCSymbolRefExpr *A = Target.getSymA()) {
334     if (A->getSymbol().isDefined())
335       Value += Layout.getSymbolAddress(&getSymbolData(A->getSymbol()));
336     else
337       IsResolved = false;
338   }
339   if (const MCSymbolRefExpr *B = Target.getSymB()) {
340     if (B->getSymbol().isDefined())
341       Value -= Layout.getSymbolAddress(&getSymbolData(B->getSymbol()));
342     else
343       IsResolved = false;
344   }
345
346   // If we are using scattered symbols, determine whether this value is actually
347   // resolved; scattering may cause atoms to move.
348   if (IsResolved && getBackend().hasScatteredSymbols()) {
349     if (getBackend().hasReliableSymbolDifference()) {
350       // If this is a PCrel relocation, find the base atom (identified by its
351       // symbol) that the fixup value is relative to.
352       const MCSymbolData *BaseSymbol = 0;
353       if (IsPCRel) {
354         BaseSymbol = DF->getAtom();
355         if (!BaseSymbol)
356           IsResolved = false;
357       }
358
359       if (IsResolved)
360         IsResolved = isScatteredFixupFullyResolved(*this, Layout, Fixup, Target,
361                                                    BaseSymbol);
362     } else {
363       const MCSection *BaseSection = 0;
364       if (IsPCRel)
365         BaseSection = &DF->getParent()->getSection();
366
367       IsResolved = isScatteredFixupFullyResolvedSimple(*this, Fixup, Target,
368                                                        BaseSection);
369     }
370   }
371
372   if (IsPCRel)
373     Value -= Layout.getFragmentAddress(DF) + Fixup.Offset;
374
375   return IsResolved;
376 }
377
378 void MCAssembler::LayoutFragment(MCAsmLayout &Layout, MCFragment &F) {
379   uint64_t StartAddress = Layout.getSectionAddress(F.getParent());
380
381   // Get the fragment start address.
382   uint64_t Address = StartAddress;
383   MCSectionData::iterator it = &F;
384   if (MCFragment *Prev = F.getPrevNode())
385     Address = (StartAddress + Layout.getFragmentOffset(Prev) +
386                Layout.getFragmentEffectiveSize(Prev));
387
388   ++stats::FragmentLayouts;
389
390   uint64_t FragmentOffset = Address - StartAddress;
391   Layout.setFragmentOffset(&F, FragmentOffset);
392
393   // Evaluate fragment size.
394   uint64_t EffectiveSize = 0;
395   switch (F.getKind()) {
396   case MCFragment::FT_Align: {
397     MCAlignFragment &AF = cast<MCAlignFragment>(F);
398
399     assert((!AF.hasOnlyAlignAddress() || !AF.getNextNode()) &&
400            "Invalid OnlyAlignAddress bit, not the last fragment!");
401
402     EffectiveSize = OffsetToAlignment(Address, AF.getAlignment());
403     if (EffectiveSize > AF.getMaxBytesToEmit())
404       EffectiveSize = 0;
405     break;
406   }
407
408   case MCFragment::FT_Data:
409     EffectiveSize = cast<MCDataFragment>(F).getContents().size();
410     break;
411
412   case MCFragment::FT_Fill: {
413     EffectiveSize = cast<MCFillFragment>(F).getSize();
414     break;
415   }
416
417   case MCFragment::FT_Inst:
418     EffectiveSize = cast<MCInstFragment>(F).getInstSize();
419     break;
420
421   case MCFragment::FT_Org: {
422     MCOrgFragment &OF = cast<MCOrgFragment>(F);
423
424     int64_t TargetLocation;
425     if (!OF.getOffset().EvaluateAsAbsolute(TargetLocation, &Layout))
426       report_fatal_error("expected assembly-time absolute expression");
427
428     // FIXME: We need a way to communicate this error.
429     int64_t Offset = TargetLocation - FragmentOffset;
430     if (Offset < 0)
431       report_fatal_error("invalid .org offset '" + Twine(TargetLocation) +
432                          "' (at offset '" + Twine(FragmentOffset) + "'");
433
434     EffectiveSize = Offset;
435     break;
436   }
437   }
438
439   Layout.setFragmentEffectiveSize(&F, EffectiveSize);
440 }
441
442 void MCAssembler::LayoutSection(MCAsmLayout &Layout,
443                                 unsigned SectionOrderIndex) {
444   MCSectionData &SD = *Layout.getSectionOrder()[SectionOrderIndex];
445
446   ++stats::SectionLayouts;
447
448   // Compute the section start address.
449   uint64_t StartAddress = 0;
450   if (SectionOrderIndex) {
451     MCSectionData *Prev = Layout.getSectionOrder()[SectionOrderIndex - 1];
452     StartAddress = (Layout.getSectionAddress(Prev) +
453                     Layout.getSectionAddressSize(Prev));
454   }
455
456   // Honor the section alignment requirements.
457   StartAddress = RoundUpToAlignment(StartAddress, SD.getAlignment());
458
459   // Set the section address.
460   Layout.setSectionAddress(&SD, StartAddress);
461
462   for (MCSectionData::iterator it = SD.begin(), ie = SD.end(); it != ie; ++it)
463     LayoutFragment(Layout, *it);
464 }
465
466 /// WriteFragmentData - Write the \arg F data to the output file.
467 static void WriteFragmentData(const MCAssembler &Asm, const MCAsmLayout &Layout,
468                               const MCFragment &F, MCObjectWriter *OW) {
469   uint64_t Start = OW->getStream().tell();
470   (void) Start;
471
472   ++stats::EmittedFragments;
473
474   // FIXME: Embed in fragments instead?
475   uint64_t FragmentSize = Layout.getFragmentEffectiveSize(&F);
476   switch (F.getKind()) {
477   case MCFragment::FT_Align: {
478     MCAlignFragment &AF = cast<MCAlignFragment>(F);
479     uint64_t Count = FragmentSize / AF.getValueSize();
480
481     assert(AF.getValueSize() && "Invalid virtual align in concrete fragment!");
482
483     // FIXME: This error shouldn't actually occur (the front end should emit
484     // multiple .align directives to enforce the semantics it wants), but is
485     // severe enough that we want to report it. How to handle this?
486     if (Count * AF.getValueSize() != FragmentSize)
487       report_fatal_error("undefined .align directive, value size '" +
488                         Twine(AF.getValueSize()) +
489                         "' is not a divisor of padding size '" +
490                         Twine(FragmentSize) + "'");
491
492     // See if we are aligning with nops, and if so do that first to try to fill
493     // the Count bytes.  Then if that did not fill any bytes or there are any
494     // bytes left to fill use the the Value and ValueSize to fill the rest.
495     // If we are aligning with nops, ask that target to emit the right data.
496     if (AF.hasEmitNops()) {
497       if (!Asm.getBackend().WriteNopData(Count, OW))
498         report_fatal_error("unable to write nop sequence of " +
499                           Twine(Count) + " bytes");
500       break;
501     }
502
503     // Otherwise, write out in multiples of the value size.
504     for (uint64_t i = 0; i != Count; ++i) {
505       switch (AF.getValueSize()) {
506       default:
507         assert(0 && "Invalid size!");
508       case 1: OW->Write8 (uint8_t (AF.getValue())); break;
509       case 2: OW->Write16(uint16_t(AF.getValue())); break;
510       case 4: OW->Write32(uint32_t(AF.getValue())); break;
511       case 8: OW->Write64(uint64_t(AF.getValue())); break;
512       }
513     }
514     break;
515   }
516
517   case MCFragment::FT_Data: {
518     MCDataFragment &DF = cast<MCDataFragment>(F);
519     assert(FragmentSize == DF.getContents().size() && "Invalid size!");
520     OW->WriteBytes(DF.getContents().str());
521     break;
522   }
523
524   case MCFragment::FT_Fill: {
525     MCFillFragment &FF = cast<MCFillFragment>(F);
526
527     assert(FF.getValueSize() && "Invalid virtual align in concrete fragment!");
528
529     for (uint64_t i = 0, e = FF.getSize() / FF.getValueSize(); i != e; ++i) {
530       switch (FF.getValueSize()) {
531       default:
532         assert(0 && "Invalid size!");
533       case 1: OW->Write8 (uint8_t (FF.getValue())); break;
534       case 2: OW->Write16(uint16_t(FF.getValue())); break;
535       case 4: OW->Write32(uint32_t(FF.getValue())); break;
536       case 8: OW->Write64(uint64_t(FF.getValue())); break;
537       }
538     }
539     break;
540   }
541
542   case MCFragment::FT_Inst:
543     llvm_unreachable("unexpected inst fragment after lowering");
544     break;
545
546   case MCFragment::FT_Org: {
547     MCOrgFragment &OF = cast<MCOrgFragment>(F);
548
549     for (uint64_t i = 0, e = FragmentSize; i != e; ++i)
550       OW->Write8(uint8_t(OF.getValue()));
551
552     break;
553   }
554   }
555
556   assert(OW->getStream().tell() - Start == FragmentSize);
557 }
558
559 void MCAssembler::WriteSectionData(const MCSectionData *SD,
560                                    const MCAsmLayout &Layout,
561                                    MCObjectWriter *OW) const {
562   // Ignore virtual sections.
563   if (getBackend().isVirtualSection(SD->getSection())) {
564     assert(Layout.getSectionFileSize(SD) == 0 && "Invalid size for section!");
565
566     // Check that contents are only things legal inside a virtual section.
567     for (MCSectionData::const_iterator it = SD->begin(),
568            ie = SD->end(); it != ie; ++it) {
569       switch (it->getKind()) {
570       default:
571         assert(0 && "Invalid fragment in virtual section!");
572       case MCFragment::FT_Align:
573         assert(!cast<MCAlignFragment>(it)->getValueSize() &&
574                "Invalid align in virtual section!");
575         break;
576       case MCFragment::FT_Fill:
577         assert(!cast<MCFillFragment>(it)->getValueSize() &&
578                "Invalid fill in virtual section!");
579         break;
580       }
581     }
582
583     return;
584   }
585
586   uint64_t Start = OW->getStream().tell();
587   (void) Start;
588
589   for (MCSectionData::const_iterator it = SD->begin(),
590          ie = SD->end(); it != ie; ++it)
591     WriteFragmentData(*this, Layout, *it, OW);
592
593   assert(OW->getStream().tell() - Start == Layout.getSectionFileSize(SD));
594 }
595
596 void MCAssembler::Finish() {
597   DEBUG_WITH_TYPE("mc-dump", {
598       llvm::errs() << "assembler backend - pre-layout\n--\n";
599       dump(); });
600
601   // Assign section and fragment ordinals, all subsequent backend code is
602   // responsible for updating these in place.
603   unsigned SectionIndex = 0;
604   unsigned FragmentIndex = 0;
605   for (MCAssembler::iterator it = begin(), ie = end(); it != ie; ++it) {
606     // Create dummy fragments to eliminate any empty sections, this simplifies
607     // layout.
608     if (it->getFragmentList().empty()) {
609       unsigned ValueSize = 1;
610       if (getBackend().isVirtualSection(it->getSection()))
611         ValueSize = 1;
612       new MCFillFragment(0, 1, 0, it);
613     }
614
615     it->setOrdinal(SectionIndex++);
616
617     for (MCSectionData::iterator it2 = it->begin(),
618            ie2 = it->end(); it2 != ie2; ++it2)
619       it2->setOrdinal(FragmentIndex++);
620   }
621
622   // Create the layout object.
623   MCAsmLayout Layout(*this);
624
625   // Insert additional align fragments for concrete sections to explicitly pad
626   // the previous section to match their alignment requirements. This is for
627   // 'gas' compatibility, it shouldn't strictly be necessary.
628   //
629   // FIXME: This may be Mach-O specific.
630   for (unsigned i = 1, e = Layout.getSectionOrder().size(); i < e; ++i) {
631     MCSectionData *SD = Layout.getSectionOrder()[i];
632
633     // Ignore sections without alignment requirements.
634     unsigned Align = SD->getAlignment();
635     if (Align <= 1)
636       continue;
637
638     // Ignore virtual sections, they don't cause file size modifications.
639     if (getBackend().isVirtualSection(SD->getSection()))
640       continue;
641
642     // Otherwise, create a new align fragment at the end of the previous
643     // section.
644     MCAlignFragment *AF = new MCAlignFragment(Align, 0, 1, Align,
645                                               Layout.getSectionOrder()[i - 1]);
646     AF->setOnlyAlignAddress(true);
647   }
648
649   // Layout until everything fits.
650   while (LayoutOnce(Layout))
651     continue;
652
653   DEBUG_WITH_TYPE("mc-dump", {
654       llvm::errs() << "assembler backend - post-relaxation\n--\n";
655       dump(); });
656
657   // Finalize the layout, including fragment lowering.
658   FinishLayout(Layout);
659
660   DEBUG_WITH_TYPE("mc-dump", {
661       llvm::errs() << "assembler backend - final-layout\n--\n";
662       dump(); });
663
664   uint64_t StartOffset = OS.tell();
665   llvm::OwningPtr<MCObjectWriter> Writer(getBackend().createObjectWriter(OS));
666   if (!Writer)
667     report_fatal_error("unable to create object writer!");
668
669   // Allow the object writer a chance to perform post-layout binding (for
670   // example, to set the index fields in the symbol data).
671   Writer->ExecutePostLayoutBinding(*this);
672
673   // Evaluate and apply the fixups, generating relocation entries as necessary.
674   for (MCAssembler::iterator it = begin(), ie = end(); it != ie; ++it) {
675     for (MCSectionData::iterator it2 = it->begin(),
676            ie2 = it->end(); it2 != ie2; ++it2) {
677       MCDataFragment *DF = dyn_cast<MCDataFragment>(it2);
678       if (!DF)
679         continue;
680
681       for (MCDataFragment::fixup_iterator it3 = DF->fixup_begin(),
682              ie3 = DF->fixup_end(); it3 != ie3; ++it3) {
683         MCAsmFixup &Fixup = *it3;
684
685         // Evaluate the fixup.
686         MCValue Target;
687         uint64_t FixedValue;
688         if (!EvaluateFixup(Layout, Fixup, DF, Target, FixedValue)) {
689           // The fixup was unresolved, we need a relocation. Inform the object
690           // writer of the relocation, and give it an opportunity to adjust the
691           // fixup value if need be.
692           Writer->RecordRelocation(*this, Layout, DF, Fixup, Target,FixedValue);
693         }
694
695         getBackend().ApplyFixup(Fixup, *DF, FixedValue);
696       }
697     }
698   }
699
700   // Write the object file.
701   Writer->WriteObject(*this, Layout);
702   OS.flush();
703
704   stats::ObjectBytes += OS.tell() - StartOffset;
705 }
706
707 bool MCAssembler::FixupNeedsRelaxation(const MCAsmFixup &Fixup,
708                                        const MCFragment *DF,
709                                        const MCAsmLayout &Layout) const {
710   if (getRelaxAll())
711     return true;
712
713   // If we cannot resolve the fixup value, it requires relaxation.
714   MCValue Target;
715   uint64_t Value;
716   if (!EvaluateFixup(Layout, Fixup, DF, Target, Value))
717     return true;
718
719   // Otherwise, relax if the value is too big for a (signed) i8.
720   //
721   // FIXME: This is target dependent!
722   return int64_t(Value) != int64_t(int8_t(Value));
723 }
724
725 bool MCAssembler::FragmentNeedsRelaxation(const MCInstFragment *IF,
726                                           const MCAsmLayout &Layout) const {
727   // If this inst doesn't ever need relaxation, ignore it. This occurs when we
728   // are intentionally pushing out inst fragments, or because we relaxed a
729   // previous instruction to one that doesn't need relaxation.
730   if (!getBackend().MayNeedRelaxation(IF->getInst(), IF->getFixups()))
731     return false;
732
733   for (MCInstFragment::const_fixup_iterator it = IF->fixup_begin(),
734          ie = IF->fixup_end(); it != ie; ++it)
735     if (FixupNeedsRelaxation(*it, IF, Layout))
736       return true;
737
738   return false;
739 }
740
741 bool MCAssembler::LayoutOnce(MCAsmLayout &Layout) {
742   ++stats::RelaxationSteps;
743
744   // Layout the sections in order.
745   for (unsigned i = 0, e = Layout.getSectionOrder().size(); i != e; ++i)
746     LayoutSection(Layout, i);
747
748   // Scan for fragments that need relaxation.
749   bool WasRelaxed = false;
750   for (iterator it = begin(), ie = end(); it != ie; ++it) {
751     MCSectionData &SD = *it;
752
753     for (MCSectionData::iterator it2 = SD.begin(),
754            ie2 = SD.end(); it2 != ie2; ++it2) {
755       // Check if this is an instruction fragment that needs relaxation.
756       MCInstFragment *IF = dyn_cast<MCInstFragment>(it2);
757       if (!IF || !FragmentNeedsRelaxation(IF, Layout))
758         continue;
759
760       ++stats::RelaxedInstructions;
761
762       // FIXME-PERF: We could immediately lower out instructions if we can tell
763       // they are fully resolved, to avoid retesting on later passes.
764
765       // Relax the fragment.
766
767       MCInst Relaxed;
768       getBackend().RelaxInstruction(IF, Relaxed);
769
770       // Encode the new instruction.
771       //
772       // FIXME-PERF: If it matters, we could let the target do this. It can
773       // probably do so more efficiently in many cases.
774       SmallVector<MCFixup, 4> Fixups;
775       SmallString<256> Code;
776       raw_svector_ostream VecOS(Code);
777       getEmitter().EncodeInstruction(Relaxed, VecOS, Fixups);
778       VecOS.flush();
779
780       // Update the instruction fragment.
781       int SlideAmount = Code.size() - IF->getInstSize();
782       IF->setInst(Relaxed);
783       IF->getCode() = Code;
784       IF->getFixups().clear();
785       for (unsigned i = 0, e = Fixups.size(); i != e; ++i) {
786         MCFixup &F = Fixups[i];
787         IF->getFixups().push_back(MCAsmFixup(F.getOffset(), *F.getValue(),
788                                              F.getKind()));
789       }
790
791       // Update the layout, and remember that we relaxed. If we are relaxing
792       // everything, we can skip this step since nothing will depend on updating
793       // the values.
794       if (!getRelaxAll())
795         Layout.UpdateForSlide(IF, SlideAmount);
796       WasRelaxed = true;
797     }
798   }
799
800   return WasRelaxed;
801 }
802
803 void MCAssembler::FinishLayout(MCAsmLayout &Layout) {
804   // Lower out any instruction fragments, to simplify the fixup application and
805   // output.
806   //
807   // FIXME-PERF: We don't have to do this, but the assumption is that it is
808   // cheap (we will mostly end up eliminating fragments and appending on to data
809   // fragments), so the extra complexity downstream isn't worth it. Evaluate
810   // this assumption.
811   for (iterator it = begin(), ie = end(); it != ie; ++it) {
812     MCSectionData &SD = *it;
813
814     for (MCSectionData::iterator it2 = SD.begin(),
815            ie2 = SD.end(); it2 != ie2; ++it2) {
816       MCInstFragment *IF = dyn_cast<MCInstFragment>(it2);
817       if (!IF)
818         continue;
819
820       // Create a new data fragment for the instruction.
821       //
822       // FIXME-PERF: Reuse previous data fragment if possible.
823       MCDataFragment *DF = new MCDataFragment();
824       SD.getFragmentList().insert(it2, DF);
825
826       // Update the data fragments layout data.
827       DF->setParent(IF->getParent());
828       DF->setAtom(IF->getAtom());
829       DF->setOrdinal(IF->getOrdinal());
830       Layout.FragmentReplaced(IF, DF);
831
832       // Copy in the data and the fixups.
833       DF->getContents().append(IF->getCode().begin(), IF->getCode().end());
834       for (unsigned i = 0, e = IF->getFixups().size(); i != e; ++i)
835         DF->getFixups().push_back(IF->getFixups()[i]);
836
837       // Delete the instruction fragment and update the iterator.
838       SD.getFragmentList().erase(IF);
839       it2 = DF;
840     }
841   }
842 }
843
844 // Debugging methods
845
846 namespace llvm {
847
848 raw_ostream &operator<<(raw_ostream &OS, const MCAsmFixup &AF) {
849   OS << "<MCAsmFixup" << " Offset:" << AF.Offset << " Value:" << *AF.Value
850      << " Kind:" << AF.Kind << ">";
851   return OS;
852 }
853
854 }
855
856 void MCFragment::dump() {
857   raw_ostream &OS = llvm::errs();
858
859   OS << "<MCFragment " << (void*) this << " Offset:" << Offset
860      << " EffectiveSize:" << EffectiveSize << ">";
861 }
862
863 void MCAlignFragment::dump() {
864   raw_ostream &OS = llvm::errs();
865
866   OS << "<MCAlignFragment ";
867   this->MCFragment::dump();
868   if (hasEmitNops())
869     OS << " (emit nops)";
870   if (hasOnlyAlignAddress())
871     OS << " (only align section)";
872   OS << "\n       ";
873   OS << " Alignment:" << getAlignment()
874      << " Value:" << getValue() << " ValueSize:" << getValueSize()
875      << " MaxBytesToEmit:" << getMaxBytesToEmit() << ">";
876 }
877
878 void MCDataFragment::dump() {
879   raw_ostream &OS = llvm::errs();
880
881   OS << "<MCDataFragment ";
882   this->MCFragment::dump();
883   OS << "\n       ";
884   OS << " Contents:[";
885   for (unsigned i = 0, e = getContents().size(); i != e; ++i) {
886     if (i) OS << ",";
887     OS << hexdigit((Contents[i] >> 4) & 0xF) << hexdigit(Contents[i] & 0xF);
888   }
889   OS << "] (" << getContents().size() << " bytes)";
890
891   if (!getFixups().empty()) {
892     OS << ",\n       ";
893     OS << " Fixups:[";
894     for (fixup_iterator it = fixup_begin(), ie = fixup_end(); it != ie; ++it) {
895       if (it != fixup_begin()) OS << ",\n                ";
896       OS << *it;
897     }
898     OS << "]";
899   }
900
901   OS << ">";
902 }
903
904 void MCFillFragment::dump() {
905   raw_ostream &OS = llvm::errs();
906
907   OS << "<MCFillFragment ";
908   this->MCFragment::dump();
909   OS << "\n       ";
910   OS << " Value:" << getValue() << " ValueSize:" << getValueSize()
911      << " Size:" << getSize() << ">";
912 }
913
914 void MCInstFragment::dump() {
915   raw_ostream &OS = llvm::errs();
916
917   OS << "<MCInstFragment ";
918   this->MCFragment::dump();
919   OS << "\n       ";
920   OS << " Inst:";
921   getInst().dump_pretty(OS);
922   OS << ">";
923 }
924
925 void MCOrgFragment::dump() {
926   raw_ostream &OS = llvm::errs();
927
928   OS << "<MCOrgFragment ";
929   this->MCFragment::dump();
930   OS << "\n       ";
931   OS << " Offset:" << getOffset() << " Value:" << getValue() << ">";
932 }
933
934 void MCSectionData::dump() {
935   raw_ostream &OS = llvm::errs();
936
937   OS << "<MCSectionData";
938   OS << " Alignment:" << getAlignment() << " Address:" << Address
939      << " Fragments:[\n      ";
940   for (iterator it = begin(), ie = end(); it != ie; ++it) {
941     if (it != begin()) OS << ",\n      ";
942     it->dump();
943   }
944   OS << "]>";
945 }
946
947 void MCSymbolData::dump() {
948   raw_ostream &OS = llvm::errs();
949
950   OS << "<MCSymbolData Symbol:" << getSymbol()
951      << " Fragment:" << getFragment() << " Offset:" << getOffset()
952      << " Flags:" << getFlags() << " Index:" << getIndex();
953   if (isCommon())
954     OS << " (common, size:" << getCommonSize()
955        << " align: " << getCommonAlignment() << ")";
956   if (isExternal())
957     OS << " (external)";
958   if (isPrivateExtern())
959     OS << " (private extern)";
960   OS << ">";
961 }
962
963 void MCAssembler::dump() {
964   raw_ostream &OS = llvm::errs();
965
966   OS << "<MCAssembler\n";
967   OS << "  Sections:[\n    ";
968   for (iterator it = begin(), ie = end(); it != ie; ++it) {
969     if (it != begin()) OS << ",\n    ";
970     it->dump();
971   }
972   OS << "],\n";
973   OS << "  Symbols:[";
974
975   for (symbol_iterator it = symbol_begin(), ie = symbol_end(); it != ie; ++it) {
976     if (it != symbol_begin()) OS << ",\n           ";
977     it->dump();
978   }
979   OS << "]>\n";
980 }