5fb1c52330f24a46ef8bf1e05915f0b36a03eabe
[oota-llvm.git] / tools / llvm-dwp / llvm-dwp.cpp
1 #include "llvm/ADT/STLExtras.h"
2 #include "llvm/ADT/StringSet.h"
3 #include "llvm/CodeGen/AsmPrinter.h"
4 #include "llvm/DebugInfo/DWARF/DWARFFormValue.h"
5 #include "llvm/DebugInfo/DWARF/DWARFUnitIndex.h"
6 #include "llvm/MC/MCAsmInfo.h"
7 #include "llvm/MC/MCContext.h"
8 #include "llvm/MC/MCInstrInfo.h"
9 #include "llvm/MC/MCObjectFileInfo.h"
10 #include "llvm/MC/MCRegisterInfo.h"
11 #include "llvm/MC/MCSectionELF.h"
12 #include "llvm/MC/MCStreamer.h"
13 #include "llvm/Object/ObjectFile.h"
14 #include "llvm/Support/DataExtractor.h"
15 #include "llvm/Support/FileSystem.h"
16 #include "llvm/Support/MathExtras.h"
17 #include "llvm/Support/MemoryBuffer.h"
18 #include "llvm/Support/Options.h"
19 #include "llvm/Support/TargetRegistry.h"
20 #include "llvm/Support/TargetSelect.h"
21 #include "llvm/Support/raw_ostream.h"
22 #include "llvm/Target/TargetMachine.h"
23 #include <list>
24 #include <memory>
25 #include <unordered_set>
26
27 using namespace llvm;
28 using namespace llvm::object;
29 using namespace cl;
30
31 OptionCategory DwpCategory("Specific Options");
32 static list<std::string> InputFiles(Positional, OneOrMore,
33                                     desc("<input files>"), cat(DwpCategory));
34
35 static opt<std::string> OutputFilename(Required, "o",
36                                        desc("Specify the output file."),
37                                        value_desc("filename"),
38                                        cat(DwpCategory));
39
40 static int error(const Twine &Error, const Twine &Context) {
41   errs() << Twine("while processing ") + Context + ":\n";
42   errs() << Twine("error: ") + Error + "\n";
43   return 1;
44 }
45
46 static std::error_code
47 writeStringsAndOffsets(MCStreamer &Out, StringMap<uint32_t> &Strings,
48                        uint32_t &StringOffset, MCSection *StrSection,
49                        MCSection *StrOffsetSection, StringRef CurStrSection,
50                        StringRef CurStrOffsetSection) {
51   // Could possibly produce an error or warning if one of these was non-null but
52   // the other was null.
53   if (CurStrSection.empty() || CurStrOffsetSection.empty())
54     return std::error_code();
55
56   DenseMap<uint32_t, uint32_t> OffsetRemapping;
57
58   DataExtractor Data(CurStrSection, true, 0);
59   uint32_t LocalOffset = 0;
60   uint32_t PrevOffset = 0;
61   while (const char *s = Data.getCStr(&LocalOffset)) {
62     StringRef Str(s, LocalOffset - PrevOffset - 1);
63     auto Pair = Strings.insert(std::make_pair(Str, StringOffset));
64     if (Pair.second) {
65       Out.SwitchSection(StrSection);
66       Out.EmitBytes(
67           StringRef(Pair.first->getKeyData(), Pair.first->getKeyLength() + 1));
68       StringOffset += Str.size() + 1;
69     }
70     OffsetRemapping[PrevOffset] = Pair.first->second;
71     PrevOffset = LocalOffset;
72   }
73
74   Data = DataExtractor(CurStrOffsetSection, true, 0);
75
76   Out.SwitchSection(StrOffsetSection);
77
78   uint32_t Offset = 0;
79   uint64_t Size = CurStrOffsetSection.size();
80   while (Offset < Size) {
81     auto OldOffset = Data.getU32(&Offset);
82     auto NewOffset = OffsetRemapping[OldOffset];
83     Out.EmitIntValue(NewOffset, 4);
84   }
85
86   return std::error_code();
87 }
88
89 static uint32_t getCUAbbrev(StringRef Abbrev, uint64_t AbbrCode) {
90   uint64_t CurCode;
91   uint32_t Offset = 0;
92   DataExtractor AbbrevData(Abbrev, true, 0);
93   while ((CurCode = AbbrevData.getULEB128(&Offset)) != AbbrCode) {
94     // Tag
95     AbbrevData.getULEB128(&Offset);
96     // DW_CHILDREN
97     AbbrevData.getU8(&Offset);
98     // Attributes
99     while (AbbrevData.getULEB128(&Offset) | AbbrevData.getULEB128(&Offset))
100       ;
101   }
102   return Offset;
103 }
104
105 static uint64_t getCUSignature(StringRef Abbrev, StringRef Info) {
106   uint32_t Offset = 0;
107   DataExtractor InfoData(Info, true, 0);
108   InfoData.getU32(&Offset); // Length
109   uint16_t Version = InfoData.getU16(&Offset);
110   InfoData.getU32(&Offset); // Abbrev offset (should be zero)
111   uint8_t AddrSize = InfoData.getU8(&Offset);
112
113   uint32_t AbbrCode = InfoData.getULEB128(&Offset);
114
115   DataExtractor AbbrevData(Abbrev, true, 0);
116   uint32_t AbbrevOffset = getCUAbbrev(Abbrev, AbbrCode);
117   uint64_t Tag = AbbrevData.getULEB128(&AbbrevOffset);
118   (void)Tag;
119   // FIXME: Real error handling
120   assert(Tag == dwarf::DW_TAG_compile_unit);
121   // DW_CHILDREN
122   AbbrevData.getU8(&AbbrevOffset);
123   uint32_t Name;
124   uint32_t Form;
125   while ((Name = AbbrevData.getULEB128(&AbbrevOffset)) |
126              (Form = AbbrevData.getULEB128(&AbbrevOffset)) &&
127          Name != dwarf::DW_AT_GNU_dwo_id) {
128     DWARFFormValue::skipValue(Form, InfoData, &Offset, Version, AddrSize);
129   }
130   // FIXME: Real error handling
131   assert(Name == dwarf::DW_AT_GNU_dwo_id);
132   return InfoData.getU64(&Offset);
133 }
134
135 struct UnitIndexEntry {
136   uint64_t Signature;
137   DWARFUnitIndex::Entry::SectionContribution Contributions[8];
138 };
139
140 static void addAllTypes(MCStreamer &Out,
141                         std::vector<UnitIndexEntry> &TypeIndexEntries,
142                         MCSection *OutputTypes, StringRef Types,
143                         const UnitIndexEntry &CUEntry, uint32_t &TypesOffset) {
144   if (Types.empty())
145     return;
146
147   Out.SwitchSection(OutputTypes);
148   uint32_t Offset = 0;
149   DataExtractor Data(Types, true, 0);
150   while (Data.isValidOffset(Offset)) {
151     UnitIndexEntry Entry = CUEntry;
152     // Zero out the debug_info contribution
153     Entry.Contributions[0] = {};
154     auto &C = Entry.Contributions[DW_SECT_TYPES - DW_SECT_INFO];
155     C.Offset = TypesOffset;
156     auto PrevOffset = Offset;
157     // Length of the unit, including the 4 byte length field.
158     C.Length = Data.getU32(&Offset) + 4;
159
160     Data.getU16(&Offset); // Version
161     Data.getU32(&Offset); // Abbrev offset
162     Data.getU8(&Offset);  // Address size
163     Entry.Signature = Data.getU64(&Offset);
164     Offset = PrevOffset + C.Length;
165
166     if (any_of(TypeIndexEntries, [&](const UnitIndexEntry &E) {
167           return E.Signature == Entry.Signature;
168         }))
169       continue;
170
171     Out.EmitBytes(Types.substr(PrevOffset, C.Length));
172     TypesOffset += C.Length;
173
174     TypeIndexEntries.push_back(Entry);
175   }
176 }
177
178 static void
179 writeIndexTable(MCStreamer &Out, ArrayRef<unsigned> ContributionOffsets,
180                 ArrayRef<UnitIndexEntry> IndexEntries,
181                 uint32_t DWARFUnitIndex::Entry::SectionContribution::*Field) {
182   for (const auto &E : IndexEntries)
183     for (size_t i = 0; i != array_lengthof(E.Contributions); ++i)
184       if (ContributionOffsets[i])
185         Out.EmitIntValue(E.Contributions[i].*Field, 4);
186 }
187
188 static void writeIndex(MCStreamer &Out, MCSection *Section,
189                        ArrayRef<unsigned> ContributionOffsets,
190                        ArrayRef<UnitIndexEntry> IndexEntries) {
191   unsigned Columns = 0;
192   for (auto &C : ContributionOffsets)
193     if (C)
194       ++Columns;
195
196   std::vector<unsigned> Buckets(NextPowerOf2(3 * IndexEntries.size() / 2));
197   uint64_t Mask = Buckets.size() - 1;
198   for (size_t i = 0; i != IndexEntries.size(); ++i) {
199     auto S = IndexEntries[i].Signature;
200     auto H = S & Mask;
201     while (Buckets[H]) {
202       assert(S != IndexEntries[Buckets[H] - 1].Signature &&
203              "Duplicate type unit");
204       H += ((S >> 32) & Mask) | 1;
205     }
206     Buckets[H] = i + 1;
207   }
208
209   Out.SwitchSection(Section);
210   Out.EmitIntValue(2, 4);                   // Version
211   Out.EmitIntValue(Columns, 4);             // Columns
212   Out.EmitIntValue(IndexEntries.size(), 4); // Num Units
213   Out.EmitIntValue(Buckets.size(), 4);      // Num Buckets
214
215   // Write the signatures.
216   for (const auto &I : Buckets)
217     Out.EmitIntValue(I ? IndexEntries[I - 1].Signature : 0, 8);
218
219   // Write the indexes.
220   for (const auto &I : Buckets)
221     Out.EmitIntValue(I, 4);
222
223   // Write the column headers (which sections will appear in the table)
224   for (size_t i = 0; i != ContributionOffsets.size(); ++i)
225     if (ContributionOffsets[i])
226       Out.EmitIntValue(i + DW_SECT_INFO, 4);
227
228   // Write the offsets.
229   writeIndexTable(Out, ContributionOffsets, IndexEntries,
230                   &DWARFUnitIndex::Entry::SectionContribution::Offset);
231
232   // Write the lengths.
233   writeIndexTable(Out, ContributionOffsets, IndexEntries,
234                   &DWARFUnitIndex::Entry::SectionContribution::Length);
235 }
236 static std::error_code write(MCStreamer &Out, ArrayRef<std::string> Inputs) {
237   const auto &MCOFI = *Out.getContext().getObjectFileInfo();
238   MCSection *const StrSection = MCOFI.getDwarfStrDWOSection();
239   MCSection *const StrOffsetSection = MCOFI.getDwarfStrOffDWOSection();
240   MCSection *const TypesSection = MCOFI.getDwarfTypesDWOSection();
241   const StringMap<std::pair<MCSection *, DWARFSectionKind>> KnownSections = {
242       {"debug_info.dwo", {MCOFI.getDwarfInfoDWOSection(), DW_SECT_INFO}},
243       {"debug_types.dwo", {MCOFI.getDwarfTypesDWOSection(), DW_SECT_TYPES}},
244       {"debug_str_offsets.dwo", {StrOffsetSection, DW_SECT_STR_OFFSETS}},
245       {"debug_str.dwo", {StrSection, static_cast<DWARFSectionKind>(0)}},
246       {"debug_loc.dwo", {MCOFI.getDwarfLocDWOSection(), DW_SECT_LOC}},
247       {"debug_line.dwo", {MCOFI.getDwarfLineDWOSection(), DW_SECT_LINE}},
248       {"debug_abbrev.dwo", {MCOFI.getDwarfAbbrevDWOSection(), DW_SECT_ABBREV}}};
249
250   std::vector<UnitIndexEntry> IndexEntries;
251   std::vector<UnitIndexEntry> TypeIndexEntries;
252
253   StringMap<uint32_t> Strings;
254   uint32_t StringOffset = 0;
255
256   uint32_t ContributionOffsets[8] = {};
257
258   for (const auto &Input : Inputs) {
259     auto ErrOrObj = object::ObjectFile::createObjectFile(Input);
260     if (!ErrOrObj)
261       return ErrOrObj.getError();
262
263     IndexEntries.emplace_back();
264     UnitIndexEntry &CurEntry = IndexEntries.back();
265
266     StringRef CurStrSection;
267     StringRef CurStrOffsetSection;
268     StringRef CurTypesSection;
269     StringRef InfoSection;
270     StringRef AbbrevSection;
271
272     for (const auto &Section : ErrOrObj->getBinary()->sections()) {
273       StringRef Name;
274       if (std::error_code Err = Section.getName(Name))
275         return Err;
276
277       auto SectionPair =
278           KnownSections.find(Name.substr(Name.find_first_not_of("._")));
279       if (SectionPair == KnownSections.end())
280         continue;
281
282       StringRef Contents;
283       if (auto Err = Section.getContents(Contents))
284         return Err;
285
286       if (DWARFSectionKind Kind = SectionPair->second.second) {
287         auto Index = Kind - DW_SECT_INFO;
288         if (Kind != DW_SECT_TYPES) {
289           CurEntry.Contributions[Index].Offset = ContributionOffsets[Index];
290           ContributionOffsets[Index] +=
291               (CurEntry.Contributions[Index].Length = Contents.size());
292         }
293
294         switch (Kind) {
295         case DW_SECT_INFO:
296           InfoSection = Contents;
297           break;
298         case DW_SECT_ABBREV:
299           AbbrevSection = Contents;
300           break;
301         default:
302           break;
303         }
304       }
305
306       MCSection *OutSection = SectionPair->second.first;
307       if (OutSection == StrOffsetSection)
308         CurStrOffsetSection = Contents;
309       else if (OutSection == StrSection)
310         CurStrSection = Contents;
311       else if (OutSection == TypesSection)
312         CurTypesSection = Contents;
313       else {
314         Out.SwitchSection(OutSection);
315         Out.EmitBytes(Contents);
316       }
317     }
318
319     assert(!AbbrevSection.empty());
320     assert(!InfoSection.empty());
321     CurEntry.Signature = getCUSignature(AbbrevSection, InfoSection);
322     addAllTypes(Out, TypeIndexEntries, TypesSection, CurTypesSection, CurEntry,
323                 ContributionOffsets[DW_SECT_TYPES - DW_SECT_INFO]);
324
325     if (auto Err = writeStringsAndOffsets(Out, Strings, StringOffset,
326                                           StrSection, StrOffsetSection,
327                                           CurStrSection, CurStrOffsetSection))
328       return Err;
329   }
330
331   if (!TypeIndexEntries.empty()) {
332     // Lie about there being no info contributions so the TU index only includes
333     // the type unit contribution
334     ContributionOffsets[0] = 0;
335     writeIndex(Out, MCOFI.getDwarfTUIndexSection(), ContributionOffsets,
336                TypeIndexEntries);
337   }
338
339   // Lie about the type contribution
340   ContributionOffsets[DW_SECT_TYPES - DW_SECT_INFO] = 0;
341   // Unlie about the info contribution
342   ContributionOffsets[0] = 1;
343
344   writeIndex(Out, MCOFI.getDwarfCUIndexSection(), ContributionOffsets,
345              IndexEntries);
346
347   return std::error_code();
348 }
349
350 int main(int argc, char **argv) {
351
352   ParseCommandLineOptions(argc, argv, "merge split dwarf (.dwo) files");
353
354   llvm::InitializeAllTargetInfos();
355   llvm::InitializeAllTargetMCs();
356   llvm::InitializeAllTargets();
357   llvm::InitializeAllAsmPrinters();
358
359   std::string ErrorStr;
360   StringRef Context = "dwarf streamer init";
361
362   Triple TheTriple("x86_64-linux-gnu");
363
364   // Get the target.
365   const Target *TheTarget =
366       TargetRegistry::lookupTarget("", TheTriple, ErrorStr);
367   if (!TheTarget)
368     return error(ErrorStr, Context);
369   std::string TripleName = TheTriple.getTriple();
370
371   // Create all the MC Objects.
372   std::unique_ptr<MCRegisterInfo> MRI(TheTarget->createMCRegInfo(TripleName));
373   if (!MRI)
374     return error(Twine("no register info for target ") + TripleName, Context);
375
376   std::unique_ptr<MCAsmInfo> MAI(TheTarget->createMCAsmInfo(*MRI, TripleName));
377   if (!MAI)
378     return error("no asm info for target " + TripleName, Context);
379
380   MCObjectFileInfo MOFI;
381   MCContext MC(MAI.get(), MRI.get(), &MOFI);
382   MOFI.InitMCObjectFileInfo(TheTriple, Reloc::Default, CodeModel::Default, MC);
383
384   auto MAB = TheTarget->createMCAsmBackend(*MRI, TripleName, "");
385   if (!MAB)
386     return error("no asm backend for target " + TripleName, Context);
387
388   std::unique_ptr<MCInstrInfo> MII(TheTarget->createMCInstrInfo());
389   if (!MII)
390     return error("no instr info info for target " + TripleName, Context);
391
392   std::unique_ptr<MCSubtargetInfo> MSTI(
393       TheTarget->createMCSubtargetInfo(TripleName, "", ""));
394   if (!MSTI)
395     return error("no subtarget info for target " + TripleName, Context);
396
397   MCCodeEmitter *MCE = TheTarget->createMCCodeEmitter(*MII, *MRI, MC);
398   if (!MCE)
399     return error("no code emitter for target " + TripleName, Context);
400
401   // Create the output file.
402   std::error_code EC;
403   raw_fd_ostream OutFile(OutputFilename, EC, sys::fs::F_None);
404   if (EC)
405     return error(Twine(OutputFilename) + ": " + EC.message(), Context);
406
407   std::unique_ptr<MCStreamer> MS(TheTarget->createMCObjectStreamer(
408       TheTriple, MC, *MAB, OutFile, MCE, *MSTI, false,
409       /*DWARFMustBeAtTheEnd*/ false));
410   if (!MS)
411     return error("no object streamer for target " + TripleName, Context);
412
413   if (auto Err = write(*MS, InputFiles))
414     return error(Err.message(), "Writing DWP file");
415
416   MS->Finish();
417 }