5b96d8070576acaaaec27fa3168d18eae3731c40
[oota-llvm.git] / tools / llvm-vtabledump / llvm-vtabledump.cpp
1 //===- llvm-vtabledump.cpp - Dump vtables in an Object File -----*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // Dumps VTables resident in object files and archives.  Note, it currently only
11 // supports MS-ABI style object files.
12 //
13 //===----------------------------------------------------------------------===//
14
15 #include "llvm-vtabledump.h"
16 #include "Error.h"
17 #include "llvm/ADT/ArrayRef.h"
18 #include "llvm/Object/Archive.h"
19 #include "llvm/Object/ObjectFile.h"
20 #include "llvm/Support/Debug.h"
21 #include "llvm/Support/Endian.h"
22 #include "llvm/Support/FileSystem.h"
23 #include "llvm/Support/ManagedStatic.h"
24 #include "llvm/Support/PrettyStackTrace.h"
25 #include "llvm/Support/Signals.h"
26 #include "llvm/Support/TargetRegistry.h"
27 #include "llvm/Support/TargetSelect.h"
28 #include <map>
29 #include <string>
30 #include <system_error>
31
32 using namespace llvm;
33 using namespace llvm::object;
34 using namespace llvm::support;
35
36 namespace opts {
37 cl::list<std::string> InputFilenames(cl::Positional,
38                                      cl::desc("<input object files>"),
39                                      cl::ZeroOrMore);
40 } // namespace opts
41
42 static int ReturnValue = EXIT_SUCCESS;
43
44 namespace llvm {
45
46 bool error(std::error_code EC) {
47   if (!EC)
48     return false;
49
50   ReturnValue = EXIT_FAILURE;
51   outs() << "\nError reading file: " << EC.message() << ".\n";
52   outs().flush();
53   return true;
54 }
55
56 } // namespace llvm
57
58 static void reportError(StringRef Input, StringRef Message) {
59   if (Input == "-")
60     Input = "<stdin>";
61
62   errs() << Input << ": " << Message << "\n";
63   errs().flush();
64   ReturnValue = EXIT_FAILURE;
65 }
66
67 static void reportError(StringRef Input, std::error_code EC) {
68   reportError(Input, EC.message());
69 }
70
71 static bool collectRelocatedSymbols(const ObjectFile *Obj,
72                                     object::section_iterator SecI, StringRef *I,
73                                     StringRef *E) {
74   for (const object::RelocationRef &Reloc : SecI->relocations()) {
75     if (I == E)
76       break;
77     const object::symbol_iterator RelocSymI = Reloc.getSymbol();
78     if (RelocSymI == Obj->symbol_end())
79       continue;
80     StringRef RelocSymName;
81     if (error(RelocSymI->getName(RelocSymName)))
82       return true;
83     *I = RelocSymName;
84     ++I;
85   }
86   return false;
87 }
88
89 static bool collectRelocationOffsets(
90     const ObjectFile *Obj, object::section_iterator SecI, StringRef SymName,
91     std::map<std::pair<StringRef, uint64_t>, StringRef> &Collection) {
92   for (const object::RelocationRef &Reloc : SecI->relocations()) {
93     const object::symbol_iterator RelocSymI = Reloc.getSymbol();
94     if (RelocSymI == Obj->symbol_end())
95       continue;
96     StringRef RelocSymName;
97     if (error(RelocSymI->getName(RelocSymName)))
98       return true;
99     uint64_t Offset;
100     if (error(Reloc.getOffset(Offset)))
101       return true;
102     Collection[std::make_pair(SymName, Offset)] = RelocSymName;
103   }
104   return false;
105 }
106
107 static void dumpVTables(const ObjectFile *Obj) {
108   struct CompleteObjectLocator {
109     StringRef Symbols[2];
110     ArrayRef<little32_t> Data;
111   };
112   struct ClassHierarchyDescriptor {
113     StringRef Symbols[1];
114     ArrayRef<little32_t> Data;
115   };
116   struct BaseClassDescriptor {
117     StringRef Symbols[2];
118     ArrayRef<little32_t> Data;
119   };
120   struct TypeDescriptor {
121     StringRef Symbols[1];
122     uint64_t AlwaysZero;
123     StringRef MangledName;
124   };
125   std::map<std::pair<StringRef, uint64_t>, StringRef> VFTableEntries;
126   std::map<StringRef, ArrayRef<little32_t>> VBTables;
127   std::map<StringRef, CompleteObjectLocator> COLs;
128   std::map<StringRef, ClassHierarchyDescriptor> CHDs;
129   std::map<std::pair<StringRef, uint64_t>, StringRef> BCAEntries;
130   std::map<StringRef, BaseClassDescriptor> BCDs;
131   std::map<StringRef, TypeDescriptor> TDs;
132   for (const object::SymbolRef &Sym : Obj->symbols()) {
133     StringRef SymName;
134     if (error(Sym.getName(SymName)))
135       return;
136     // VFTables in the MS-ABI start with '??_7' and are contained within their
137     // own COMDAT section.  We then determine the contents of the VFTable by
138     // looking at each relocation in the section.
139     if (SymName.startswith("??_7")) {
140       object::section_iterator SecI(Obj->section_begin());
141       if (error(Sym.getSection(SecI)))
142         return;
143       if (SecI == Obj->section_end())
144         continue;
145       // Each relocation either names a virtual method or a thunk.  We note the
146       // offset into the section and the symbol used for the relocation.
147       collectRelocationOffsets(Obj, SecI, SymName, VFTableEntries);
148     }
149     // VBTables in the MS-ABI start with '??_8' and are filled with 32-bit
150     // offsets of virtual bases.
151     else if (SymName.startswith("??_8")) {
152       object::section_iterator SecI(Obj->section_begin());
153       if (error(Sym.getSection(SecI)))
154         return;
155       if (SecI == Obj->section_end())
156         continue;
157       StringRef SecContents;
158       if (error(SecI->getContents(SecContents)))
159         return;
160
161       ArrayRef<little32_t> VBTableData(
162           reinterpret_cast<const little32_t *>(SecContents.data()),
163           SecContents.size() / sizeof(little32_t));
164       VBTables[SymName] = VBTableData;
165     }
166     // Complete object locators in the MS-ABI start with '??_R4'
167     else if (SymName.startswith("??_R4")) {
168       object::section_iterator SecI(Obj->section_begin());
169       if (error(Sym.getSection(SecI)))
170         return;
171       StringRef SecContents;
172       if (error(SecI->getContents(SecContents)))
173         return;
174       CompleteObjectLocator COL;
175       COL.Data = ArrayRef<little32_t>(
176           reinterpret_cast<const little32_t *>(SecContents.data()), 3);
177       StringRef *I = std::begin(COL.Symbols), *E = std::end(COL.Symbols);
178       if (collectRelocatedSymbols(Obj, SecI, I, E))
179         return;
180       COLs[SymName] = COL;
181     }
182     // Class hierarchy descriptors in the MS-ABI start with '??_R3'
183     else if (SymName.startswith("??_R3")) {
184       object::section_iterator SecI(Obj->section_begin());
185       if (error(Sym.getSection(SecI)))
186         return;
187       StringRef SecContents;
188       if (error(SecI->getContents(SecContents)))
189         return;
190       ClassHierarchyDescriptor CHD;
191       CHD.Data = ArrayRef<little32_t>(
192           reinterpret_cast<const little32_t *>(SecContents.data()), 3);
193       StringRef *I = std::begin(CHD.Symbols), *E = std::end(CHD.Symbols);
194       if (collectRelocatedSymbols(Obj, SecI, I, E))
195         return;
196       CHDs[SymName] = CHD;
197     }
198     // Class hierarchy descriptors in the MS-ABI start with '??_R2'
199     else if (SymName.startswith("??_R2")) {
200       object::section_iterator SecI(Obj->section_begin());
201       if (error(Sym.getSection(SecI)))
202         return;
203       if (SecI == Obj->section_end())
204         continue;
205       // Each relocation names a base class descriptor.  We note the offset into
206       // the section and the symbol used for the relocation.
207       collectRelocationOffsets(Obj, SecI, SymName, BCAEntries);
208     }
209     // Base class descriptors in the MS-ABI start with '??_R1'
210     else if (SymName.startswith("??_R1")) {
211       object::section_iterator SecI(Obj->section_begin());
212       if (error(Sym.getSection(SecI)))
213         return;
214       StringRef SecContents;
215       if (error(SecI->getContents(SecContents)))
216         return;
217       BaseClassDescriptor BCD;
218       BCD.Data = ArrayRef<little32_t>(
219           reinterpret_cast<const little32_t *>(SecContents.data()) + 1,
220           5);
221       StringRef *I = std::begin(BCD.Symbols), *E = std::end(BCD.Symbols);
222       if (collectRelocatedSymbols(Obj, SecI, I, E))
223         return;
224       BCDs[SymName] = BCD;
225     }
226     // Type descriptors in the MS-ABI start with '??_R0'
227     else if (SymName.startswith("??_R0")) {
228       object::section_iterator SecI(Obj->section_begin());
229       if (error(Sym.getSection(SecI)))
230         return;
231       StringRef SecContents;
232       if (error(SecI->getContents(SecContents)))
233         return;
234       uint8_t BytesInAddress = Obj->getBytesInAddress();
235       const char *DataPtr =
236           SecContents.drop_front(Obj->getBytesInAddress()).data();
237       TypeDescriptor TD;
238       if (BytesInAddress == 8)
239         TD.AlwaysZero = *reinterpret_cast<const little64_t *>(DataPtr);
240       else
241         TD.AlwaysZero = *reinterpret_cast<const little32_t *>(DataPtr);
242       TD.MangledName = SecContents.drop_front(Obj->getBytesInAddress() * 2);
243       StringRef *I = std::begin(TD.Symbols), *E = std::end(TD.Symbols);
244       if (collectRelocatedSymbols(Obj, SecI, I, E))
245         return;
246       TDs[SymName] = TD;
247     }
248   }
249   for (const std::pair<std::pair<StringRef, uint64_t>, StringRef> &VFTableEntry :
250        VFTableEntries) {
251     StringRef VFTableName = VFTableEntry.first.first;
252     uint64_t Offset = VFTableEntry.first.second;
253     StringRef SymName = VFTableEntry.second;
254     outs() << VFTableName << '[' << Offset << "]: " << SymName << '\n';
255   }
256   for (const std::pair<StringRef, ArrayRef<little32_t>> &VBTable :
257        VBTables) {
258     StringRef VBTableName = VBTable.first;
259     uint32_t Idx = 0;
260     for (little32_t Offset : VBTable.second) {
261       outs() << VBTableName << '[' << Idx << "]: " << Offset << '\n';
262       Idx += sizeof(Offset);
263     }
264   }
265   for (const std::pair<StringRef, CompleteObjectLocator> &COLPair : COLs) {
266     StringRef COLName = COLPair.first;
267     const CompleteObjectLocator &COL = COLPair.second;
268     outs() << COLName << "[IsImageRelative]: " << COL.Data[0] << '\n';
269     outs() << COLName << "[OffsetToTop]: " << COL.Data[1] << '\n';
270     outs() << COLName << "[VFPtrOffset]: " << COL.Data[2] << '\n';
271     outs() << COLName << "[TypeDescriptor]: " << COL.Symbols[0] << '\n';
272     outs() << COLName << "[ClassHierarchyDescriptor]: " << COL.Symbols[1] << '\n';
273   }
274   for (const std::pair<StringRef, ClassHierarchyDescriptor> &CHDPair : CHDs) {
275     StringRef CHDName = CHDPair.first;
276     const ClassHierarchyDescriptor &CHD = CHDPair.second;
277     outs() << CHDName << "[AlwaysZero]: " << CHD.Data[0] << '\n';
278     outs() << CHDName << "[Flags]: " << CHD.Data[1] << '\n';
279     outs() << CHDName << "[NumClasses]: " << CHD.Data[2] << '\n';
280     outs() << CHDName << "[BaseClassArray]: " << CHD.Symbols[0] << '\n';
281   }
282   for (const std::pair<std::pair<StringRef, uint64_t>, StringRef> &BCAEntry :
283        BCAEntries) {
284     StringRef BCAName = BCAEntry.first.first;
285     uint64_t Offset = BCAEntry.first.second;
286     StringRef SymName = BCAEntry.second;
287     outs() << BCAName << '[' << Offset << "]: " << SymName << '\n';
288   }
289   for (const std::pair<StringRef, BaseClassDescriptor> &BCDPair : BCDs) {
290     StringRef BCDName = BCDPair.first;
291     const BaseClassDescriptor &BCD = BCDPair.second;
292     outs() << BCDName << "[TypeDescriptor]: " << BCD.Symbols[0] << '\n';
293     outs() << BCDName << "[NumBases]: " << BCD.Data[0] << '\n';
294     outs() << BCDName << "[OffsetInVBase]: " << BCD.Data[1] << '\n';
295     outs() << BCDName << "[VBPtrOffset]: " << BCD.Data[2] << '\n';
296     outs() << BCDName << "[OffsetInVBTable]: " << BCD.Data[3] << '\n';
297     outs() << BCDName << "[Flags]: " << BCD.Data[4] << '\n';
298     outs() << BCDName << "[ClassHierarchyDescriptor]: " << BCD.Symbols[1] << '\n';
299   }
300   for (const std::pair<StringRef, TypeDescriptor> &TDPair : TDs) {
301     StringRef TDName = TDPair.first;
302     const TypeDescriptor &TD = TDPair.second;
303     outs() << TDName << "[VFPtr]: " << TD.Symbols[0] << '\n';
304     outs() << TDName << "[AlwaysZero]: " << TD.AlwaysZero << '\n';
305     outs() << TDName << "[MangledName]: ";
306     outs().write_escaped(TD.MangledName.rtrim(StringRef("\0", 1)),
307                          /*UseHexEscapes=*/true)
308         << '\n';
309   }
310 }
311
312 static void dumpArchive(const Archive *Arc) {
313   for (const Archive::Child &ArcC : Arc->children()) {
314     ErrorOr<std::unique_ptr<Binary>> ChildOrErr = ArcC.getAsBinary();
315     if (std::error_code EC = ChildOrErr.getError()) {
316       // Ignore non-object files.
317       if (EC != object_error::invalid_file_type)
318         reportError(Arc->getFileName(), EC.message());
319       continue;
320     }
321
322     if (ObjectFile *Obj = dyn_cast<ObjectFile>(&*ChildOrErr.get()))
323       dumpVTables(Obj);
324     else
325       reportError(Arc->getFileName(),
326                   vtabledump_error::unrecognized_file_format);
327   }
328 }
329
330 static void dumpInput(StringRef File) {
331   // If file isn't stdin, check that it exists.
332   if (File != "-" && !sys::fs::exists(File)) {
333     reportError(File, vtabledump_error::file_not_found);
334     return;
335   }
336
337   // Attempt to open the binary.
338   ErrorOr<OwningBinary<Binary>> BinaryOrErr = createBinary(File);
339   if (std::error_code EC = BinaryOrErr.getError()) {
340     reportError(File, EC);
341     return;
342   }
343   Binary &Binary = *BinaryOrErr.get().getBinary();
344
345   if (Archive *Arc = dyn_cast<Archive>(&Binary))
346     dumpArchive(Arc);
347   else if (ObjectFile *Obj = dyn_cast<ObjectFile>(&Binary))
348     dumpVTables(Obj);
349   else
350     reportError(File, vtabledump_error::unrecognized_file_format);
351 }
352
353 int main(int argc, const char *argv[]) {
354   sys::PrintStackTraceOnErrorSignal();
355   PrettyStackTraceProgram X(argc, argv);
356   llvm_shutdown_obj Y;
357
358   // Initialize targets.
359   llvm::InitializeAllTargetInfos();
360
361   // Register the target printer for --version.
362   cl::AddExtraVersionPrinter(TargetRegistry::printRegisteredTargetsForVersion);
363
364   cl::ParseCommandLineOptions(argc, argv, "LLVM VTable Dumper\n");
365
366   // Default to stdin if no filename is specified.
367   if (opts::InputFilenames.size() == 0)
368     opts::InputFilenames.push_back("-");
369
370   std::for_each(opts::InputFilenames.begin(), opts::InputFilenames.end(),
371                 dumpInput);
372
373   return ReturnValue;
374 }