Ignore intrinsic functions -- don't mangle their names or rewrite calls to them.
[oota-llvm.git] / tools / bugpoint / CodeGeneratorBug.cpp
1 //===- CodeGeneratorBug.cpp - Debug code generation bugs ------------------===//
2 //
3 // This file implements program code generation debugging support.
4 //
5 //===----------------------------------------------------------------------===//
6
7 #include "BugDriver.h"
8 #include "SystemUtils.h"
9 #include "ListReducer.h"
10 #include "llvm/Constants.h"
11 #include "llvm/DerivedTypes.h"
12 #include "llvm/GlobalValue.h"
13 #include "llvm/iMemory.h"
14 #include "llvm/iTerminators.h"
15 #include "llvm/iOther.h"
16 #include "llvm/Module.h"
17 #include "llvm/Pass.h"
18 #include "llvm/Analysis/Verifier.h"
19 #include "llvm/Support/Mangler.h"
20 #include "llvm/Transforms/Utils/BasicBlockUtils.h"
21 #include "llvm/Transforms/Utils/Cloning.h"
22 #include "llvm/Transforms/Utils/Linker.h"
23 #include "Support/CommandLine.h"
24 #include "Support/Statistic.h"
25 #include "Support/StringExtras.h"
26 #include <algorithm>
27 #include <set>
28
29 extern cl::list<std::string> InputArgv;
30
31 class ReduceMisCodegenFunctions : public ListReducer<Function*> {
32   BugDriver &BD;
33 public:
34   ReduceMisCodegenFunctions(BugDriver &bd) : BD(bd) {}
35
36   virtual TestResult doTest(std::vector<Function*> &Prefix,
37                             std::vector<Function*> &Suffix) {
38     if (!Prefix.empty() && TestFuncs(Prefix))
39       return KeepPrefix;
40     if (!Suffix.empty() && TestFuncs(Suffix))
41       return KeepSuffix;
42     return NoFailure;
43   }
44   
45   bool TestFuncs(const std::vector<Function*> &CodegenTest,
46                  bool KeepFiles = false);
47 };
48
49
50 bool ReduceMisCodegenFunctions::TestFuncs(const std::vector<Function*> &Funcs,
51                                           bool KeepFiles)
52 {
53   std::cout << "Testing functions: ";
54   BD.PrintFunctionList(Funcs);
55   std::cout << "\t";
56
57   // Clone the module for the two halves of the program we want.
58   Module *SafeModule = CloneModule(BD.Program);
59
60   // Make sure functions & globals are all external so that linkage
61   // between the two modules will work.
62   for (Module::iterator I = SafeModule->begin(), E = SafeModule->end();I!=E;++I)
63     I->setLinkage(GlobalValue::ExternalLinkage);
64   for (Module::giterator I=SafeModule->gbegin(),E = SafeModule->gend();I!=E;++I)
65     I->setLinkage(GlobalValue::ExternalLinkage);
66
67   Module *TestModule = CloneModule(SafeModule);
68
69   // Make sure global initializers exist only in the safe module (CBE->.so)
70   for (Module::giterator I=TestModule->gbegin(),E = TestModule->gend();I!=E;++I)
71     I->setInitializer(0);  // Delete the initializer to make it external
72
73   // Remove the Test functions from the Safe module
74   for (unsigned i = 0, e = Funcs.size(); i != e; ++i) {
75     Function *TNOF = SafeModule->getFunction(Funcs[i]->getName(),
76                                              Funcs[i]->getFunctionType());
77     DEBUG(std::cerr << "Removing function " << Funcs[i]->getName() << "\n");
78     assert(TNOF && "Function doesn't exist in module!");
79     DeleteFunctionBody(TNOF);       // Function is now external in this module!
80   }
81
82   // Remove the Safe functions from the Test module
83   for (Module::iterator I=TestModule->begin(),E=TestModule->end(); I!=E; ++I) {
84     bool funcFound = false;
85     for (std::vector<Function*>::const_iterator F=Funcs.begin(),Fe=Funcs.end();
86          F != Fe; ++F)
87       if (I->getName() == (*F)->getName()) funcFound = true;
88
89     if (!funcFound && !(BD.isExecutingJIT() && I->getName() == "main"))
90       DeleteFunctionBody(I);
91   }
92
93   // This is only applicable if we are debugging the JIT:
94   // Find all external functions in the Safe modules that are actually used
95   // (called or taken address of), and make them call the JIT wrapper instead
96   if (BD.isExecutingJIT()) {
97     // Must delete `main' from Safe module if it has it
98     Function *safeMain = SafeModule->getNamedFunction("main");
99     assert(safeMain && "`main' function not found in safe module!");
100     DeleteFunctionBody(safeMain);
101
102     // Add an external function "getPointerToNamedFunction" that JIT provides
103     // Prototype: void *getPointerToNamedFunction(const char* Name)
104     std::vector<const Type*> Params;
105     Params.push_back(PointerType::get(Type::SByteTy)); // std::string&
106     FunctionType *resolverTy = FunctionType::get(PointerType::get(Type::VoidTy),
107                                                  Params, false /* isVarArg */);
108     Function *resolverFunc = new Function(resolverTy,
109                                           GlobalValue::ExternalLinkage,
110                                           "getPointerToNamedFunction",
111                                           SafeModule);
112
113     // Use the function we just added to get addresses of functions we need
114     // Iterate over the global declarations in the Safe module
115     for (Module::iterator F=SafeModule->begin(),E=SafeModule->end(); F!=E; ++F){
116       if (F->isExternal() && !F->use_empty() && &(*F) != resolverFunc &&
117           F->getIntrinsicID() == 0 /* ignore intrinsics */) {
118         // If it has a non-zero use list,
119         // 1. Add a string constant with its name to the global file
120         // The correct type is `const [ NUM x sbyte ]' where NUM is length of
121         // function name + 1
122         const std::string &Name = F->getName();
123         GlobalVariable *funcName =
124           new GlobalVariable(ArrayType::get(Type::SByteTy, Name.length()+1),
125                              true /* isConstant */,
126                              GlobalValue::InternalLinkage,
127                              ConstantArray::get(Name),
128                              Name + "_name",
129                              SafeModule);
130
131         // 2. Use `GetElementPtr *funcName, 0, 0' to convert the string to an
132         // sbyte* so it matches the signature of the resolver function.
133         std::vector<Constant*> GEPargs(2, Constant::getNullValue(Type::LongTy));
134
135         // 3. Replace all uses of `func' with calls to resolver by:
136         // (a) Iterating through the list of uses of this function
137         // (b) Insert a cast instruction in front of each use
138         // (c) Replace use of old call with new call
139
140         // GetElementPtr *funcName, ulong 0, ulong 0
141         Value *GEP =
142           ConstantExpr::getGetElementPtr(ConstantPointerRef::get(funcName),
143                                          GEPargs);
144         std::vector<Value*> ResolverArgs;
145         ResolverArgs.push_back(GEP);
146
147         // Insert code at the beginning of the function
148         for (Value::use_iterator i=F->use_begin(), e=F->use_end(); i!=e; ++i) {
149           if (Instruction* Inst = dyn_cast<Instruction>(*i)) {
150             // call resolver(GetElementPtr...)
151             CallInst *resolve = new CallInst(resolverFunc, ResolverArgs, 
152                                              "resolver", Inst);
153             // cast the result from the resolver to correctly-typed function
154             CastInst *castResolver =
155               new CastInst(resolve, PointerType::get(F->getFunctionType()),
156                            "resolverCast", Inst);
157             // actually use the resolved function
158             Inst->replaceUsesOfWith(F, castResolver);
159           } else {
160             // FIXME: need to take care of cases where a function is used that
161             // is not an instruction, e.g. global variable initializer...
162             std::cerr << "Non-instruction is using an external function!\n";
163             abort();
164           }
165         }
166       }
167     }
168   }
169
170   DEBUG(std::cerr << "Safe module:\n";
171         typedef Module::iterator MI;
172         typedef Module::giterator MGI;
173
174         for (MI I = SafeModule->begin(), E = SafeModule->end(); I != E; ++I)
175           if (!I->isExternal()) std::cerr << "\t" << I->getName() << "\n";
176         for (MGI I = SafeModule->gbegin(), E = SafeModule->gend(); I!=E; ++I)
177           if (!I->isExternal()) std::cerr << "\t" << I->getName() << "\n";
178
179         std::cerr << "Test module:\n";
180         for (MI I = TestModule->begin(), E = TestModule->end(); I != E; ++I)
181           if (!I->isExternal()) std::cerr << "\t" << I->getName() << "\n";
182         for (MGI I=TestModule->gbegin(),E = TestModule->gend(); I!= E; ++I)
183           if (!I->isExternal()) std::cerr << "\t" << I->getName() << "\n";
184         );
185
186   // Write out the bytecode to be sent to CBE
187   std::string SafeModuleBC = getUniqueFilename("bugpoint.safe.bc");
188   if (verifyModule(*SafeModule)) {
189     std::cerr << "Bytecode file corrupted!\n";
190     exit(1);
191   }
192   if (BD.writeProgramToFile(SafeModuleBC, SafeModule)) {
193     std::cerr << "Error writing bytecode to `" << SafeModuleBC << "'\nExiting.";
194     exit(1);
195   }
196
197   // Make a shared library
198   std::string SharedObject;
199   BD.compileSharedObject(SafeModuleBC, SharedObject);
200
201   // Remove all functions from the Test module EXCEPT for the ones specified in
202   // Funcs.  We know which ones these are because they are non-external in
203   // ToOptimize, but external in ToNotOptimize.
204   //
205   for (Module::iterator I = TestModule->begin(), E = TestModule->end();I!=E;++I)
206     if (!I->isExternal()) {
207       Function *TNOF = SafeModule->getFunction(I->getName(),
208                                                I->getFunctionType());
209       assert(TNOF && "Function doesn't exist in ToNotOptimize module??");
210       if (!TNOF->isExternal())
211         DeleteFunctionBody(I);
212     }
213
214   std::string TestModuleBC = getUniqueFilename("bugpoint.test.bc");
215   if (verifyModule(*TestModule)) {
216     std::cerr << "Bytecode file corrupted!\n";
217     exit(1);
218   }
219   if (BD.writeProgramToFile(TestModuleBC, TestModule)) {
220     std::cerr << "Error writing bytecode to `" << SafeModuleBC << "'\nExiting.";
221     exit(1);
222   }
223
224   delete SafeModule;
225   delete TestModule;
226
227   // Run the code generator on the `Test' code, loading the shared library.
228   // The function returns whether or not the new output differs from reference.
229   int Result =  BD.diffProgram(TestModuleBC, SharedObject, false);
230   if (KeepFiles) {
231     std::cout << "You can reproduce the problem with the command line: \n"
232               << (BD.isExecutingJIT() ? "lli" : "llc")
233               << " -load " << SharedObject << " " << TestModuleBC;
234     for (unsigned i=0, e = InputArgv.size(); i != e; ++i)
235       std::cout << " " << InputArgv[i];
236     std::cout << "\n";
237     std::cout << "The shared object " << SharedObject << " was created from "
238               << SafeModuleBC << ", using `dis -c'.\n";
239   } else {
240     removeFile(TestModuleBC);
241     removeFile(SafeModuleBC);
242     removeFile(SharedObject);
243   }
244   return Result;
245 }
246
247 namespace {
248   struct Disambiguator {
249     std::set<std::string>  SymbolNames;
250     std::set<GlobalValue*> Symbols;
251     uint64_t uniqueCounter;
252     bool externalOnly;
253   public:
254     Disambiguator() : uniqueCounter(0), externalOnly(true) {}
255     void setExternalOnly(bool value) { externalOnly = value; }
256     void add(GlobalValue &V) {
257       // If we're only processing externals and this isn't external, bail
258       if (externalOnly && !V.isExternal()) return;
259       // If we're already processed this symbol, don't add it again
260       if (Symbols.count(&V) != 0) return;
261       // Ignore intrinsic functions
262       if (Function *F = dyn_cast<Function>(&V))
263         if (F->getIntrinsicID() != 0)
264           return;
265
266       std::string SymName = V.getName();
267
268       // Use the Mangler facility to make symbol names that will be valid in
269       // shared objects.
270       SymName = Mangler::makeNameProper(SymName);
271       V.setName(SymName);
272
273       if (SymbolNames.count(SymName) == 0) {
274         DEBUG(std::cerr << "Disambiguator: adding " << SymName
275                         << ", no conflicts.\n");
276         SymbolNames.insert(SymName);
277       } else { 
278         // Mangle name before adding
279         std::string newName;
280         do {
281           newName = SymName + "_" + utostr(uniqueCounter);
282           if (SymbolNames.count(newName) == 0) break;
283           else ++uniqueCounter;
284         } while (1);
285         //while (SymbolNames.count(V->getName()+utostr(uniqueCounter++))==0);
286         DEBUG(std::cerr << "Disambiguator: conflict: " << SymName
287                         << ", adding: " << newName << "\n");
288         V.setName(newName);
289         SymbolNames.insert(newName);
290       }
291       Symbols.insert(&V);
292     }
293   };
294 }
295
296 void DisambiguateGlobalSymbols(Module *M) {
297   // First, try not to cause collisions by minimizing chances of renaming an
298   // already-external symbol, so take in external globals and functions as-is.
299   Disambiguator D;
300   DEBUG(std::cerr << "Disambiguating globals (external-only)\n");
301   for (Module::giterator I = M->gbegin(), E = M->gend(); I != E; ++I) D.add(*I);
302   DEBUG(std::cerr << "Disambiguating functions (external-only)\n");
303   for (Module::iterator  I = M->begin(),  E = M->end();  I != E; ++I) D.add(*I);
304
305   // Now just rename functions and globals as necessary, keeping what's already
306   // in the set unique.
307   D.setExternalOnly(false);
308   DEBUG(std::cerr << "Disambiguating globals\n");
309   for (Module::giterator I = M->gbegin(), E = M->gend(); I != E; ++I) D.add(*I);
310   DEBUG(std::cerr << "Disambiguating globals\n");
311   for (Module::iterator  I = M->begin(),  E = M->end();  I != E; ++I) D.add(*I);
312 }
313
314
315 bool BugDriver::debugCodeGenerator() {
316   // See if we can pin down which functions are being miscompiled...
317   //First, build a list of all of the non-external functions in the program.
318   std::vector<Function*> MisCodegenFunctions;
319   for (Module::iterator I = Program->begin(), E = Program->end(); I != E; ++I)
320     if (!I->isExternal())
321       MisCodegenFunctions.push_back(I);
322
323   // If we are executing the JIT, we *must* keep the function `main' in the
324   // module that is passed in, and not the shared library. However, we still
325   // want to be able to debug the `main' function alone. Thus, we create a new
326   // function `main' which just calls the old one.
327   if (isExecutingJIT()) {
328     // Get the `main' function
329     Function *oldMain = Program->getNamedFunction("main");
330     assert(oldMain && "`main' function not found in program!");
331     // Rename it
332     oldMain->setName("old_main");
333     // Create a NEW `main' function with same type
334     Function *newMain = new Function(oldMain->getFunctionType(), 
335                                      GlobalValue::ExternalLinkage,
336                                      "main", Program);
337     // Call the old main function and return its result
338     BasicBlock *BB = new BasicBlock("entry", newMain);
339     std::vector<Value*> args;
340     for (Function::aiterator I=newMain->abegin(), E=newMain->aend(); I!=E; ++I)
341       args.push_back(I);
342     CallInst *call = new CallInst(oldMain, args);
343     BB->getInstList().push_back(call);
344     
345     // if the type of old function wasn't void, return value of call
346     ReturnInst *ret;
347     if (oldMain->getReturnType() != Type::VoidTy) {
348       ret = new ReturnInst(call);
349     } else {
350       ret = new ReturnInst();
351     }
352
353     // Add the return instruction to the BasicBlock
354     BB->getInstList().push_back(ret);
355   }
356
357   DisambiguateGlobalSymbols(Program);
358
359   // Do the reduction...
360   if (!ReduceMisCodegenFunctions(*this).reduceList(MisCodegenFunctions)) {
361     std::cerr << "*** Execution matches reference output!  No problem "
362               << "detected...\nbugpoint can't help you with your problem!\n";
363     return false;
364   }
365
366   std::cout << "\n*** The following functions are being miscompiled: ";
367   PrintFunctionList(MisCodegenFunctions);
368   std::cout << "\n";
369
370   // Output a bunch of bytecode files for the user...
371   ReduceMisCodegenFunctions(*this).TestFuncs(MisCodegenFunctions, true);
372
373   return false;
374 }