Fix a bugpoint bug on anonymous functions. Instead of looking up
[oota-llvm.git] / tools / bugpoint / CrashDebugger.cpp
1 //===- CrashDebugger.cpp - Debug compilation crashes ----------------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file defines the bugpoint internals that narrow down compilation crashes
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "BugDriver.h"
15 #include "ToolRunner.h"
16 #include "ListReducer.h"
17 #include "llvm/Constants.h"
18 #include "llvm/DerivedTypes.h"
19 #include "llvm/Instructions.h"
20 #include "llvm/Module.h"
21 #include "llvm/Pass.h"
22 #include "llvm/PassManager.h"
23 #include "llvm/ValueSymbolTable.h"
24 #include "llvm/Analysis/Verifier.h"
25 #include "llvm/Support/CFG.h"
26 #include "llvm/Transforms/Scalar.h"
27 #include "llvm/Transforms/Utils/Cloning.h"
28 #include "llvm/Support/FileUtilities.h"
29 #include "llvm/Support/CommandLine.h"
30 #include <fstream>
31 #include <set>
32 using namespace llvm;
33
34 namespace {
35   cl::opt<bool>
36   KeepMain("keep-main",
37            cl::desc("Force function reduction to keep main"),
38            cl::init(false));
39 }
40
41 namespace llvm {
42   class ReducePassList : public ListReducer<const PassInfo*> {
43     BugDriver &BD;
44   public:
45     ReducePassList(BugDriver &bd) : BD(bd) {}
46
47     // doTest - Return true iff running the "removed" passes succeeds, and
48     // running the "Kept" passes fail when run on the output of the "removed"
49     // passes.  If we return true, we update the current module of bugpoint.
50     //
51     virtual TestResult doTest(std::vector<const PassInfo*> &Removed,
52                               std::vector<const PassInfo*> &Kept);
53   };
54 }
55
56 ReducePassList::TestResult
57 ReducePassList::doTest(std::vector<const PassInfo*> &Prefix,
58                        std::vector<const PassInfo*> &Suffix) {
59   sys::Path PrefixOutput;
60   Module *OrigProgram = 0;
61   if (!Prefix.empty()) {
62     std::cout << "Checking to see if these passes crash: "
63               << getPassesString(Prefix) << ": ";
64     std::string PfxOutput;
65     if (BD.runPasses(Prefix, PfxOutput))
66       return KeepPrefix;
67
68     PrefixOutput.set(PfxOutput);
69     OrigProgram = BD.Program;
70
71     BD.Program = ParseInputFile(PrefixOutput.toString());
72     if (BD.Program == 0) {
73       std::cerr << BD.getToolName() << ": Error reading bitcode file '"
74                 << PrefixOutput << "'!\n";
75       exit(1);
76     }
77     PrefixOutput.eraseFromDisk();
78   }
79
80   std::cout << "Checking to see if these passes crash: "
81             << getPassesString(Suffix) << ": ";
82
83   if (BD.runPasses(Suffix)) {
84     delete OrigProgram;            // The suffix crashes alone...
85     return KeepSuffix;
86   }
87
88   // Nothing failed, restore state...
89   if (OrigProgram) {
90     delete BD.Program;
91     BD.Program = OrigProgram;
92   }
93   return NoFailure;
94 }
95
96 namespace {
97   /// ReduceCrashingGlobalVariables - This works by removing the global
98   /// variable's initializer and seeing if the program still crashes. If it
99   /// does, then we keep that program and try again.
100   ///
101   class ReduceCrashingGlobalVariables : public ListReducer<GlobalVariable*> {
102     BugDriver &BD;
103     bool (*TestFn)(BugDriver &, Module *);
104   public:
105     ReduceCrashingGlobalVariables(BugDriver &bd,
106                                   bool (*testFn)(BugDriver&, Module*))
107       : BD(bd), TestFn(testFn) {}
108
109     virtual TestResult doTest(std::vector<GlobalVariable*>& Prefix,
110                               std::vector<GlobalVariable*>& Kept) {
111       if (!Kept.empty() && TestGlobalVariables(Kept))
112         return KeepSuffix;
113
114       if (!Prefix.empty() && TestGlobalVariables(Prefix))
115         return KeepPrefix;
116
117       return NoFailure;
118     }
119
120     bool TestGlobalVariables(std::vector<GlobalVariable*>& GVs);
121   };
122 }
123
124 bool
125 ReduceCrashingGlobalVariables::TestGlobalVariables(
126                               std::vector<GlobalVariable*>& GVs) {
127   // Clone the program to try hacking it apart...
128   DenseMap<const Value*, Value*> ValueMap;
129   Module *M = CloneModule(BD.getProgram(), ValueMap);
130
131   // Convert list to set for fast lookup...
132   std::set<GlobalVariable*> GVSet;
133
134   for (unsigned i = 0, e = GVs.size(); i != e; ++i) {
135     GlobalVariable* CMGV = cast<GlobalVariable>(ValueMap[GVs[i]]);
136     assert(CMGV && "Global Variable not in module?!");
137     GVSet.insert(CMGV);
138   }
139
140   std::cout << "Checking for crash with only these global variables: ";
141   PrintGlobalVariableList(GVs);
142   std::cout << ": ";
143
144   // Loop over and delete any global variables which we aren't supposed to be
145   // playing with...
146   for (Module::global_iterator I = M->global_begin(), E = M->global_end();
147        I != E; ++I)
148     if (I->hasInitializer()) {
149       I->setInitializer(0);
150       I->setLinkage(GlobalValue::ExternalLinkage);
151     }
152
153   // Try running the hacked up program...
154   if (TestFn(BD, M)) {
155     BD.setNewProgram(M);        // It crashed, keep the trimmed version...
156
157     // Make sure to use global variable pointers that point into the now-current
158     // module.
159     GVs.assign(GVSet.begin(), GVSet.end());
160     return true;
161   }
162
163   delete M;
164   return false;
165 }
166
167 namespace llvm {
168   /// ReduceCrashingFunctions reducer - This works by removing functions and
169   /// seeing if the program still crashes. If it does, then keep the newer,
170   /// smaller program.
171   ///
172   class ReduceCrashingFunctions : public ListReducer<Function*> {
173     BugDriver &BD;
174     bool (*TestFn)(BugDriver &, Module *);
175   public:
176     ReduceCrashingFunctions(BugDriver &bd,
177                             bool (*testFn)(BugDriver &, Module *))
178       : BD(bd), TestFn(testFn) {}
179
180     virtual TestResult doTest(std::vector<Function*> &Prefix,
181                               std::vector<Function*> &Kept) {
182       if (!Kept.empty() && TestFuncs(Kept))
183         return KeepSuffix;
184       if (!Prefix.empty() && TestFuncs(Prefix))
185         return KeepPrefix;
186       return NoFailure;
187     }
188
189     bool TestFuncs(std::vector<Function*> &Prefix);
190   };
191 }
192
193 bool ReduceCrashingFunctions::TestFuncs(std::vector<Function*> &Funcs) {
194
195   //if main isn't present, claim there is no problem
196   if (KeepMain && find(Funcs.begin(), Funcs.end(),
197                        BD.getProgram()->getFunction("main")) == Funcs.end())
198     return false;
199
200   // Clone the program to try hacking it apart...
201   Module *M = CloneModule(BD.getProgram());
202
203   // Convert list to set for fast lookup...
204   std::set<Function*> Functions;
205   for (unsigned i = 0, e = Funcs.size(); i != e; ++i) {
206     // FIXME: bugpoint should add names to all stripped symbols.
207     assert(!Funcs[i]->getName().empty() &&
208            "Bugpoint doesn't work on stripped modules yet PR718!");
209     Function *CMF = M->getFunction(Funcs[i]->getName());
210     assert(CMF && "Function not in module?!");
211     assert(CMF->getFunctionType() == Funcs[i]->getFunctionType() && "wrong ty");
212     Functions.insert(CMF);
213   }
214
215   std::cout << "Checking for crash with only these functions: ";
216   PrintFunctionList(Funcs);
217   std::cout << ": ";
218
219   // Loop over and delete any functions which we aren't supposed to be playing
220   // with...
221   for (Module::iterator I = M->begin(), E = M->end(); I != E; ++I)
222     if (!I->isDeclaration() && !Functions.count(I))
223       DeleteFunctionBody(I);
224
225   // Try running the hacked up program...
226   if (TestFn(BD, M)) {
227     BD.setNewProgram(M);        // It crashed, keep the trimmed version...
228
229     // Make sure to use function pointers that point into the now-current
230     // module.
231     Funcs.assign(Functions.begin(), Functions.end());
232     return true;
233   }
234   delete M;
235   return false;
236 }
237
238
239 namespace {
240   /// ReduceCrashingBlocks reducer - This works by setting the terminators of
241   /// all terminators except the specified basic blocks to a 'ret' instruction,
242   /// then running the simplify-cfg pass.  This has the effect of chopping up
243   /// the CFG really fast which can reduce large functions quickly.
244   ///
245   class ReduceCrashingBlocks : public ListReducer<const BasicBlock*> {
246     BugDriver &BD;
247     bool (*TestFn)(BugDriver &, Module *);
248   public:
249     ReduceCrashingBlocks(BugDriver &bd, bool (*testFn)(BugDriver &, Module *))
250       : BD(bd), TestFn(testFn) {}
251
252     virtual TestResult doTest(std::vector<const BasicBlock*> &Prefix,
253                               std::vector<const BasicBlock*> &Kept) {
254       if (!Kept.empty() && TestBlocks(Kept))
255         return KeepSuffix;
256       if (!Prefix.empty() && TestBlocks(Prefix))
257         return KeepPrefix;
258       return NoFailure;
259     }
260
261     bool TestBlocks(std::vector<const BasicBlock*> &Prefix);
262   };
263 }
264
265 bool ReduceCrashingBlocks::TestBlocks(std::vector<const BasicBlock*> &BBs) {
266   // Clone the program to try hacking it apart...
267   DenseMap<const Value*, Value*> ValueMap;
268   Module *M = CloneModule(BD.getProgram(), ValueMap);
269
270   // Convert list to set for fast lookup...
271   std::set<BasicBlock*> Blocks;
272   for (unsigned i = 0, e = BBs.size(); i != e; ++i) {
273     // Convert the basic block from the original module to the new module...
274     const Function *F = BBs[i]->getParent();
275     Function *CMF = cast<Function>(ValueMap[F]);
276     assert(CMF && "Function not in module?!");
277     assert(CMF->getFunctionType() == F->getFunctionType() && "wrong type?");
278     assert(CMF->getName() == F->getName() && "wrong name?");
279
280     // Get the mapped basic block...
281     Function::iterator CBI = CMF->begin();
282     std::advance(CBI, std::distance(F->begin(),
283                                     Function::const_iterator(BBs[i])));
284     Blocks.insert(CBI);
285   }
286
287   std::cout << "Checking for crash with only these blocks:";
288   unsigned NumPrint = Blocks.size();
289   if (NumPrint > 10) NumPrint = 10;
290   for (unsigned i = 0, e = NumPrint; i != e; ++i)
291     std::cout << " " << BBs[i]->getName();
292   if (NumPrint < Blocks.size())
293     std::cout << "... <" << Blocks.size() << " total>";
294   std::cout << ": ";
295
296   // Loop over and delete any hack up any blocks that are not listed...
297   for (Module::iterator I = M->begin(), E = M->end(); I != E; ++I)
298     for (Function::iterator BB = I->begin(), E = I->end(); BB != E; ++BB)
299       if (!Blocks.count(BB) && BB->getTerminator()->getNumSuccessors()) {
300         // Loop over all of the successors of this block, deleting any PHI nodes
301         // that might include it.
302         for (succ_iterator SI = succ_begin(BB), E = succ_end(BB); SI != E; ++SI)
303           (*SI)->removePredecessor(BB);
304
305         TerminatorInst *BBTerm = BB->getTerminator();
306         
307         if (isa<StructType>(BBTerm->getType()))
308            BBTerm->replaceAllUsesWith(UndefValue::get(BBTerm->getType()));
309         else if (BB->getTerminator()->getType() != Type::VoidTy)
310           BBTerm->replaceAllUsesWith(Constant::getNullValue(BBTerm->getType()));
311
312         // Replace the old terminator instruction.
313         BB->getInstList().pop_back();
314         new UnreachableInst(BB);
315       }
316
317   // The CFG Simplifier pass may delete one of the basic blocks we are
318   // interested in.  If it does we need to take the block out of the list.  Make
319   // a "persistent mapping" by turning basic blocks into <function, name> pairs.
320   // This won't work well if blocks are unnamed, but that is just the risk we
321   // have to take.
322   std::vector<std::pair<Function*, std::string> > BlockInfo;
323
324   for (std::set<BasicBlock*>::iterator I = Blocks.begin(), E = Blocks.end();
325        I != E; ++I)
326     BlockInfo.push_back(std::make_pair((*I)->getParent(), (*I)->getName()));
327
328   // Now run the CFG simplify pass on the function...
329   PassManager Passes;
330   Passes.add(createCFGSimplificationPass());
331   Passes.add(createVerifierPass());
332   Passes.run(*M);
333
334   // Try running on the hacked up program...
335   if (TestFn(BD, M)) {
336     BD.setNewProgram(M);      // It crashed, keep the trimmed version...
337
338     // Make sure to use basic block pointers that point into the now-current
339     // module, and that they don't include any deleted blocks.
340     BBs.clear();
341     for (unsigned i = 0, e = BlockInfo.size(); i != e; ++i) {
342       ValueSymbolTable &ST = BlockInfo[i].first->getValueSymbolTable();
343       Value* V = ST.lookup(BlockInfo[i].second);
344       if (V && V->getType() == Type::LabelTy)
345         BBs.push_back(cast<BasicBlock>(V));
346     }
347     return true;
348   }
349   delete M;  // It didn't crash, try something else.
350   return false;
351 }
352
353 /// DebugACrash - Given a predicate that determines whether a component crashes
354 /// on a program, try to destructively reduce the program while still keeping
355 /// the predicate true.
356 static bool DebugACrash(BugDriver &BD,  bool (*TestFn)(BugDriver &, Module *)) {
357   // See if we can get away with nuking some of the global variable initializers
358   // in the program...
359   if (BD.getProgram()->global_begin() != BD.getProgram()->global_end()) {
360     // Now try to reduce the number of global variable initializers in the
361     // module to something small.
362     Module *M = CloneModule(BD.getProgram());
363     bool DeletedInit = false;
364
365     for (Module::global_iterator I = M->global_begin(), E = M->global_end();
366          I != E; ++I)
367       if (I->hasInitializer()) {
368         I->setInitializer(0);
369         I->setLinkage(GlobalValue::ExternalLinkage);
370         DeletedInit = true;
371       }
372
373     if (!DeletedInit) {
374       delete M;  // No change made...
375     } else {
376       // See if the program still causes a crash...
377       std::cout << "\nChecking to see if we can delete global inits: ";
378
379       if (TestFn(BD, M)) {      // Still crashes?
380         BD.setNewProgram(M);
381         std::cout << "\n*** Able to remove all global initializers!\n";
382       } else {                  // No longer crashes?
383         std::cout << "  - Removing all global inits hides problem!\n";
384         delete M;
385
386         std::vector<GlobalVariable*> GVs;
387
388         for (Module::global_iterator I = BD.getProgram()->global_begin(),
389                E = BD.getProgram()->global_end(); I != E; ++I)
390           if (I->hasInitializer())
391             GVs.push_back(I);
392
393         if (GVs.size() > 1 && !BugpointIsInterrupted) {
394           std::cout << "\n*** Attempting to reduce the number of global "
395                     << "variables in the testcase\n";
396
397           unsigned OldSize = GVs.size();
398           ReduceCrashingGlobalVariables(BD, TestFn).reduceList(GVs);
399
400           if (GVs.size() < OldSize)
401             BD.EmitProgressBitcode("reduced-global-variables");
402         }
403       }
404     }
405   }
406
407   // Now try to reduce the number of functions in the module to something small.
408   std::vector<Function*> Functions;
409   for (Module::iterator I = BD.getProgram()->begin(),
410          E = BD.getProgram()->end(); I != E; ++I)
411     if (!I->isDeclaration())
412       Functions.push_back(I);
413
414   if (Functions.size() > 1 && !BugpointIsInterrupted) {
415     std::cout << "\n*** Attempting to reduce the number of functions "
416       "in the testcase\n";
417
418     unsigned OldSize = Functions.size();
419     ReduceCrashingFunctions(BD, TestFn).reduceList(Functions);
420
421     if (Functions.size() < OldSize)
422       BD.EmitProgressBitcode("reduced-function");
423   }
424
425   // Attempt to delete entire basic blocks at a time to speed up
426   // convergence... this actually works by setting the terminator of the blocks
427   // to a return instruction then running simplifycfg, which can potentially
428   // shrinks the code dramatically quickly
429   //
430   if (!DisableSimplifyCFG && !BugpointIsInterrupted) {
431     std::vector<const BasicBlock*> Blocks;
432     for (Module::const_iterator I = BD.getProgram()->begin(),
433            E = BD.getProgram()->end(); I != E; ++I)
434       for (Function::const_iterator FI = I->begin(), E = I->end(); FI !=E; ++FI)
435         Blocks.push_back(FI);
436     ReduceCrashingBlocks(BD, TestFn).reduceList(Blocks);
437   }
438
439   // FIXME: This should use the list reducer to converge faster by deleting
440   // larger chunks of instructions at a time!
441   unsigned Simplification = 2;
442   do {
443     if (BugpointIsInterrupted) break;
444     --Simplification;
445     std::cout << "\n*** Attempting to reduce testcase by deleting instruc"
446               << "tions: Simplification Level #" << Simplification << '\n';
447
448     // Now that we have deleted the functions that are unnecessary for the
449     // program, try to remove instructions that are not necessary to cause the
450     // crash.  To do this, we loop through all of the instructions in the
451     // remaining functions, deleting them (replacing any values produced with
452     // nulls), and then running ADCE and SimplifyCFG.  If the transformed input
453     // still triggers failure, keep deleting until we cannot trigger failure
454     // anymore.
455     //
456     unsigned InstructionsToSkipBeforeDeleting = 0;
457   TryAgain:
458
459     // Loop over all of the (non-terminator) instructions remaining in the
460     // function, attempting to delete them.
461     unsigned CurInstructionNum = 0;
462     for (Module::const_iterator FI = BD.getProgram()->begin(),
463            E = BD.getProgram()->end(); FI != E; ++FI)
464       if (!FI->isDeclaration())
465         for (Function::const_iterator BI = FI->begin(), E = FI->end(); BI != E;
466              ++BI)
467           for (BasicBlock::const_iterator I = BI->begin(), E = --BI->end();
468                I != E; ++I, ++CurInstructionNum)
469             if (InstructionsToSkipBeforeDeleting) {
470               --InstructionsToSkipBeforeDeleting;
471             } else {
472               if (BugpointIsInterrupted) goto ExitLoops;
473
474               std::cout << "Checking instruction: " << *I;
475               Module *M = BD.deleteInstructionFromProgram(I, Simplification);
476
477               // Find out if the pass still crashes on this pass...
478               if (TestFn(BD, M)) {
479                 // Yup, it does, we delete the old module, and continue trying
480                 // to reduce the testcase...
481                 BD.setNewProgram(M);
482                 InstructionsToSkipBeforeDeleting = CurInstructionNum;
483                 goto TryAgain;  // I wish I had a multi-level break here!
484               }
485
486               // This pass didn't crash without this instruction, try the next
487               // one.
488               delete M;
489             }
490
491     if (InstructionsToSkipBeforeDeleting) {
492       InstructionsToSkipBeforeDeleting = 0;
493       goto TryAgain;
494     }
495
496   } while (Simplification);
497 ExitLoops:
498
499   // Try to clean up the testcase by running funcresolve and globaldce...
500   if (!BugpointIsInterrupted) {
501     std::cout << "\n*** Attempting to perform final cleanups: ";
502     Module *M = CloneModule(BD.getProgram());
503     M = BD.performFinalCleanups(M, true);
504
505     // Find out if the pass still crashes on the cleaned up program...
506     if (TestFn(BD, M)) {
507       BD.setNewProgram(M);     // Yup, it does, keep the reduced version...
508     } else {
509       delete M;
510     }
511   }
512
513   BD.EmitProgressBitcode("reduced-simplified");
514
515   return false;
516 }
517
518 static bool TestForOptimizerCrash(BugDriver &BD, Module *M) {
519   return BD.runPasses(M);
520 }
521
522 /// debugOptimizerCrash - This method is called when some pass crashes on input.
523 /// It attempts to prune down the testcase to something reasonable, and figure
524 /// out exactly which pass is crashing.
525 ///
526 bool BugDriver::debugOptimizerCrash(const std::string &ID) {
527   std::cout << "\n*** Debugging optimizer crash!\n";
528
529   // Reduce the list of passes which causes the optimizer to crash...
530   if (!BugpointIsInterrupted)
531     ReducePassList(*this).reduceList(PassesToRun);
532
533   std::cout << "\n*** Found crashing pass"
534             << (PassesToRun.size() == 1 ? ": " : "es: ")
535             << getPassesString(PassesToRun) << '\n';
536
537   EmitProgressBitcode(ID);
538
539   return DebugACrash(*this, TestForOptimizerCrash);
540 }
541
542 static bool TestForCodeGenCrash(BugDriver &BD, Module *M) {
543   try {
544     BD.compileProgram(M);
545     std::cerr << '\n';
546     return false;
547   } catch (ToolExecutionError &) {
548     std::cerr << "<crash>\n";
549     return true;  // Tool is still crashing.
550   }
551 }
552
553 /// debugCodeGeneratorCrash - This method is called when the code generator
554 /// crashes on an input.  It attempts to reduce the input as much as possible
555 /// while still causing the code generator to crash.
556 bool BugDriver::debugCodeGeneratorCrash() {
557   std::cerr << "*** Debugging code generator crash!\n";
558
559   return DebugACrash(*this, TestForCodeGenCrash);
560 }