Use Instruction::eraseFromParent().
[oota-llvm.git] / lib / Transforms / IPO / LowerSetJmp.cpp
1 //===- LowerSetJmp.cpp - Code pertaining to lowering set/long jumps -------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 //  This file implements the lowering of setjmp and longjmp to use the
11 //  LLVM invoke and unwind instructions as necessary.
12 //
13 //  Lowering of longjmp is fairly trivial. We replace the call with a
14 //  call to the LLVM library function "__llvm_sjljeh_throw_longjmp()".
15 //  This unwinds the stack for us calling all of the destructors for
16 //  objects allocated on the stack.
17 //
18 //  At a setjmp call, the basic block is split and the setjmp removed.
19 //  The calls in a function that have a setjmp are converted to invoke
20 //  where the except part checks to see if it's a longjmp exception and,
21 //  if so, if it's handled in the function. If it is, then it gets the
22 //  value returned by the longjmp and goes to where the basic block was
23 //  split. Invoke instructions are handled in a similar fashion with the
24 //  original except block being executed if it isn't a longjmp except
25 //  that is handled by that function.
26 //
27 //===----------------------------------------------------------------------===//
28
29 //===----------------------------------------------------------------------===//
30 // FIXME: This pass doesn't deal with PHI statements just yet. That is,
31 // we expect this to occur before SSAification is done. This would seem
32 // to make sense, but in general, it might be a good idea to make this
33 // pass invokable via the "opt" command at will.
34 //===----------------------------------------------------------------------===//
35
36 #define DEBUG_TYPE "lowersetjmp"
37 #include "llvm/Transforms/IPO.h"
38 #include "llvm/Constants.h"
39 #include "llvm/DerivedTypes.h"
40 #include "llvm/Instructions.h"
41 #include "llvm/Intrinsics.h"
42 #include "llvm/Module.h"
43 #include "llvm/Pass.h"
44 #include "llvm/Support/CFG.h"
45 #include "llvm/Support/Compiler.h"
46 #include "llvm/Support/InstVisitor.h"
47 #include "llvm/Transforms/Utils/Local.h"
48 #include "llvm/ADT/DepthFirstIterator.h"
49 #include "llvm/ADT/Statistic.h"
50 #include "llvm/ADT/StringExtras.h"
51 #include "llvm/ADT/VectorExtras.h"
52 #include "llvm/ADT/SmallVector.h"
53 #include <map>
54 using namespace llvm;
55
56 STATISTIC(LongJmpsTransformed, "Number of longjmps transformed");
57 STATISTIC(SetJmpsTransformed , "Number of setjmps transformed");
58 STATISTIC(CallsTransformed   , "Number of calls invokified");
59 STATISTIC(InvokesTransformed , "Number of invokes modified");
60
61 namespace {
62   //===--------------------------------------------------------------------===//
63   // LowerSetJmp pass implementation.
64   class VISIBILITY_HIDDEN LowerSetJmp : public ModulePass,
65                       public InstVisitor<LowerSetJmp> {
66     // LLVM library functions...
67     Constant *InitSJMap;        // __llvm_sjljeh_init_setjmpmap
68     Constant *DestroySJMap;     // __llvm_sjljeh_destroy_setjmpmap
69     Constant *AddSJToMap;       // __llvm_sjljeh_add_setjmp_to_map
70     Constant *ThrowLongJmp;     // __llvm_sjljeh_throw_longjmp
71     Constant *TryCatchLJ;       // __llvm_sjljeh_try_catching_longjmp_exception
72     Constant *IsLJException;    // __llvm_sjljeh_is_longjmp_exception
73     Constant *GetLJValue;       // __llvm_sjljeh_get_longjmp_value
74
75     typedef std::pair<SwitchInst*, CallInst*> SwitchValuePair;
76
77     // Keep track of those basic blocks reachable via a depth-first search of
78     // the CFG from a setjmp call. We only need to transform those "call" and
79     // "invoke" instructions that are reachable from the setjmp call site.
80     std::set<BasicBlock*> DFSBlocks;
81
82     // The setjmp map is going to hold information about which setjmps
83     // were called (each setjmp gets its own number) and with which
84     // buffer it was called.
85     std::map<Function*, AllocaInst*>            SJMap;
86
87     // The rethrow basic block map holds the basic block to branch to if
88     // the exception isn't handled in the current function and needs to
89     // be rethrown.
90     std::map<const Function*, BasicBlock*>      RethrowBBMap;
91
92     // The preliminary basic block map holds a basic block that grabs the
93     // exception and determines if it's handled by the current function.
94     std::map<const Function*, BasicBlock*>      PrelimBBMap;
95
96     // The switch/value map holds a switch inst/call inst pair. The
97     // switch inst controls which handler (if any) gets called and the
98     // value is the value returned to that handler by the call to
99     // __llvm_sjljeh_get_longjmp_value.
100     std::map<const Function*, SwitchValuePair>  SwitchValMap;
101
102     // A map of which setjmps we've seen so far in a function.
103     std::map<const Function*, unsigned>         SetJmpIDMap;
104
105     AllocaInst*     GetSetJmpMap(Function* Func);
106     BasicBlock*     GetRethrowBB(Function* Func);
107     SwitchValuePair GetSJSwitch(Function* Func, BasicBlock* Rethrow);
108
109     void TransformLongJmpCall(CallInst* Inst);
110     void TransformSetJmpCall(CallInst* Inst);
111
112     bool IsTransformableFunction(const std::string& Name);
113   public:
114     static char ID; // Pass identification, replacement for typeid
115     LowerSetJmp() : ModulePass((intptr_t)&ID) {}
116
117     void visitCallInst(CallInst& CI);
118     void visitInvokeInst(InvokeInst& II);
119     void visitReturnInst(ReturnInst& RI);
120     void visitUnwindInst(UnwindInst& UI);
121
122     bool runOnModule(Module& M);
123     bool doInitialization(Module& M);
124   };
125 } // end anonymous namespace
126
127 char LowerSetJmp::ID = 0;
128 static RegisterPass<LowerSetJmp> X("lowersetjmp", "Lower Set Jump");
129
130 // run - Run the transformation on the program. We grab the function
131 // prototypes for longjmp and setjmp. If they are used in the program,
132 // then we can go directly to the places they're at and transform them.
133 bool LowerSetJmp::runOnModule(Module& M) {
134   bool Changed = false;
135
136   // These are what the functions are called.
137   Function* SetJmp = M.getFunction("llvm.setjmp");
138   Function* LongJmp = M.getFunction("llvm.longjmp");
139
140   // This program doesn't have longjmp and setjmp calls.
141   if ((!LongJmp || LongJmp->use_empty()) &&
142         (!SetJmp || SetJmp->use_empty())) return false;
143
144   // Initialize some values and functions we'll need to transform the
145   // setjmp/longjmp functions.
146   doInitialization(M);
147
148   if (SetJmp) {
149     for (Value::use_iterator B = SetJmp->use_begin(), E = SetJmp->use_end();
150          B != E; ++B) {
151       BasicBlock* BB = cast<Instruction>(*B)->getParent();
152       for (df_ext_iterator<BasicBlock*> I = df_ext_begin(BB, DFSBlocks),
153              E = df_ext_end(BB, DFSBlocks); I != E; ++I)
154         /* empty */;
155     }
156
157     while (!SetJmp->use_empty()) {
158       assert(isa<CallInst>(SetJmp->use_back()) &&
159              "User of setjmp intrinsic not a call?");
160       TransformSetJmpCall(cast<CallInst>(SetJmp->use_back()));
161       Changed = true;
162     }
163   }
164
165   if (LongJmp)
166     while (!LongJmp->use_empty()) {
167       assert(isa<CallInst>(LongJmp->use_back()) &&
168              "User of longjmp intrinsic not a call?");
169       TransformLongJmpCall(cast<CallInst>(LongJmp->use_back()));
170       Changed = true;
171     }
172
173   // Now go through the affected functions and convert calls and invokes
174   // to new invokes...
175   for (std::map<Function*, AllocaInst*>::iterator
176       B = SJMap.begin(), E = SJMap.end(); B != E; ++B) {
177     Function* F = B->first;
178     for (Function::iterator BB = F->begin(), BE = F->end(); BB != BE; ++BB)
179       for (BasicBlock::iterator IB = BB->begin(), IE = BB->end(); IB != IE; ) {
180         visit(*IB++);
181         if (IB != BB->end() && IB->getParent() != BB)
182           break;  // The next instruction got moved to a different block!
183       }
184   }
185
186   DFSBlocks.clear();
187   SJMap.clear();
188   RethrowBBMap.clear();
189   PrelimBBMap.clear();
190   SwitchValMap.clear();
191   SetJmpIDMap.clear();
192
193   return Changed;
194 }
195
196 // doInitialization - For the lower long/setjmp pass, this ensures that a
197 // module contains a declaration for the intrisic functions we are going
198 // to call to convert longjmp and setjmp calls.
199 //
200 // This function is always successful, unless it isn't.
201 bool LowerSetJmp::doInitialization(Module& M)
202 {
203   const Type *SBPTy = PointerType::getUnqual(Type::Int8Ty);
204   const Type *SBPPTy = PointerType::getUnqual(SBPTy);
205
206   // N.B. See llvm/runtime/GCCLibraries/libexception/SJLJ-Exception.h for
207   // a description of the following library functions.
208
209   // void __llvm_sjljeh_init_setjmpmap(void**)
210   InitSJMap = M.getOrInsertFunction("__llvm_sjljeh_init_setjmpmap",
211                                     Type::VoidTy, SBPPTy, (Type *)0);
212   // void __llvm_sjljeh_destroy_setjmpmap(void**)
213   DestroySJMap = M.getOrInsertFunction("__llvm_sjljeh_destroy_setjmpmap",
214                                        Type::VoidTy, SBPPTy, (Type *)0);
215
216   // void __llvm_sjljeh_add_setjmp_to_map(void**, void*, unsigned)
217   AddSJToMap = M.getOrInsertFunction("__llvm_sjljeh_add_setjmp_to_map",
218                                      Type::VoidTy, SBPPTy, SBPTy,
219                                      Type::Int32Ty, (Type *)0);
220
221   // void __llvm_sjljeh_throw_longjmp(int*, int)
222   ThrowLongJmp = M.getOrInsertFunction("__llvm_sjljeh_throw_longjmp",
223                                        Type::VoidTy, SBPTy, Type::Int32Ty,
224                                        (Type *)0);
225
226   // unsigned __llvm_sjljeh_try_catching_longjmp_exception(void **)
227   TryCatchLJ =
228     M.getOrInsertFunction("__llvm_sjljeh_try_catching_longjmp_exception",
229                           Type::Int32Ty, SBPPTy, (Type *)0);
230
231   // bool __llvm_sjljeh_is_longjmp_exception()
232   IsLJException = M.getOrInsertFunction("__llvm_sjljeh_is_longjmp_exception",
233                                         Type::Int1Ty, (Type *)0);
234
235   // int __llvm_sjljeh_get_longjmp_value()
236   GetLJValue = M.getOrInsertFunction("__llvm_sjljeh_get_longjmp_value",
237                                      Type::Int32Ty, (Type *)0);
238   return true;
239 }
240
241 // IsTransformableFunction - Return true if the function name isn't one
242 // of the ones we don't want transformed. Currently, don't transform any
243 // "llvm.{setjmp,longjmp}" functions and none of the setjmp/longjmp error
244 // handling functions (beginning with __llvm_sjljeh_...they don't throw
245 // exceptions).
246 bool LowerSetJmp::IsTransformableFunction(const std::string& Name) {
247   std::string SJLJEh("__llvm_sjljeh");
248
249   if (Name.size() > SJLJEh.size())
250     return std::string(Name.begin(), Name.begin() + SJLJEh.size()) != SJLJEh;
251
252   return true;
253 }
254
255 // TransformLongJmpCall - Transform a longjmp call into a call to the
256 // internal __llvm_sjljeh_throw_longjmp function. It then takes care of
257 // throwing the exception for us.
258 void LowerSetJmp::TransformLongJmpCall(CallInst* Inst)
259 {
260   const Type* SBPTy = PointerType::getUnqual(Type::Int8Ty);
261
262   // Create the call to "__llvm_sjljeh_throw_longjmp". This takes the
263   // same parameters as "longjmp", except that the buffer is cast to a
264   // char*. It returns "void", so it doesn't need to replace any of
265   // Inst's uses and doesn't get a name.
266   CastInst* CI = 
267     new BitCastInst(Inst->getOperand(1), SBPTy, "LJBuf", Inst);
268   SmallVector<Value *, 2> Args;
269   Args.push_back(CI);
270   Args.push_back(Inst->getOperand(2));
271   CallInst::Create(ThrowLongJmp, Args.begin(), Args.end(), "", Inst);
272
273   SwitchValuePair& SVP = SwitchValMap[Inst->getParent()->getParent()];
274
275   // If the function has a setjmp call in it (they are transformed first)
276   // we should branch to the basic block that determines if this longjmp
277   // is applicable here. Otherwise, issue an unwind.
278   if (SVP.first)
279     BranchInst::Create(SVP.first->getParent(), Inst);
280   else
281     new UnwindInst(Inst);
282
283   // Remove all insts after the branch/unwind inst.  Go from back to front to
284   // avoid replaceAllUsesWith if possible.
285   BasicBlock *BB = Inst->getParent();
286   Instruction *Removed;
287   do {
288     Removed = &BB->back();
289     // If the removed instructions have any users, replace them now.
290     if (!Removed->use_empty())
291       Removed->replaceAllUsesWith(UndefValue::get(Removed->getType()));
292     Removed->eraseFromParent();
293   } while (Removed != Inst);
294
295   ++LongJmpsTransformed;
296 }
297
298 // GetSetJmpMap - Retrieve (create and initialize, if necessary) the
299 // setjmp map. This map is going to hold information about which setjmps
300 // were called (each setjmp gets its own number) and with which buffer it
301 // was called. There can be only one!
302 AllocaInst* LowerSetJmp::GetSetJmpMap(Function* Func)
303 {
304   if (SJMap[Func]) return SJMap[Func];
305
306   // Insert the setjmp map initialization before the first instruction in
307   // the function.
308   Instruction* Inst = Func->getEntryBlock().begin();
309   assert(Inst && "Couldn't find even ONE instruction in entry block!");
310
311   // Fill in the alloca and call to initialize the SJ map.
312   const Type *SBPTy = PointerType::getUnqual(Type::Int8Ty);
313   AllocaInst* Map = new AllocaInst(SBPTy, 0, "SJMap", Inst);
314   CallInst::Create(InitSJMap, Map, "", Inst);
315   return SJMap[Func] = Map;
316 }
317
318 // GetRethrowBB - Only one rethrow basic block is needed per function.
319 // If this is a longjmp exception but not handled in this block, this BB
320 // performs the rethrow.
321 BasicBlock* LowerSetJmp::GetRethrowBB(Function* Func)
322 {
323   if (RethrowBBMap[Func]) return RethrowBBMap[Func];
324
325   // The basic block we're going to jump to if we need to rethrow the
326   // exception.
327   BasicBlock* Rethrow = BasicBlock::Create("RethrowExcept", Func);
328
329   // Fill in the "Rethrow" BB with a call to rethrow the exception. This
330   // is the last instruction in the BB since at this point the runtime
331   // should exit this function and go to the next function.
332   new UnwindInst(Rethrow);
333   return RethrowBBMap[Func] = Rethrow;
334 }
335
336 // GetSJSwitch - Return the switch statement that controls which handler
337 // (if any) gets called and the value returned to that handler.
338 LowerSetJmp::SwitchValuePair LowerSetJmp::GetSJSwitch(Function* Func,
339                                                       BasicBlock* Rethrow)
340 {
341   if (SwitchValMap[Func].first) return SwitchValMap[Func];
342
343   BasicBlock* LongJmpPre = BasicBlock::Create("LongJmpBlkPre", Func);
344
345   // Keep track of the preliminary basic block for some of the other
346   // transformations.
347   PrelimBBMap[Func] = LongJmpPre;
348
349   // Grab the exception.
350   CallInst* Cond = CallInst::Create(IsLJException, "IsLJExcept", LongJmpPre);
351
352   // The "decision basic block" gets the number associated with the
353   // setjmp call returning to switch on and the value returned by
354   // longjmp.
355   BasicBlock* DecisionBB = BasicBlock::Create("LJDecisionBB", Func);
356
357   BranchInst::Create(DecisionBB, Rethrow, Cond, LongJmpPre);
358
359   // Fill in the "decision" basic block.
360   CallInst* LJVal = CallInst::Create(GetLJValue, "LJVal", DecisionBB);
361   CallInst* SJNum = CallInst::Create(TryCatchLJ, GetSetJmpMap(Func), "SJNum",
362                                      DecisionBB);
363
364   SwitchInst* SI = SwitchInst::Create(SJNum, Rethrow, 0, DecisionBB);
365   return SwitchValMap[Func] = SwitchValuePair(SI, LJVal);
366 }
367
368 // TransformSetJmpCall - The setjmp call is a bit trickier to transform.
369 // We're going to convert all setjmp calls to nops. Then all "call" and
370 // "invoke" instructions in the function are converted to "invoke" where
371 // the "except" branch is used when returning from a longjmp call.
372 void LowerSetJmp::TransformSetJmpCall(CallInst* Inst)
373 {
374   BasicBlock* ABlock = Inst->getParent();
375   Function* Func = ABlock->getParent();
376
377   // Add this setjmp to the setjmp map.
378   const Type* SBPTy = PointerType::getUnqual(Type::Int8Ty);
379   CastInst* BufPtr = 
380     new BitCastInst(Inst->getOperand(1), SBPTy, "SBJmpBuf", Inst);
381   std::vector<Value*> Args = 
382     make_vector<Value*>(GetSetJmpMap(Func), BufPtr,
383                         ConstantInt::get(Type::Int32Ty,
384                                          SetJmpIDMap[Func]++), 0);
385   CallInst::Create(AddSJToMap, Args.begin(), Args.end(), "", Inst);
386
387   // We are guaranteed that there are no values live across basic blocks
388   // (because we are "not in SSA form" yet), but there can still be values live
389   // in basic blocks.  Because of this, splitting the setjmp block can cause
390   // values above the setjmp to not dominate uses which are after the setjmp
391   // call.  For all of these occasions, we must spill the value to the stack.
392   //
393   std::set<Instruction*> InstrsAfterCall;
394
395   // The call is probably very close to the end of the basic block, for the
396   // common usage pattern of: 'if (setjmp(...))', so keep track of the
397   // instructions after the call.
398   for (BasicBlock::iterator I = ++BasicBlock::iterator(Inst), E = ABlock->end();
399        I != E; ++I)
400     InstrsAfterCall.insert(I);
401
402   for (BasicBlock::iterator II = ABlock->begin();
403        II != BasicBlock::iterator(Inst); ++II)
404     // Loop over all of the uses of instruction.  If any of them are after the
405     // call, "spill" the value to the stack.
406     for (Value::use_iterator UI = II->use_begin(), E = II->use_end();
407          UI != E; ++UI)
408       if (cast<Instruction>(*UI)->getParent() != ABlock ||
409           InstrsAfterCall.count(cast<Instruction>(*UI))) {
410         DemoteRegToStack(*II);
411         break;
412       }
413   InstrsAfterCall.clear();
414
415   // Change the setjmp call into a branch statement. We'll remove the
416   // setjmp call in a little bit. No worries.
417   BasicBlock* SetJmpContBlock = ABlock->splitBasicBlock(Inst);
418   assert(SetJmpContBlock && "Couldn't split setjmp BB!!");
419
420   SetJmpContBlock->setName(ABlock->getName()+"SetJmpCont");
421
422   // Add the SetJmpContBlock to the set of blocks reachable from a setjmp.
423   DFSBlocks.insert(SetJmpContBlock);
424
425   // This PHI node will be in the new block created from the
426   // splitBasicBlock call.
427   PHINode* PHI = PHINode::Create(Type::Int32Ty, "SetJmpReturn", Inst);
428
429   // Coming from a call to setjmp, the return is 0.
430   PHI->addIncoming(ConstantInt::getNullValue(Type::Int32Ty), ABlock);
431
432   // Add the case for this setjmp's number...
433   SwitchValuePair SVP = GetSJSwitch(Func, GetRethrowBB(Func));
434   SVP.first->addCase(ConstantInt::get(Type::Int32Ty, SetJmpIDMap[Func] - 1),
435                      SetJmpContBlock);
436
437   // Value coming from the handling of the exception.
438   PHI->addIncoming(SVP.second, SVP.second->getParent());
439
440   // Replace all uses of this instruction with the PHI node created by
441   // the eradication of setjmp.
442   Inst->replaceAllUsesWith(PHI);
443   Inst->eraseFromParent();
444
445   ++SetJmpsTransformed;
446 }
447
448 // visitCallInst - This converts all LLVM call instructions into invoke
449 // instructions. The except part of the invoke goes to the "LongJmpBlkPre"
450 // that grabs the exception and proceeds to determine if it's a longjmp
451 // exception or not.
452 void LowerSetJmp::visitCallInst(CallInst& CI)
453 {
454   if (CI.getCalledFunction())
455     if (!IsTransformableFunction(CI.getCalledFunction()->getName()) ||
456         CI.getCalledFunction()->isIntrinsic()) return;
457
458   BasicBlock* OldBB = CI.getParent();
459
460   // If not reachable from a setjmp call, don't transform.
461   if (!DFSBlocks.count(OldBB)) return;
462
463   BasicBlock* NewBB = OldBB->splitBasicBlock(CI);
464   assert(NewBB && "Couldn't split BB of \"call\" instruction!!");
465   DFSBlocks.insert(NewBB);
466   NewBB->setName("Call2Invoke");
467
468   Function* Func = OldBB->getParent();
469
470   // Construct the new "invoke" instruction.
471   TerminatorInst* Term = OldBB->getTerminator();
472   std::vector<Value*> Params(CI.op_begin() + 1, CI.op_end());
473   InvokeInst* II =
474     InvokeInst::Create(CI.getCalledValue(), NewBB, PrelimBBMap[Func],
475                        Params.begin(), Params.end(), CI.getName(), Term);
476   II->setCallingConv(CI.getCallingConv());
477   II->setParamAttrs(CI.getParamAttrs());
478
479   // Replace the old call inst with the invoke inst and remove the call.
480   CI.replaceAllUsesWith(II);
481   CI.eraseFromParent();
482
483   // The old terminator is useless now that we have the invoke inst.
484   Term->eraseFromParent();
485   ++CallsTransformed;
486 }
487
488 // visitInvokeInst - Converting the "invoke" instruction is fairly
489 // straight-forward. The old exception part is replaced by a query asking
490 // if this is a longjmp exception. If it is, then it goes to the longjmp
491 // exception blocks. Otherwise, control is passed the old exception.
492 void LowerSetJmp::visitInvokeInst(InvokeInst& II)
493 {
494   if (II.getCalledFunction())
495     if (!IsTransformableFunction(II.getCalledFunction()->getName()) ||
496         II.getCalledFunction()->isIntrinsic()) return;
497
498   BasicBlock* BB = II.getParent();
499
500   // If not reachable from a setjmp call, don't transform.
501   if (!DFSBlocks.count(BB)) return;
502
503   BasicBlock* ExceptBB = II.getUnwindDest();
504
505   Function* Func = BB->getParent();
506   BasicBlock* NewExceptBB = BasicBlock::Create("InvokeExcept", Func);
507
508   // If this is a longjmp exception, then branch to the preliminary BB of
509   // the longjmp exception handling. Otherwise, go to the old exception.
510   CallInst* IsLJExcept = CallInst::Create(IsLJException, "IsLJExcept",
511                                           NewExceptBB);
512
513   BranchInst::Create(PrelimBBMap[Func], ExceptBB, IsLJExcept, NewExceptBB);
514
515   II.setUnwindDest(NewExceptBB);
516   ++InvokesTransformed;
517 }
518
519 // visitReturnInst - We want to destroy the setjmp map upon exit from the
520 // function.
521 void LowerSetJmp::visitReturnInst(ReturnInst &RI) {
522   Function* Func = RI.getParent()->getParent();
523   CallInst::Create(DestroySJMap, GetSetJmpMap(Func), "", &RI);
524 }
525
526 // visitUnwindInst - We want to destroy the setjmp map upon exit from the
527 // function.
528 void LowerSetJmp::visitUnwindInst(UnwindInst &UI) {
529   Function* Func = UI.getParent()->getParent();
530   CallInst::Create(DestroySJMap, GetSetJmpMap(Func), "", &UI);
531 }
532
533 ModulePass *llvm::createLowerSetJmpPass() {
534   return new LowerSetJmp();
535 }
536