Make FastEmit_ri_ try a bit harder to succeed for supported operations; FastEmit_i...
[oota-llvm.git] / lib / CodeGen / SelectionDAG / FastISel.cpp
1 //===-- FastISel.cpp - Implementation of the FastISel class ---------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file contains the implementation of the FastISel class.
11 //
12 // "Fast" instruction selection is designed to emit very poor code quickly.
13 // Also, it is not designed to be able to do much lowering, so most illegal
14 // types (e.g. i64 on 32-bit targets) and operations are not supported.  It is
15 // also not intended to be able to do much optimization, except in a few cases
16 // where doing optimizations reduces overall compile time.  For example, folding
17 // constants into immediate fields is often done, because it's cheap and it
18 // reduces the number of instructions later phases have to examine.
19 //
20 // "Fast" instruction selection is able to fail gracefully and transfer
21 // control to the SelectionDAG selector for operations that it doesn't
22 // support.  In many cases, this allows us to avoid duplicating a lot of
23 // the complicated lowering logic that SelectionDAG currently has.
24 //
25 // The intended use for "fast" instruction selection is "-O0" mode
26 // compilation, where the quality of the generated code is irrelevant when
27 // weighed against the speed at which the code can be generated.  Also,
28 // at -O0, the LLVM optimizers are not running, and this makes the
29 // compile time of codegen a much higher portion of the overall compile
30 // time.  Despite its limitations, "fast" instruction selection is able to
31 // handle enough code on its own to provide noticeable overall speedups
32 // in -O0 compiles.
33 //
34 // Basic operations are supported in a target-independent way, by reading
35 // the same instruction descriptions that the SelectionDAG selector reads,
36 // and identifying simple arithmetic operations that can be directly selected
37 // from simple operators.  More complicated operations currently require
38 // target-specific code.
39 //
40 //===----------------------------------------------------------------------===//
41
42 #include "llvm/Function.h"
43 #include "llvm/GlobalVariable.h"
44 #include "llvm/Instructions.h"
45 #include "llvm/IntrinsicInst.h"
46 #include "llvm/Operator.h"
47 #include "llvm/CodeGen/FastISel.h"
48 #include "llvm/CodeGen/FunctionLoweringInfo.h"
49 #include "llvm/CodeGen/MachineInstrBuilder.h"
50 #include "llvm/CodeGen/MachineModuleInfo.h"
51 #include "llvm/CodeGen/MachineRegisterInfo.h"
52 #include "llvm/Analysis/DebugInfo.h"
53 #include "llvm/Analysis/Loads.h"
54 #include "llvm/Target/TargetData.h"
55 #include "llvm/Target/TargetInstrInfo.h"
56 #include "llvm/Target/TargetLowering.h"
57 #include "llvm/Target/TargetMachine.h"
58 #include "llvm/Support/ErrorHandling.h"
59 #include "llvm/Support/Debug.h"
60 using namespace llvm;
61
62 /// startNewBlock - Set the current block to which generated machine
63 /// instructions will be appended, and clear the local CSE map.
64 ///
65 void FastISel::startNewBlock() {
66   LocalValueMap.clear();
67
68   // Start out as null, meaining no local-value instructions have
69   // been emitted.
70   LastLocalValue = 0;
71
72   // Advance the last local value past any EH_LABEL instructions.
73   MachineBasicBlock::iterator
74     I = FuncInfo.MBB->begin(), E = FuncInfo.MBB->end();
75   while (I != E && I->getOpcode() == TargetOpcode::EH_LABEL) {
76     LastLocalValue = I;
77     ++I;
78   }
79 }
80
81 bool FastISel::hasTrivialKill(const Value *V) const {
82   // Don't consider constants or arguments to have trivial kills.
83   const Instruction *I = dyn_cast<Instruction>(V);
84   if (!I)
85     return false;
86
87   // No-op casts are trivially coalesced by fast-isel.
88   if (const CastInst *Cast = dyn_cast<CastInst>(I))
89     if (Cast->isNoopCast(TD.getIntPtrType(Cast->getContext())) &&
90         !hasTrivialKill(Cast->getOperand(0)))
91       return false;
92
93   // Only instructions with a single use in the same basic block are considered
94   // to have trivial kills.
95   return I->hasOneUse() &&
96          !(I->getOpcode() == Instruction::BitCast ||
97            I->getOpcode() == Instruction::PtrToInt ||
98            I->getOpcode() == Instruction::IntToPtr) &&
99          cast<Instruction>(*I->use_begin())->getParent() == I->getParent();
100 }
101
102 unsigned FastISel::getRegForValue(const Value *V) {
103   EVT RealVT = TLI.getValueType(V->getType(), /*AllowUnknown=*/true);
104   // Don't handle non-simple values in FastISel.
105   if (!RealVT.isSimple())
106     return 0;
107
108   // Ignore illegal types. We must do this before looking up the value
109   // in ValueMap because Arguments are given virtual registers regardless
110   // of whether FastISel can handle them.
111   MVT VT = RealVT.getSimpleVT();
112   if (!TLI.isTypeLegal(VT)) {
113     // Promote MVT::i1 to a legal type though, because it's common and easy.
114     if (VT == MVT::i1)
115       VT = TLI.getTypeToTransformTo(V->getContext(), VT).getSimpleVT();
116     else
117       return 0;
118   }
119
120   // Look up the value to see if we already have a register for it. We
121   // cache values defined by Instructions across blocks, and other values
122   // only locally. This is because Instructions already have the SSA
123   // def-dominates-use requirement enforced.
124   DenseMap<const Value *, unsigned>::iterator I = FuncInfo.ValueMap.find(V);
125   if (I != FuncInfo.ValueMap.end())
126     return I->second;
127
128   unsigned Reg = LocalValueMap[V];
129   if (Reg != 0)
130     return Reg;
131
132   // In bottom-up mode, just create the virtual register which will be used
133   // to hold the value. It will be materialized later.
134   if (isa<Instruction>(V) &&
135       (!isa<AllocaInst>(V) ||
136        !FuncInfo.StaticAllocaMap.count(cast<AllocaInst>(V))))
137     return FuncInfo.InitializeRegForValue(V);
138
139   SavePoint SaveInsertPt = enterLocalValueArea();
140
141   // Materialize the value in a register. Emit any instructions in the
142   // local value area.
143   Reg = materializeRegForValue(V, VT);
144
145   leaveLocalValueArea(SaveInsertPt);
146
147   return Reg;
148 }
149
150 /// materializeRegForValue - Helper for getRegForValue. This function is
151 /// called when the value isn't already available in a register and must
152 /// be materialized with new instructions.
153 unsigned FastISel::materializeRegForValue(const Value *V, MVT VT) {
154   unsigned Reg = 0;
155
156   if (const ConstantInt *CI = dyn_cast<ConstantInt>(V)) {
157     if (CI->getValue().getActiveBits() <= 64)
158       Reg = FastEmit_i(VT, VT, ISD::Constant, CI->getZExtValue());
159   } else if (isa<AllocaInst>(V)) {
160     Reg = TargetMaterializeAlloca(cast<AllocaInst>(V));
161   } else if (isa<ConstantPointerNull>(V)) {
162     // Translate this as an integer zero so that it can be
163     // local-CSE'd with actual integer zeros.
164     Reg =
165       getRegForValue(Constant::getNullValue(TD.getIntPtrType(V->getContext())));
166   } else if (const ConstantFP *CF = dyn_cast<ConstantFP>(V)) {
167     if (CF->isNullValue()) {
168       Reg = TargetMaterializeFloatZero(CF);
169     } else {
170       // Try to emit the constant directly.
171       Reg = FastEmit_f(VT, VT, ISD::ConstantFP, CF);
172     }
173
174     if (!Reg) {
175       // Try to emit the constant by using an integer constant with a cast.
176       const APFloat &Flt = CF->getValueAPF();
177       EVT IntVT = TLI.getPointerTy();
178
179       uint64_t x[2];
180       uint32_t IntBitWidth = IntVT.getSizeInBits();
181       bool isExact;
182       (void) Flt.convertToInteger(x, IntBitWidth, /*isSigned=*/true,
183                                 APFloat::rmTowardZero, &isExact);
184       if (isExact) {
185         APInt IntVal(IntBitWidth, 2, x);
186
187         unsigned IntegerReg =
188           getRegForValue(ConstantInt::get(V->getContext(), IntVal));
189         if (IntegerReg != 0)
190           Reg = FastEmit_r(IntVT.getSimpleVT(), VT, ISD::SINT_TO_FP,
191                            IntegerReg, /*Kill=*/false);
192       }
193     }
194   } else if (const Operator *Op = dyn_cast<Operator>(V)) {
195     if (!SelectOperator(Op, Op->getOpcode()))
196       if (!isa<Instruction>(Op) ||
197           !TargetSelectInstruction(cast<Instruction>(Op)))
198         return 0;
199     Reg = lookUpRegForValue(Op);
200   } else if (isa<UndefValue>(V)) {
201     Reg = createResultReg(TLI.getRegClassFor(VT));
202     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL,
203             TII.get(TargetOpcode::IMPLICIT_DEF), Reg);
204   }
205
206   // If target-independent code couldn't handle the value, give target-specific
207   // code a try.
208   if (!Reg && isa<Constant>(V))
209     Reg = TargetMaterializeConstant(cast<Constant>(V));
210
211   // Don't cache constant materializations in the general ValueMap.
212   // To do so would require tracking what uses they dominate.
213   if (Reg != 0) {
214     LocalValueMap[V] = Reg;
215     LastLocalValue = MRI.getVRegDef(Reg);
216   }
217   return Reg;
218 }
219
220 unsigned FastISel::lookUpRegForValue(const Value *V) {
221   // Look up the value to see if we already have a register for it. We
222   // cache values defined by Instructions across blocks, and other values
223   // only locally. This is because Instructions already have the SSA
224   // def-dominates-use requirement enforced.
225   DenseMap<const Value *, unsigned>::iterator I = FuncInfo.ValueMap.find(V);
226   if (I != FuncInfo.ValueMap.end())
227     return I->second;
228   return LocalValueMap[V];
229 }
230
231 /// UpdateValueMap - Update the value map to include the new mapping for this
232 /// instruction, or insert an extra copy to get the result in a previous
233 /// determined register.
234 /// NOTE: This is only necessary because we might select a block that uses
235 /// a value before we select the block that defines the value.  It might be
236 /// possible to fix this by selecting blocks in reverse postorder.
237 unsigned FastISel::UpdateValueMap(const Value *I, unsigned Reg) {
238   if (!isa<Instruction>(I)) {
239     LocalValueMap[I] = Reg;
240     return Reg;
241   }
242
243   unsigned &AssignedReg = FuncInfo.ValueMap[I];
244   if (AssignedReg == 0)
245     // Use the new register.
246     AssignedReg = Reg;
247   else if (Reg != AssignedReg) {
248     // Arrange for uses of AssignedReg to be replaced by uses of Reg.
249     FuncInfo.RegFixups[AssignedReg] = Reg;
250
251     AssignedReg = Reg;
252   }
253
254   return AssignedReg;
255 }
256
257 std::pair<unsigned, bool> FastISel::getRegForGEPIndex(const Value *Idx) {
258   unsigned IdxN = getRegForValue(Idx);
259   if (IdxN == 0)
260     // Unhandled operand. Halt "fast" selection and bail.
261     return std::pair<unsigned, bool>(0, false);
262
263   bool IdxNIsKill = hasTrivialKill(Idx);
264
265   // If the index is smaller or larger than intptr_t, truncate or extend it.
266   MVT PtrVT = TLI.getPointerTy();
267   EVT IdxVT = EVT::getEVT(Idx->getType(), /*HandleUnknown=*/false);
268   if (IdxVT.bitsLT(PtrVT)) {
269     IdxN = FastEmit_r(IdxVT.getSimpleVT(), PtrVT, ISD::SIGN_EXTEND,
270                       IdxN, IdxNIsKill);
271     IdxNIsKill = true;
272   }
273   else if (IdxVT.bitsGT(PtrVT)) {
274     IdxN = FastEmit_r(IdxVT.getSimpleVT(), PtrVT, ISD::TRUNCATE,
275                       IdxN, IdxNIsKill);
276     IdxNIsKill = true;
277   }
278   return std::pair<unsigned, bool>(IdxN, IdxNIsKill);
279 }
280
281 void FastISel::recomputeInsertPt() {
282   if (getLastLocalValue()) {
283     FuncInfo.InsertPt = getLastLocalValue();
284     FuncInfo.MBB = FuncInfo.InsertPt->getParent();
285     ++FuncInfo.InsertPt;
286   } else
287     FuncInfo.InsertPt = FuncInfo.MBB->getFirstNonPHI();
288
289   // Now skip past any EH_LABELs, which must remain at the beginning.
290   while (FuncInfo.InsertPt != FuncInfo.MBB->end() &&
291          FuncInfo.InsertPt->getOpcode() == TargetOpcode::EH_LABEL)
292     ++FuncInfo.InsertPt;
293 }
294
295 FastISel::SavePoint FastISel::enterLocalValueArea() {
296   MachineBasicBlock::iterator OldInsertPt = FuncInfo.InsertPt;
297   DebugLoc OldDL = DL;
298   recomputeInsertPt();
299   DL = DebugLoc();
300   SavePoint SP = { OldInsertPt, OldDL };
301   return SP;
302 }
303
304 void FastISel::leaveLocalValueArea(SavePoint OldInsertPt) {
305   if (FuncInfo.InsertPt != FuncInfo.MBB->begin())
306     LastLocalValue = llvm::prior(FuncInfo.InsertPt);
307
308   // Restore the previous insert position.
309   FuncInfo.InsertPt = OldInsertPt.InsertPt;
310   DL = OldInsertPt.DL;
311 }
312
313 /// SelectBinaryOp - Select and emit code for a binary operator instruction,
314 /// which has an opcode which directly corresponds to the given ISD opcode.
315 ///
316 bool FastISel::SelectBinaryOp(const User *I, unsigned ISDOpcode) {
317   EVT VT = EVT::getEVT(I->getType(), /*HandleUnknown=*/true);
318   if (VT == MVT::Other || !VT.isSimple())
319     // Unhandled type. Halt "fast" selection and bail.
320     return false;
321
322   // We only handle legal types. For example, on x86-32 the instruction
323   // selector contains all of the 64-bit instructions from x86-64,
324   // under the assumption that i64 won't be used if the target doesn't
325   // support it.
326   if (!TLI.isTypeLegal(VT)) {
327     // MVT::i1 is special. Allow AND, OR, or XOR because they
328     // don't require additional zeroing, which makes them easy.
329     if (VT == MVT::i1 &&
330         (ISDOpcode == ISD::AND || ISDOpcode == ISD::OR ||
331          ISDOpcode == ISD::XOR))
332       VT = TLI.getTypeToTransformTo(I->getContext(), VT);
333     else
334       return false;
335   }
336
337   // Check if the first operand is a constant, and handle it as "ri".  At -O0,
338   // we don't have anything that canonicalizes operand order.
339   if (ConstantInt *CI = dyn_cast<ConstantInt>(I->getOperand(0)))
340     if (isa<Instruction>(I) && cast<Instruction>(I)->isCommutative()) {
341       unsigned Op1 = getRegForValue(I->getOperand(1));
342       if (Op1 == 0) return false;
343
344       bool Op1IsKill = hasTrivialKill(I->getOperand(1));
345
346       unsigned ResultReg = FastEmit_ri_(VT.getSimpleVT(), ISDOpcode, Op1,
347                                         Op1IsKill, CI->getZExtValue(),
348                                         VT.getSimpleVT());
349       if (ResultReg == 0) return false;
350
351       // We successfully emitted code for the given LLVM Instruction.
352       UpdateValueMap(I, ResultReg);
353       return true;
354     }
355
356
357   unsigned Op0 = getRegForValue(I->getOperand(0));
358   if (Op0 == 0)   // Unhandled operand. Halt "fast" selection and bail.
359     return false;
360
361   bool Op0IsKill = hasTrivialKill(I->getOperand(0));
362
363   // Check if the second operand is a constant and handle it appropriately.
364   if (ConstantInt *CI = dyn_cast<ConstantInt>(I->getOperand(1))) {
365     uint64_t Imm = CI->getZExtValue();
366
367     // Transform "sdiv exact X, 8" -> "sra X, 3".
368     if (ISDOpcode == ISD::SDIV && isa<BinaryOperator>(I) &&
369         cast<BinaryOperator>(I)->isExact() &&
370         isPowerOf2_64(Imm)) {
371       Imm = Log2_64(Imm);
372       ISDOpcode = ISD::SRA;
373     }
374
375     unsigned ResultReg = FastEmit_ri_(VT.getSimpleVT(), ISDOpcode, Op0,
376                                       Op0IsKill, Imm, VT.getSimpleVT());
377     if (ResultReg == 0) return false;
378
379     // We successfully emitted code for the given LLVM Instruction.
380     UpdateValueMap(I, ResultReg);
381     return true;
382   }
383
384   // Check if the second operand is a constant float.
385   if (ConstantFP *CF = dyn_cast<ConstantFP>(I->getOperand(1))) {
386     unsigned ResultReg = FastEmit_rf(VT.getSimpleVT(), VT.getSimpleVT(),
387                                      ISDOpcode, Op0, Op0IsKill, CF);
388     if (ResultReg != 0) {
389       // We successfully emitted code for the given LLVM Instruction.
390       UpdateValueMap(I, ResultReg);
391       return true;
392     }
393   }
394
395   unsigned Op1 = getRegForValue(I->getOperand(1));
396   if (Op1 == 0)
397     // Unhandled operand. Halt "fast" selection and bail.
398     return false;
399
400   bool Op1IsKill = hasTrivialKill(I->getOperand(1));
401
402   // Now we have both operands in registers. Emit the instruction.
403   unsigned ResultReg = FastEmit_rr(VT.getSimpleVT(), VT.getSimpleVT(),
404                                    ISDOpcode,
405                                    Op0, Op0IsKill,
406                                    Op1, Op1IsKill);
407   if (ResultReg == 0)
408     // Target-specific code wasn't able to find a machine opcode for
409     // the given ISD opcode and type. Halt "fast" selection and bail.
410     return false;
411
412   // We successfully emitted code for the given LLVM Instruction.
413   UpdateValueMap(I, ResultReg);
414   return true;
415 }
416
417 bool FastISel::SelectGetElementPtr(const User *I) {
418   unsigned N = getRegForValue(I->getOperand(0));
419   if (N == 0)
420     // Unhandled operand. Halt "fast" selection and bail.
421     return false;
422
423   bool NIsKill = hasTrivialKill(I->getOperand(0));
424
425   const Type *Ty = I->getOperand(0)->getType();
426   MVT VT = TLI.getPointerTy();
427   for (GetElementPtrInst::const_op_iterator OI = I->op_begin()+1,
428        E = I->op_end(); OI != E; ++OI) {
429     const Value *Idx = *OI;
430     if (const StructType *StTy = dyn_cast<StructType>(Ty)) {
431       unsigned Field = cast<ConstantInt>(Idx)->getZExtValue();
432       if (Field) {
433         // N = N + Offset
434         uint64_t Offs = TD.getStructLayout(StTy)->getElementOffset(Field);
435         // FIXME: This can be optimized by combining the add with a
436         // subsequent one.
437         N = FastEmit_ri_(VT, ISD::ADD, N, NIsKill, Offs, VT);
438         if (N == 0)
439           // Unhandled operand. Halt "fast" selection and bail.
440           return false;
441         NIsKill = true;
442       }
443       Ty = StTy->getElementType(Field);
444     } else {
445       Ty = cast<SequentialType>(Ty)->getElementType();
446
447       // If this is a constant subscript, handle it quickly.
448       if (const ConstantInt *CI = dyn_cast<ConstantInt>(Idx)) {
449         if (CI->isZero()) continue;
450         uint64_t Offs =
451           TD.getTypeAllocSize(Ty)*cast<ConstantInt>(CI)->getSExtValue();
452         N = FastEmit_ri_(VT, ISD::ADD, N, NIsKill, Offs, VT);
453         if (N == 0)
454           // Unhandled operand. Halt "fast" selection and bail.
455           return false;
456         NIsKill = true;
457         continue;
458       }
459
460       // N = N + Idx * ElementSize;
461       uint64_t ElementSize = TD.getTypeAllocSize(Ty);
462       std::pair<unsigned, bool> Pair = getRegForGEPIndex(Idx);
463       unsigned IdxN = Pair.first;
464       bool IdxNIsKill = Pair.second;
465       if (IdxN == 0)
466         // Unhandled operand. Halt "fast" selection and bail.
467         return false;
468
469       if (ElementSize != 1) {
470         IdxN = FastEmit_ri_(VT, ISD::MUL, IdxN, IdxNIsKill, ElementSize, VT);
471         if (IdxN == 0)
472           // Unhandled operand. Halt "fast" selection and bail.
473           return false;
474         IdxNIsKill = true;
475       }
476       N = FastEmit_rr(VT, VT, ISD::ADD, N, NIsKill, IdxN, IdxNIsKill);
477       if (N == 0)
478         // Unhandled operand. Halt "fast" selection and bail.
479         return false;
480     }
481   }
482
483   // We successfully emitted code for the given LLVM Instruction.
484   UpdateValueMap(I, N);
485   return true;
486 }
487
488 bool FastISel::SelectCall(const User *I) {
489   const CallInst *Call = cast<CallInst>(I);
490
491   // Handle simple inline asms.
492   if (const InlineAsm *IA = dyn_cast<InlineAsm>(Call->getArgOperand(0))) {
493     // Don't attempt to handle constraints.
494     if (!IA->getConstraintString().empty())
495       return false;
496
497     unsigned ExtraInfo = 0;
498     if (IA->hasSideEffects())
499       ExtraInfo |= InlineAsm::Extra_HasSideEffects;
500     if (IA->isAlignStack())
501       ExtraInfo |= InlineAsm::Extra_IsAlignStack;
502
503     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL,
504             TII.get(TargetOpcode::INLINEASM))
505       .addExternalSymbol(IA->getAsmString().c_str())
506       .addImm(ExtraInfo);
507     return true;
508   }
509
510   const Function *F = Call->getCalledFunction();
511   if (!F) return false;
512
513   // Handle selected intrinsic function calls.
514   switch (F->getIntrinsicID()) {
515   default: break;
516   case Intrinsic::dbg_declare: {
517     const DbgDeclareInst *DI = cast<DbgDeclareInst>(Call);
518     if (!DIVariable(DI->getVariable()).Verify() ||
519         !FuncInfo.MF->getMMI().hasDebugInfo())
520       return true;
521
522     const Value *Address = DI->getAddress();
523     if (!Address || isa<UndefValue>(Address) || isa<AllocaInst>(Address))
524       return true;
525
526     unsigned Reg = 0;
527     unsigned Offset = 0;
528     if (const Argument *Arg = dyn_cast<Argument>(Address)) {
529       if (Arg->hasByValAttr()) {
530         // Byval arguments' frame index is recorded during argument lowering.
531         // Use this info directly.
532         Offset = FuncInfo.getByValArgumentFrameIndex(Arg);
533         if (Offset)
534           Reg = TRI.getFrameRegister(*FuncInfo.MF);
535       }
536     }
537     if (!Reg)
538       Reg = getRegForValue(Address);
539
540     if (Reg)
541       BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL,
542               TII.get(TargetOpcode::DBG_VALUE))
543         .addReg(Reg, RegState::Debug).addImm(Offset)
544         .addMetadata(DI->getVariable());
545     return true;
546   }
547   case Intrinsic::dbg_value: {
548     // This form of DBG_VALUE is target-independent.
549     const DbgValueInst *DI = cast<DbgValueInst>(Call);
550     const TargetInstrDesc &II = TII.get(TargetOpcode::DBG_VALUE);
551     const Value *V = DI->getValue();
552     if (!V) {
553       // Currently the optimizer can produce this; insert an undef to
554       // help debugging.  Probably the optimizer should not do this.
555       BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
556         .addReg(0U).addImm(DI->getOffset())
557         .addMetadata(DI->getVariable());
558     } else if (const ConstantInt *CI = dyn_cast<ConstantInt>(V)) {
559       BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
560         .addImm(CI->getZExtValue()).addImm(DI->getOffset())
561         .addMetadata(DI->getVariable());
562     } else if (const ConstantFP *CF = dyn_cast<ConstantFP>(V)) {
563       BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
564         .addFPImm(CF).addImm(DI->getOffset())
565         .addMetadata(DI->getVariable());
566     } else if (unsigned Reg = lookUpRegForValue(V)) {
567       BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
568         .addReg(Reg, RegState::Debug).addImm(DI->getOffset())
569         .addMetadata(DI->getVariable());
570     } else {
571       // We can't yet handle anything else here because it would require
572       // generating code, thus altering codegen because of debug info.
573       DEBUG(dbgs() << "Dropping debug info for " << DI);
574     }
575     return true;
576   }
577   case Intrinsic::eh_exception: {
578     EVT VT = TLI.getValueType(Call->getType());
579     if (TLI.getOperationAction(ISD::EXCEPTIONADDR, VT)!=TargetLowering::Expand)
580       break;
581
582     assert(FuncInfo.MBB->isLandingPad() &&
583            "Call to eh.exception not in landing pad!");
584     unsigned Reg = TLI.getExceptionAddressRegister();
585     const TargetRegisterClass *RC = TLI.getRegClassFor(VT);
586     unsigned ResultReg = createResultReg(RC);
587     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
588             ResultReg).addReg(Reg);
589     UpdateValueMap(Call, ResultReg);
590     return true;
591   }
592   case Intrinsic::eh_selector: {
593     EVT VT = TLI.getValueType(Call->getType());
594     if (TLI.getOperationAction(ISD::EHSELECTION, VT) != TargetLowering::Expand)
595       break;
596     if (FuncInfo.MBB->isLandingPad())
597       AddCatchInfo(*Call, &FuncInfo.MF->getMMI(), FuncInfo.MBB);
598     else {
599 #ifndef NDEBUG
600       FuncInfo.CatchInfoLost.insert(Call);
601 #endif
602       // FIXME: Mark exception selector register as live in.  Hack for PR1508.
603       unsigned Reg = TLI.getExceptionSelectorRegister();
604       if (Reg) FuncInfo.MBB->addLiveIn(Reg);
605     }
606
607     unsigned Reg = TLI.getExceptionSelectorRegister();
608     EVT SrcVT = TLI.getPointerTy();
609     const TargetRegisterClass *RC = TLI.getRegClassFor(SrcVT);
610     unsigned ResultReg = createResultReg(RC);
611     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
612             ResultReg).addReg(Reg);
613
614     bool ResultRegIsKill = hasTrivialKill(Call);
615
616     // Cast the register to the type of the selector.
617     if (SrcVT.bitsGT(MVT::i32))
618       ResultReg = FastEmit_r(SrcVT.getSimpleVT(), MVT::i32, ISD::TRUNCATE,
619                              ResultReg, ResultRegIsKill);
620     else if (SrcVT.bitsLT(MVT::i32))
621       ResultReg = FastEmit_r(SrcVT.getSimpleVT(), MVT::i32,
622                              ISD::SIGN_EXTEND, ResultReg, ResultRegIsKill);
623     if (ResultReg == 0)
624       // Unhandled operand. Halt "fast" selection and bail.
625       return false;
626
627     UpdateValueMap(Call, ResultReg);
628
629     return true;
630   }
631   }
632
633   // An arbitrary call. Bail.
634   return false;
635 }
636
637 bool FastISel::SelectCast(const User *I, unsigned Opcode) {
638   EVT SrcVT = TLI.getValueType(I->getOperand(0)->getType());
639   EVT DstVT = TLI.getValueType(I->getType());
640
641   if (SrcVT == MVT::Other || !SrcVT.isSimple() ||
642       DstVT == MVT::Other || !DstVT.isSimple())
643     // Unhandled type. Halt "fast" selection and bail.
644     return false;
645
646   // Check if the destination type is legal. Or as a special case,
647   // it may be i1 if we're doing a truncate because that's
648   // easy and somewhat common.
649   if (!TLI.isTypeLegal(DstVT))
650     if (DstVT != MVT::i1 || Opcode != ISD::TRUNCATE)
651       // Unhandled type. Halt "fast" selection and bail.
652       return false;
653
654   // Check if the source operand is legal. Or as a special case,
655   // it may be i1 if we're doing zero-extension because that's
656   // easy and somewhat common.
657   if (!TLI.isTypeLegal(SrcVT))
658     if (SrcVT != MVT::i1 || Opcode != ISD::ZERO_EXTEND)
659       // Unhandled type. Halt "fast" selection and bail.
660       return false;
661
662   unsigned InputReg = getRegForValue(I->getOperand(0));
663   if (!InputReg)
664     // Unhandled operand.  Halt "fast" selection and bail.
665     return false;
666
667   bool InputRegIsKill = hasTrivialKill(I->getOperand(0));
668
669   // If the operand is i1, arrange for the high bits in the register to be zero.
670   if (SrcVT == MVT::i1) {
671    SrcVT = TLI.getTypeToTransformTo(I->getContext(), SrcVT);
672    InputReg = FastEmitZExtFromI1(SrcVT.getSimpleVT(), InputReg, InputRegIsKill);
673    if (!InputReg)
674      return false;
675    InputRegIsKill = true;
676   }
677   // If the result is i1, truncate to the target's type for i1 first.
678   if (DstVT == MVT::i1)
679     DstVT = TLI.getTypeToTransformTo(I->getContext(), DstVT);
680
681   unsigned ResultReg = FastEmit_r(SrcVT.getSimpleVT(),
682                                   DstVT.getSimpleVT(),
683                                   Opcode,
684                                   InputReg, InputRegIsKill);
685   if (!ResultReg)
686     return false;
687
688   UpdateValueMap(I, ResultReg);
689   return true;
690 }
691
692 bool FastISel::SelectBitCast(const User *I) {
693   // If the bitcast doesn't change the type, just use the operand value.
694   if (I->getType() == I->getOperand(0)->getType()) {
695     unsigned Reg = getRegForValue(I->getOperand(0));
696     if (Reg == 0)
697       return false;
698     UpdateValueMap(I, Reg);
699     return true;
700   }
701
702   // Bitcasts of other values become reg-reg copies or BITCAST operators.
703   EVT SrcVT = TLI.getValueType(I->getOperand(0)->getType());
704   EVT DstVT = TLI.getValueType(I->getType());
705
706   if (SrcVT == MVT::Other || !SrcVT.isSimple() ||
707       DstVT == MVT::Other || !DstVT.isSimple() ||
708       !TLI.isTypeLegal(SrcVT) || !TLI.isTypeLegal(DstVT))
709     // Unhandled type. Halt "fast" selection and bail.
710     return false;
711
712   unsigned Op0 = getRegForValue(I->getOperand(0));
713   if (Op0 == 0)
714     // Unhandled operand. Halt "fast" selection and bail.
715     return false;
716
717   bool Op0IsKill = hasTrivialKill(I->getOperand(0));
718
719   // First, try to perform the bitcast by inserting a reg-reg copy.
720   unsigned ResultReg = 0;
721   if (SrcVT.getSimpleVT() == DstVT.getSimpleVT()) {
722     TargetRegisterClass* SrcClass = TLI.getRegClassFor(SrcVT);
723     TargetRegisterClass* DstClass = TLI.getRegClassFor(DstVT);
724     // Don't attempt a cross-class copy. It will likely fail.
725     if (SrcClass == DstClass) {
726       ResultReg = createResultReg(DstClass);
727       BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
728               ResultReg).addReg(Op0);
729     }
730   }
731
732   // If the reg-reg copy failed, select a BITCAST opcode.
733   if (!ResultReg)
734     ResultReg = FastEmit_r(SrcVT.getSimpleVT(), DstVT.getSimpleVT(),
735                            ISD::BITCAST, Op0, Op0IsKill);
736
737   if (!ResultReg)
738     return false;
739
740   UpdateValueMap(I, ResultReg);
741   return true;
742 }
743
744 bool
745 FastISel::SelectInstruction(const Instruction *I) {
746   // Just before the terminator instruction, insert instructions to
747   // feed PHI nodes in successor blocks.
748   if (isa<TerminatorInst>(I))
749     if (!HandlePHINodesInSuccessorBlocks(I->getParent()))
750       return false;
751
752   DL = I->getDebugLoc();
753
754   // First, try doing target-independent selection.
755   if (SelectOperator(I, I->getOpcode())) {
756     DL = DebugLoc();
757     return true;
758   }
759
760   // Next, try calling the target to attempt to handle the instruction.
761   if (TargetSelectInstruction(I)) {
762     DL = DebugLoc();
763     return true;
764   }
765
766   DL = DebugLoc();
767   return false;
768 }
769
770 /// FastEmitBranch - Emit an unconditional branch to the given block,
771 /// unless it is the immediate (fall-through) successor, and update
772 /// the CFG.
773 void
774 FastISel::FastEmitBranch(MachineBasicBlock *MSucc, DebugLoc DL) {
775   if (FuncInfo.MBB->isLayoutSuccessor(MSucc)) {
776     // The unconditional fall-through case, which needs no instructions.
777   } else {
778     // The unconditional branch case.
779     TII.InsertBranch(*FuncInfo.MBB, MSucc, NULL,
780                      SmallVector<MachineOperand, 0>(), DL);
781   }
782   FuncInfo.MBB->addSuccessor(MSucc);
783 }
784
785 /// SelectFNeg - Emit an FNeg operation.
786 ///
787 bool
788 FastISel::SelectFNeg(const User *I) {
789   unsigned OpReg = getRegForValue(BinaryOperator::getFNegArgument(I));
790   if (OpReg == 0) return false;
791
792   bool OpRegIsKill = hasTrivialKill(I);
793
794   // If the target has ISD::FNEG, use it.
795   EVT VT = TLI.getValueType(I->getType());
796   unsigned ResultReg = FastEmit_r(VT.getSimpleVT(), VT.getSimpleVT(),
797                                   ISD::FNEG, OpReg, OpRegIsKill);
798   if (ResultReg != 0) {
799     UpdateValueMap(I, ResultReg);
800     return true;
801   }
802
803   // Bitcast the value to integer, twiddle the sign bit with xor,
804   // and then bitcast it back to floating-point.
805   if (VT.getSizeInBits() > 64) return false;
806   EVT IntVT = EVT::getIntegerVT(I->getContext(), VT.getSizeInBits());
807   if (!TLI.isTypeLegal(IntVT))
808     return false;
809
810   unsigned IntReg = FastEmit_r(VT.getSimpleVT(), IntVT.getSimpleVT(),
811                                ISD::BITCAST, OpReg, OpRegIsKill);
812   if (IntReg == 0)
813     return false;
814
815   unsigned IntResultReg = FastEmit_ri_(IntVT.getSimpleVT(), ISD::XOR,
816                                        IntReg, /*Kill=*/true,
817                                        UINT64_C(1) << (VT.getSizeInBits()-1),
818                                        IntVT.getSimpleVT());
819   if (IntResultReg == 0)
820     return false;
821
822   ResultReg = FastEmit_r(IntVT.getSimpleVT(), VT.getSimpleVT(),
823                          ISD::BITCAST, IntResultReg, /*Kill=*/true);
824   if (ResultReg == 0)
825     return false;
826
827   UpdateValueMap(I, ResultReg);
828   return true;
829 }
830
831 bool
832 FastISel::SelectOperator(const User *I, unsigned Opcode) {
833   switch (Opcode) {
834   case Instruction::Add:
835     return SelectBinaryOp(I, ISD::ADD);
836   case Instruction::FAdd:
837     return SelectBinaryOp(I, ISD::FADD);
838   case Instruction::Sub:
839     return SelectBinaryOp(I, ISD::SUB);
840   case Instruction::FSub:
841     // FNeg is currently represented in LLVM IR as a special case of FSub.
842     if (BinaryOperator::isFNeg(I))
843       return SelectFNeg(I);
844     return SelectBinaryOp(I, ISD::FSUB);
845   case Instruction::Mul:
846     return SelectBinaryOp(I, ISD::MUL);
847   case Instruction::FMul:
848     return SelectBinaryOp(I, ISD::FMUL);
849   case Instruction::SDiv:
850     return SelectBinaryOp(I, ISD::SDIV);
851   case Instruction::UDiv:
852     return SelectBinaryOp(I, ISD::UDIV);
853   case Instruction::FDiv:
854     return SelectBinaryOp(I, ISD::FDIV);
855   case Instruction::SRem:
856     return SelectBinaryOp(I, ISD::SREM);
857   case Instruction::URem:
858     return SelectBinaryOp(I, ISD::UREM);
859   case Instruction::FRem:
860     return SelectBinaryOp(I, ISD::FREM);
861   case Instruction::Shl:
862     return SelectBinaryOp(I, ISD::SHL);
863   case Instruction::LShr:
864     return SelectBinaryOp(I, ISD::SRL);
865   case Instruction::AShr:
866     return SelectBinaryOp(I, ISD::SRA);
867   case Instruction::And:
868     return SelectBinaryOp(I, ISD::AND);
869   case Instruction::Or:
870     return SelectBinaryOp(I, ISD::OR);
871   case Instruction::Xor:
872     return SelectBinaryOp(I, ISD::XOR);
873
874   case Instruction::GetElementPtr:
875     return SelectGetElementPtr(I);
876
877   case Instruction::Br: {
878     const BranchInst *BI = cast<BranchInst>(I);
879
880     if (BI->isUnconditional()) {
881       const BasicBlock *LLVMSucc = BI->getSuccessor(0);
882       MachineBasicBlock *MSucc = FuncInfo.MBBMap[LLVMSucc];
883       FastEmitBranch(MSucc, BI->getDebugLoc());
884       return true;
885     }
886
887     // Conditional branches are not handed yet.
888     // Halt "fast" selection and bail.
889     return false;
890   }
891
892   case Instruction::Unreachable:
893     // Nothing to emit.
894     return true;
895
896   case Instruction::Alloca:
897     // FunctionLowering has the static-sized case covered.
898     if (FuncInfo.StaticAllocaMap.count(cast<AllocaInst>(I)))
899       return true;
900
901     // Dynamic-sized alloca is not handled yet.
902     return false;
903
904   case Instruction::Call:
905     return SelectCall(I);
906
907   case Instruction::BitCast:
908     return SelectBitCast(I);
909
910   case Instruction::FPToSI:
911     return SelectCast(I, ISD::FP_TO_SINT);
912   case Instruction::ZExt:
913     return SelectCast(I, ISD::ZERO_EXTEND);
914   case Instruction::SExt:
915     return SelectCast(I, ISD::SIGN_EXTEND);
916   case Instruction::Trunc:
917     return SelectCast(I, ISD::TRUNCATE);
918   case Instruction::SIToFP:
919     return SelectCast(I, ISD::SINT_TO_FP);
920
921   case Instruction::IntToPtr: // Deliberate fall-through.
922   case Instruction::PtrToInt: {
923     EVT SrcVT = TLI.getValueType(I->getOperand(0)->getType());
924     EVT DstVT = TLI.getValueType(I->getType());
925     if (DstVT.bitsGT(SrcVT))
926       return SelectCast(I, ISD::ZERO_EXTEND);
927     if (DstVT.bitsLT(SrcVT))
928       return SelectCast(I, ISD::TRUNCATE);
929     unsigned Reg = getRegForValue(I->getOperand(0));
930     if (Reg == 0) return false;
931     UpdateValueMap(I, Reg);
932     return true;
933   }
934
935   case Instruction::PHI:
936     llvm_unreachable("FastISel shouldn't visit PHI nodes!");
937
938   default:
939     // Unhandled instruction. Halt "fast" selection and bail.
940     return false;
941   }
942 }
943
944 FastISel::FastISel(FunctionLoweringInfo &funcInfo)
945   : FuncInfo(funcInfo),
946     MRI(FuncInfo.MF->getRegInfo()),
947     MFI(*FuncInfo.MF->getFrameInfo()),
948     MCP(*FuncInfo.MF->getConstantPool()),
949     TM(FuncInfo.MF->getTarget()),
950     TD(*TM.getTargetData()),
951     TII(*TM.getInstrInfo()),
952     TLI(*TM.getTargetLowering()),
953     TRI(*TM.getRegisterInfo()) {
954 }
955
956 FastISel::~FastISel() {}
957
958 unsigned FastISel::FastEmit_(MVT, MVT,
959                              unsigned) {
960   return 0;
961 }
962
963 unsigned FastISel::FastEmit_r(MVT, MVT,
964                               unsigned,
965                               unsigned /*Op0*/, bool /*Op0IsKill*/) {
966   return 0;
967 }
968
969 unsigned FastISel::FastEmit_rr(MVT, MVT,
970                                unsigned,
971                                unsigned /*Op0*/, bool /*Op0IsKill*/,
972                                unsigned /*Op1*/, bool /*Op1IsKill*/) {
973   return 0;
974 }
975
976 unsigned FastISel::FastEmit_i(MVT, MVT, unsigned, uint64_t /*Imm*/) {
977   return 0;
978 }
979
980 unsigned FastISel::FastEmit_f(MVT, MVT,
981                               unsigned, const ConstantFP * /*FPImm*/) {
982   return 0;
983 }
984
985 unsigned FastISel::FastEmit_ri(MVT, MVT,
986                                unsigned,
987                                unsigned /*Op0*/, bool /*Op0IsKill*/,
988                                uint64_t /*Imm*/) {
989   return 0;
990 }
991
992 unsigned FastISel::FastEmit_rf(MVT, MVT,
993                                unsigned,
994                                unsigned /*Op0*/, bool /*Op0IsKill*/,
995                                const ConstantFP * /*FPImm*/) {
996   return 0;
997 }
998
999 unsigned FastISel::FastEmit_rri(MVT, MVT,
1000                                 unsigned,
1001                                 unsigned /*Op0*/, bool /*Op0IsKill*/,
1002                                 unsigned /*Op1*/, bool /*Op1IsKill*/,
1003                                 uint64_t /*Imm*/) {
1004   return 0;
1005 }
1006
1007 /// FastEmit_ri_ - This method is a wrapper of FastEmit_ri. It first tries
1008 /// to emit an instruction with an immediate operand using FastEmit_ri.
1009 /// If that fails, it materializes the immediate into a register and try
1010 /// FastEmit_rr instead.
1011 unsigned FastISel::FastEmit_ri_(MVT VT, unsigned Opcode,
1012                                 unsigned Op0, bool Op0IsKill,
1013                                 uint64_t Imm, MVT ImmType) {
1014   // If this is a multiply by a power of two, emit this as a shift left.
1015   if (Opcode == ISD::MUL && isPowerOf2_64(Imm)) {
1016     Opcode = ISD::SHL;
1017     Imm = Log2_64(Imm);
1018   } else if (Opcode == ISD::UDIV && isPowerOf2_64(Imm)) {
1019     // div x, 8 -> srl x, 3
1020     Opcode = ISD::SRL;
1021     Imm = Log2_64(Imm);
1022   }
1023
1024   // Horrible hack (to be removed), check to make sure shift amounts are
1025   // in-range.
1026   if ((Opcode == ISD::SHL || Opcode == ISD::SRA || Opcode == ISD::SRL) &&
1027       Imm >= VT.getSizeInBits())
1028     return 0;
1029
1030   // First check if immediate type is legal. If not, we can't use the ri form.
1031   unsigned ResultReg = FastEmit_ri(VT, VT, Opcode, Op0, Op0IsKill, Imm);
1032   if (ResultReg != 0)
1033     return ResultReg;
1034   unsigned MaterialReg = FastEmit_i(ImmType, ImmType, ISD::Constant, Imm);
1035   if (MaterialReg == 0) {
1036     // This is a bit ugly/slow, but failing here means falling out of
1037     // fast-isel, which would be very slow.
1038     const IntegerType *ITy = IntegerType::get(FuncInfo.Fn->getContext(),
1039                                               VT.getSizeInBits());
1040     MaterialReg = getRegForValue(ConstantInt::get(ITy, Imm));
1041   }
1042   return FastEmit_rr(VT, VT, Opcode,
1043                      Op0, Op0IsKill,
1044                      MaterialReg, /*Kill=*/true);
1045 }
1046
1047 unsigned FastISel::createResultReg(const TargetRegisterClass* RC) {
1048   return MRI.createVirtualRegister(RC);
1049 }
1050
1051 unsigned FastISel::FastEmitInst_(unsigned MachineInstOpcode,
1052                                  const TargetRegisterClass* RC) {
1053   unsigned ResultReg = createResultReg(RC);
1054   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1055
1056   BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg);
1057   return ResultReg;
1058 }
1059
1060 unsigned FastISel::FastEmitInst_r(unsigned MachineInstOpcode,
1061                                   const TargetRegisterClass *RC,
1062                                   unsigned Op0, bool Op0IsKill) {
1063   unsigned ResultReg = createResultReg(RC);
1064   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1065
1066   if (II.getNumDefs() >= 1)
1067     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg)
1068       .addReg(Op0, Op0IsKill * RegState::Kill);
1069   else {
1070     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
1071       .addReg(Op0, Op0IsKill * RegState::Kill);
1072     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1073             ResultReg).addReg(II.ImplicitDefs[0]);
1074   }
1075
1076   return ResultReg;
1077 }
1078
1079 unsigned FastISel::FastEmitInst_rr(unsigned MachineInstOpcode,
1080                                    const TargetRegisterClass *RC,
1081                                    unsigned Op0, bool Op0IsKill,
1082                                    unsigned Op1, bool Op1IsKill) {
1083   unsigned ResultReg = createResultReg(RC);
1084   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1085
1086   if (II.getNumDefs() >= 1)
1087     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg)
1088       .addReg(Op0, Op0IsKill * RegState::Kill)
1089       .addReg(Op1, Op1IsKill * RegState::Kill);
1090   else {
1091     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
1092       .addReg(Op0, Op0IsKill * RegState::Kill)
1093       .addReg(Op1, Op1IsKill * RegState::Kill);
1094     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1095             ResultReg).addReg(II.ImplicitDefs[0]);
1096   }
1097   return ResultReg;
1098 }
1099
1100 unsigned FastISel::FastEmitInst_ri(unsigned MachineInstOpcode,
1101                                    const TargetRegisterClass *RC,
1102                                    unsigned Op0, bool Op0IsKill,
1103                                    uint64_t Imm) {
1104   unsigned ResultReg = createResultReg(RC);
1105   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1106
1107   if (II.getNumDefs() >= 1)
1108     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg)
1109       .addReg(Op0, Op0IsKill * RegState::Kill)
1110       .addImm(Imm);
1111   else {
1112     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
1113       .addReg(Op0, Op0IsKill * RegState::Kill)
1114       .addImm(Imm);
1115     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1116             ResultReg).addReg(II.ImplicitDefs[0]);
1117   }
1118   return ResultReg;
1119 }
1120
1121 unsigned FastISel::FastEmitInst_rii(unsigned MachineInstOpcode,
1122                                    const TargetRegisterClass *RC,
1123                                    unsigned Op0, bool Op0IsKill,
1124                                    uint64_t Imm1, uint64_t Imm2) {
1125   unsigned ResultReg = createResultReg(RC);
1126   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1127
1128   if (II.getNumDefs() >= 1)
1129     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg)
1130       .addReg(Op0, Op0IsKill * RegState::Kill)
1131       .addImm(Imm1)
1132       .addImm(Imm2);
1133   else {
1134     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
1135       .addReg(Op0, Op0IsKill * RegState::Kill)
1136       .addImm(Imm1)
1137       .addImm(Imm2);
1138     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1139             ResultReg).addReg(II.ImplicitDefs[0]);
1140   }
1141   return ResultReg;
1142 }
1143
1144 unsigned FastISel::FastEmitInst_rf(unsigned MachineInstOpcode,
1145                                    const TargetRegisterClass *RC,
1146                                    unsigned Op0, bool Op0IsKill,
1147                                    const ConstantFP *FPImm) {
1148   unsigned ResultReg = createResultReg(RC);
1149   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1150
1151   if (II.getNumDefs() >= 1)
1152     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg)
1153       .addReg(Op0, Op0IsKill * RegState::Kill)
1154       .addFPImm(FPImm);
1155   else {
1156     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
1157       .addReg(Op0, Op0IsKill * RegState::Kill)
1158       .addFPImm(FPImm);
1159     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1160             ResultReg).addReg(II.ImplicitDefs[0]);
1161   }
1162   return ResultReg;
1163 }
1164
1165 unsigned FastISel::FastEmitInst_rri(unsigned MachineInstOpcode,
1166                                     const TargetRegisterClass *RC,
1167                                     unsigned Op0, bool Op0IsKill,
1168                                     unsigned Op1, bool Op1IsKill,
1169                                     uint64_t Imm) {
1170   unsigned ResultReg = createResultReg(RC);
1171   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1172
1173   if (II.getNumDefs() >= 1)
1174     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg)
1175       .addReg(Op0, Op0IsKill * RegState::Kill)
1176       .addReg(Op1, Op1IsKill * RegState::Kill)
1177       .addImm(Imm);
1178   else {
1179     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II)
1180       .addReg(Op0, Op0IsKill * RegState::Kill)
1181       .addReg(Op1, Op1IsKill * RegState::Kill)
1182       .addImm(Imm);
1183     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1184             ResultReg).addReg(II.ImplicitDefs[0]);
1185   }
1186   return ResultReg;
1187 }
1188
1189 unsigned FastISel::FastEmitInst_i(unsigned MachineInstOpcode,
1190                                   const TargetRegisterClass *RC,
1191                                   uint64_t Imm) {
1192   unsigned ResultReg = createResultReg(RC);
1193   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1194
1195   if (II.getNumDefs() >= 1)
1196     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg).addImm(Imm);
1197   else {
1198     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II).addImm(Imm);
1199     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1200             ResultReg).addReg(II.ImplicitDefs[0]);
1201   }
1202   return ResultReg;
1203 }
1204
1205 unsigned FastISel::FastEmitInst_ii(unsigned MachineInstOpcode,
1206                                   const TargetRegisterClass *RC,
1207                                   uint64_t Imm1, uint64_t Imm2) {
1208   unsigned ResultReg = createResultReg(RC);
1209   const TargetInstrDesc &II = TII.get(MachineInstOpcode);
1210
1211   if (II.getNumDefs() >= 1)
1212     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II, ResultReg)
1213       .addImm(Imm1).addImm(Imm2);
1214   else {
1215     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, II).addImm(Imm1).addImm(Imm2);
1216     BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DL, TII.get(TargetOpcode::COPY),
1217             ResultReg).addReg(II.ImplicitDefs[0]);
1218   }
1219   return ResultReg;
1220 }
1221
1222 unsigned FastISel::FastEmitInst_extractsubreg(MVT RetVT,
1223                                               unsigned Op0, bool Op0IsKill,
1224                                               uint32_t Idx) {
1225   unsigned ResultReg = createResultReg(TLI.getRegClassFor(RetVT));
1226   assert(TargetRegisterInfo::isVirtualRegister(Op0) &&
1227          "Cannot yet extract from physregs");
1228   BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt,
1229           DL, TII.get(TargetOpcode::COPY), ResultReg)
1230     .addReg(Op0, getKillRegState(Op0IsKill), Idx);
1231   return ResultReg;
1232 }
1233
1234 /// FastEmitZExtFromI1 - Emit MachineInstrs to compute the value of Op
1235 /// with all but the least significant bit set to zero.
1236 unsigned FastISel::FastEmitZExtFromI1(MVT VT, unsigned Op0, bool Op0IsKill) {
1237   return FastEmit_ri(VT, VT, ISD::AND, Op0, Op0IsKill, 1);
1238 }
1239
1240 /// HandlePHINodesInSuccessorBlocks - Handle PHI nodes in successor blocks.
1241 /// Emit code to ensure constants are copied into registers when needed.
1242 /// Remember the virtual registers that need to be added to the Machine PHI
1243 /// nodes as input.  We cannot just directly add them, because expansion
1244 /// might result in multiple MBB's for one BB.  As such, the start of the
1245 /// BB might correspond to a different MBB than the end.
1246 bool FastISel::HandlePHINodesInSuccessorBlocks(const BasicBlock *LLVMBB) {
1247   const TerminatorInst *TI = LLVMBB->getTerminator();
1248
1249   SmallPtrSet<MachineBasicBlock *, 4> SuccsHandled;
1250   unsigned OrigNumPHINodesToUpdate = FuncInfo.PHINodesToUpdate.size();
1251
1252   // Check successor nodes' PHI nodes that expect a constant to be available
1253   // from this block.
1254   for (unsigned succ = 0, e = TI->getNumSuccessors(); succ != e; ++succ) {
1255     const BasicBlock *SuccBB = TI->getSuccessor(succ);
1256     if (!isa<PHINode>(SuccBB->begin())) continue;
1257     MachineBasicBlock *SuccMBB = FuncInfo.MBBMap[SuccBB];
1258
1259     // If this terminator has multiple identical successors (common for
1260     // switches), only handle each succ once.
1261     if (!SuccsHandled.insert(SuccMBB)) continue;
1262
1263     MachineBasicBlock::iterator MBBI = SuccMBB->begin();
1264
1265     // At this point we know that there is a 1-1 correspondence between LLVM PHI
1266     // nodes and Machine PHI nodes, but the incoming operands have not been
1267     // emitted yet.
1268     for (BasicBlock::const_iterator I = SuccBB->begin();
1269          const PHINode *PN = dyn_cast<PHINode>(I); ++I) {
1270
1271       // Ignore dead phi's.
1272       if (PN->use_empty()) continue;
1273
1274       // Only handle legal types. Two interesting things to note here. First,
1275       // by bailing out early, we may leave behind some dead instructions,
1276       // since SelectionDAG's HandlePHINodesInSuccessorBlocks will insert its
1277       // own moves. Second, this check is necessary because FastISel doesn't
1278       // use CreateRegs to create registers, so it always creates
1279       // exactly one register for each non-void instruction.
1280       EVT VT = TLI.getValueType(PN->getType(), /*AllowUnknown=*/true);
1281       if (VT == MVT::Other || !TLI.isTypeLegal(VT)) {
1282         // Promote MVT::i1.
1283         if (VT == MVT::i1)
1284           VT = TLI.getTypeToTransformTo(LLVMBB->getContext(), VT);
1285         else {
1286           FuncInfo.PHINodesToUpdate.resize(OrigNumPHINodesToUpdate);
1287           return false;
1288         }
1289       }
1290
1291       const Value *PHIOp = PN->getIncomingValueForBlock(LLVMBB);
1292
1293       // Set the DebugLoc for the copy. Prefer the location of the operand
1294       // if there is one; use the location of the PHI otherwise.
1295       DL = PN->getDebugLoc();
1296       if (const Instruction *Inst = dyn_cast<Instruction>(PHIOp))
1297         DL = Inst->getDebugLoc();
1298
1299       unsigned Reg = getRegForValue(PHIOp);
1300       if (Reg == 0) {
1301         FuncInfo.PHINodesToUpdate.resize(OrigNumPHINodesToUpdate);
1302         return false;
1303       }
1304       FuncInfo.PHINodesToUpdate.push_back(std::make_pair(MBBI++, Reg));
1305       DL = DebugLoc();
1306     }
1307   }
1308
1309   return true;
1310 }