Update comment for getRegForInlineAsmConstraint for Mips.
[oota-llvm.git] / lib / Target / Mips / MipsISelLowering.cpp
1 //===-- MipsISelLowering.cpp - Mips DAG Lowering Implementation -----------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file defines the interfaces that Mips uses to lower LLVM code into a
11 // selection DAG.
12 //
13 //===----------------------------------------------------------------------===//
14
15 #define DEBUG_TYPE "mips-lower"
16 #include "MipsISelLowering.h"
17 #include "MipsMachineFunction.h"
18 #include "MipsTargetMachine.h"
19 #include "MipsTargetObjectFile.h"
20 #include "MipsSubtarget.h"
21 #include "llvm/DerivedTypes.h"
22 #include "llvm/Function.h"
23 #include "llvm/GlobalVariable.h"
24 #include "llvm/Intrinsics.h"
25 #include "llvm/CallingConv.h"
26 #include "llvm/CodeGen/CallingConvLower.h"
27 #include "llvm/CodeGen/MachineFrameInfo.h"
28 #include "llvm/CodeGen/MachineFunction.h"
29 #include "llvm/CodeGen/MachineInstrBuilder.h"
30 #include "llvm/CodeGen/MachineRegisterInfo.h"
31 #include "llvm/CodeGen/SelectionDAGISel.h"
32 #include "llvm/CodeGen/ValueTypes.h"
33 #include "llvm/Support/Debug.h"
34 #include "llvm/Support/ErrorHandling.h"
35 using namespace llvm;
36
37 const char *MipsTargetLowering::getTargetNodeName(unsigned Opcode) const {
38   switch (Opcode) {
39   case MipsISD::JmpLink:           return "MipsISD::JmpLink";
40   case MipsISD::Hi:                return "MipsISD::Hi";
41   case MipsISD::Lo:                return "MipsISD::Lo";
42   case MipsISD::GPRel:             return "MipsISD::GPRel";
43   case MipsISD::TlsGd:             return "MipsISD::TlsGd";
44   case MipsISD::TprelHi:           return "MipsISD::TprelHi";
45   case MipsISD::TprelLo:           return "MipsISD::TprelLo";
46   case MipsISD::ThreadPointer:     return "MipsISD::ThreadPointer";
47   case MipsISD::Ret:               return "MipsISD::Ret";
48   case MipsISD::FPBrcond:          return "MipsISD::FPBrcond";
49   case MipsISD::FPCmp:             return "MipsISD::FPCmp";
50   case MipsISD::CMovFP_T:          return "MipsISD::CMovFP_T";
51   case MipsISD::CMovFP_F:          return "MipsISD::CMovFP_F";
52   case MipsISD::FPRound:           return "MipsISD::FPRound";
53   case MipsISD::MAdd:              return "MipsISD::MAdd";
54   case MipsISD::MAddu:             return "MipsISD::MAddu";
55   case MipsISD::MSub:              return "MipsISD::MSub";
56   case MipsISD::MSubu:             return "MipsISD::MSubu";
57   case MipsISD::DivRem:            return "MipsISD::DivRem";
58   case MipsISD::DivRemU:           return "MipsISD::DivRemU";
59   case MipsISD::BuildPairF64:      return "MipsISD::BuildPairF64";
60   case MipsISD::ExtractElementF64: return "MipsISD::ExtractElementF64";
61   case MipsISD::WrapperPIC:        return "MipsISD::WrapperPIC";
62   case MipsISD::DynAlloc:          return "MipsISD::DynAlloc";
63   default:                         return NULL;
64   }
65 }
66
67 MipsTargetLowering::
68 MipsTargetLowering(MipsTargetMachine &TM)
69   : TargetLowering(TM, new MipsTargetObjectFile()) {
70   Subtarget = &TM.getSubtarget<MipsSubtarget>();
71
72   // Mips does not have i1 type, so use i32 for
73   // setcc operations results (slt, sgt, ...).
74   setBooleanContents(ZeroOrOneBooleanContent);
75
76   // Set up the register classes
77   addRegisterClass(MVT::i32, Mips::CPURegsRegisterClass);
78   addRegisterClass(MVT::f32, Mips::FGR32RegisterClass);
79
80   // When dealing with single precision only, use libcalls
81   if (!Subtarget->isSingleFloat())
82     if (!Subtarget->isFP64bit())
83       addRegisterClass(MVT::f64, Mips::AFGR64RegisterClass);
84
85   // Load extented operations for i1 types must be promoted
86   setLoadExtAction(ISD::EXTLOAD,  MVT::i1,  Promote);
87   setLoadExtAction(ISD::ZEXTLOAD, MVT::i1,  Promote);
88   setLoadExtAction(ISD::SEXTLOAD, MVT::i1,  Promote);
89
90   // MIPS doesn't have extending float->double load/store
91   setLoadExtAction(ISD::EXTLOAD, MVT::f32, Expand);
92   setTruncStoreAction(MVT::f64, MVT::f32, Expand);
93
94   // Used by legalize types to correctly generate the setcc result.
95   // Without this, every float setcc comes with a AND/OR with the result,
96   // we don't want this, since the fpcmp result goes to a flag register,
97   // which is used implicitly by brcond and select operations.
98   AddPromotedToType(ISD::SETCC, MVT::i1, MVT::i32);
99
100   // Mips Custom Operations
101   setOperationAction(ISD::GlobalAddress,      MVT::i32,   Custom);
102   setOperationAction(ISD::BlockAddress,       MVT::i32,   Custom);
103   setOperationAction(ISD::GlobalTLSAddress,   MVT::i32,   Custom);
104   setOperationAction(ISD::JumpTable,          MVT::i32,   Custom);
105   setOperationAction(ISD::ConstantPool,       MVT::i32,   Custom);
106   setOperationAction(ISD::SELECT,             MVT::f32,   Custom);
107   setOperationAction(ISD::SELECT,             MVT::f64,   Custom);
108   setOperationAction(ISD::SELECT,             MVT::i32,   Custom);
109   setOperationAction(ISD::BRCOND,             MVT::Other, Custom);
110   setOperationAction(ISD::DYNAMIC_STACKALLOC, MVT::i32,   Custom);
111   setOperationAction(ISD::VASTART,            MVT::Other, Custom);
112
113   setOperationAction(ISD::SDIV, MVT::i32, Expand);
114   setOperationAction(ISD::SREM, MVT::i32, Expand);
115   setOperationAction(ISD::UDIV, MVT::i32, Expand);
116   setOperationAction(ISD::UREM, MVT::i32, Expand);
117
118   // Operations not directly supported by Mips.
119   setOperationAction(ISD::BR_JT,             MVT::Other, Expand);
120   setOperationAction(ISD::BR_CC,             MVT::Other, Expand);
121   setOperationAction(ISD::SELECT_CC,         MVT::Other, Expand);
122   setOperationAction(ISD::UINT_TO_FP,        MVT::i32,   Expand);
123   setOperationAction(ISD::FP_TO_UINT,        MVT::i32,   Expand);
124   setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1,    Expand);
125   setOperationAction(ISD::CTPOP,             MVT::i32,   Expand);
126   setOperationAction(ISD::CTTZ,              MVT::i32,   Expand);
127   setOperationAction(ISD::ROTL,              MVT::i32,   Expand);
128
129   if (!Subtarget->isMips32r2())
130     setOperationAction(ISD::ROTR, MVT::i32,   Expand);
131
132   setOperationAction(ISD::SHL_PARTS,         MVT::i32,   Expand);
133   setOperationAction(ISD::SRA_PARTS,         MVT::i32,   Expand);
134   setOperationAction(ISD::SRL_PARTS,         MVT::i32,   Expand);
135   setOperationAction(ISD::FCOPYSIGN,         MVT::f32,   Custom);
136   setOperationAction(ISD::FCOPYSIGN,         MVT::f64,   Custom);
137   setOperationAction(ISD::FSIN,              MVT::f32,   Expand);
138   setOperationAction(ISD::FSIN,              MVT::f64,   Expand);
139   setOperationAction(ISD::FCOS,              MVT::f32,   Expand);
140   setOperationAction(ISD::FCOS,              MVT::f64,   Expand);
141   setOperationAction(ISD::FPOWI,             MVT::f32,   Expand);
142   setOperationAction(ISD::FPOW,              MVT::f32,   Expand);
143   setOperationAction(ISD::FPOW,              MVT::f64,   Expand);
144   setOperationAction(ISD::FLOG,              MVT::f32,   Expand);
145   setOperationAction(ISD::FLOG2,             MVT::f32,   Expand);
146   setOperationAction(ISD::FLOG10,            MVT::f32,   Expand);
147   setOperationAction(ISD::FEXP,              MVT::f32,   Expand);
148
149   setOperationAction(ISD::EXCEPTIONADDR,     MVT::i32, Expand);
150   setOperationAction(ISD::EHSELECTION,       MVT::i32, Expand);
151
152   setOperationAction(ISD::VAARG,             MVT::Other, Expand);
153   setOperationAction(ISD::VACOPY,            MVT::Other, Expand);
154   setOperationAction(ISD::VAEND,             MVT::Other, Expand);
155
156   // Use the default for now
157   setOperationAction(ISD::STACKSAVE,         MVT::Other, Expand);
158   setOperationAction(ISD::STACKRESTORE,      MVT::Other, Expand);
159   setOperationAction(ISD::MEMBARRIER,        MVT::Other, Expand);
160
161   if (Subtarget->isSingleFloat())
162     setOperationAction(ISD::SELECT_CC, MVT::f64, Expand);
163
164   if (!Subtarget->hasSEInReg()) {
165     setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i8,  Expand);
166     setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i16, Expand);
167   }
168
169   if (!Subtarget->hasBitCount())
170     setOperationAction(ISD::CTLZ, MVT::i32, Expand);
171
172   if (!Subtarget->hasSwap())
173     setOperationAction(ISD::BSWAP, MVT::i32, Expand);
174
175   setTargetDAGCombine(ISD::ADDE);
176   setTargetDAGCombine(ISD::SUBE);
177   setTargetDAGCombine(ISD::SDIVREM);
178   setTargetDAGCombine(ISD::UDIVREM);
179   setTargetDAGCombine(ISD::SETCC);
180
181   setMinFunctionAlignment(2);
182
183   setStackPointerRegisterToSaveRestore(Mips::SP);
184   computeRegisterProperties();
185
186   setExceptionPointerRegister(Mips::A0);
187   setExceptionSelectorRegister(Mips::A1);
188 }
189
190 MVT::SimpleValueType MipsTargetLowering::getSetCCResultType(EVT VT) const {
191   return MVT::i32;
192 }
193
194 // SelectMadd -
195 // Transforms a subgraph in CurDAG if the following pattern is found:
196 //  (addc multLo, Lo0), (adde multHi, Hi0),
197 // where,
198 //  multHi/Lo: product of multiplication
199 //  Lo0: initial value of Lo register
200 //  Hi0: initial value of Hi register
201 // Return true if pattern matching was successful.
202 static bool SelectMadd(SDNode* ADDENode, SelectionDAG* CurDAG) {
203   // ADDENode's second operand must be a flag output of an ADDC node in order
204   // for the matching to be successful.
205   SDNode* ADDCNode = ADDENode->getOperand(2).getNode();
206
207   if (ADDCNode->getOpcode() != ISD::ADDC)
208     return false;
209
210   SDValue MultHi = ADDENode->getOperand(0);
211   SDValue MultLo = ADDCNode->getOperand(0);
212   SDNode* MultNode = MultHi.getNode();
213   unsigned MultOpc = MultHi.getOpcode();
214
215   // MultHi and MultLo must be generated by the same node,
216   if (MultLo.getNode() != MultNode)
217     return false;
218
219   // and it must be a multiplication.
220   if (MultOpc != ISD::SMUL_LOHI && MultOpc != ISD::UMUL_LOHI)
221     return false;
222
223   // MultLo amd MultHi must be the first and second output of MultNode
224   // respectively.
225   if (MultHi.getResNo() != 1 || MultLo.getResNo() != 0)
226     return false;
227
228   // Transform this to a MADD only if ADDENode and ADDCNode are the only users
229   // of the values of MultNode, in which case MultNode will be removed in later
230   // phases.
231   // If there exist users other than ADDENode or ADDCNode, this function returns
232   // here, which will result in MultNode being mapped to a single MULT
233   // instruction node rather than a pair of MULT and MADD instructions being
234   // produced.
235   if (!MultHi.hasOneUse() || !MultLo.hasOneUse())
236     return false;
237
238   SDValue Chain = CurDAG->getEntryNode();
239   DebugLoc dl = ADDENode->getDebugLoc();
240
241   // create MipsMAdd(u) node
242   MultOpc = MultOpc == ISD::UMUL_LOHI ? MipsISD::MAddu : MipsISD::MAdd;
243
244   SDValue MAdd = CurDAG->getNode(MultOpc, dl,
245                                  MVT::Glue,
246                                  MultNode->getOperand(0),// Factor 0
247                                  MultNode->getOperand(1),// Factor 1
248                                  ADDCNode->getOperand(1),// Lo0
249                                  ADDENode->getOperand(1));// Hi0
250
251   // create CopyFromReg nodes
252   SDValue CopyFromLo = CurDAG->getCopyFromReg(Chain, dl, Mips::LO, MVT::i32,
253                                               MAdd);
254   SDValue CopyFromHi = CurDAG->getCopyFromReg(CopyFromLo.getValue(1), dl,
255                                               Mips::HI, MVT::i32,
256                                               CopyFromLo.getValue(2));
257
258   // replace uses of adde and addc here
259   if (!SDValue(ADDCNode, 0).use_empty())
260     CurDAG->ReplaceAllUsesOfValueWith(SDValue(ADDCNode, 0), CopyFromLo);
261
262   if (!SDValue(ADDENode, 0).use_empty())
263     CurDAG->ReplaceAllUsesOfValueWith(SDValue(ADDENode, 0), CopyFromHi);
264
265   return true;
266 }
267
268 // SelectMsub -
269 // Transforms a subgraph in CurDAG if the following pattern is found:
270 //  (addc Lo0, multLo), (sube Hi0, multHi),
271 // where,
272 //  multHi/Lo: product of multiplication
273 //  Lo0: initial value of Lo register
274 //  Hi0: initial value of Hi register
275 // Return true if pattern matching was successful.
276 static bool SelectMsub(SDNode* SUBENode, SelectionDAG* CurDAG) {
277   // SUBENode's second operand must be a flag output of an SUBC node in order
278   // for the matching to be successful.
279   SDNode* SUBCNode = SUBENode->getOperand(2).getNode();
280
281   if (SUBCNode->getOpcode() != ISD::SUBC)
282     return false;
283
284   SDValue MultHi = SUBENode->getOperand(1);
285   SDValue MultLo = SUBCNode->getOperand(1);
286   SDNode* MultNode = MultHi.getNode();
287   unsigned MultOpc = MultHi.getOpcode();
288
289   // MultHi and MultLo must be generated by the same node,
290   if (MultLo.getNode() != MultNode)
291     return false;
292
293   // and it must be a multiplication.
294   if (MultOpc != ISD::SMUL_LOHI && MultOpc != ISD::UMUL_LOHI)
295     return false;
296
297   // MultLo amd MultHi must be the first and second output of MultNode
298   // respectively.
299   if (MultHi.getResNo() != 1 || MultLo.getResNo() != 0)
300     return false;
301
302   // Transform this to a MSUB only if SUBENode and SUBCNode are the only users
303   // of the values of MultNode, in which case MultNode will be removed in later
304   // phases.
305   // If there exist users other than SUBENode or SUBCNode, this function returns
306   // here, which will result in MultNode being mapped to a single MULT
307   // instruction node rather than a pair of MULT and MSUB instructions being
308   // produced.
309   if (!MultHi.hasOneUse() || !MultLo.hasOneUse())
310     return false;
311
312   SDValue Chain = CurDAG->getEntryNode();
313   DebugLoc dl = SUBENode->getDebugLoc();
314
315   // create MipsSub(u) node
316   MultOpc = MultOpc == ISD::UMUL_LOHI ? MipsISD::MSubu : MipsISD::MSub;
317
318   SDValue MSub = CurDAG->getNode(MultOpc, dl,
319                                  MVT::Glue,
320                                  MultNode->getOperand(0),// Factor 0
321                                  MultNode->getOperand(1),// Factor 1
322                                  SUBCNode->getOperand(0),// Lo0
323                                  SUBENode->getOperand(0));// Hi0
324
325   // create CopyFromReg nodes
326   SDValue CopyFromLo = CurDAG->getCopyFromReg(Chain, dl, Mips::LO, MVT::i32,
327                                               MSub);
328   SDValue CopyFromHi = CurDAG->getCopyFromReg(CopyFromLo.getValue(1), dl,
329                                               Mips::HI, MVT::i32,
330                                               CopyFromLo.getValue(2));
331
332   // replace uses of sube and subc here
333   if (!SDValue(SUBCNode, 0).use_empty())
334     CurDAG->ReplaceAllUsesOfValueWith(SDValue(SUBCNode, 0), CopyFromLo);
335
336   if (!SDValue(SUBENode, 0).use_empty())
337     CurDAG->ReplaceAllUsesOfValueWith(SDValue(SUBENode, 0), CopyFromHi);
338
339   return true;
340 }
341
342 static SDValue PerformADDECombine(SDNode *N, SelectionDAG& DAG,
343                                   TargetLowering::DAGCombinerInfo &DCI,
344                                   const MipsSubtarget* Subtarget) {
345   if (DCI.isBeforeLegalize())
346     return SDValue();
347
348   if (Subtarget->isMips32() && SelectMadd(N, &DAG))
349     return SDValue(N, 0);
350
351   return SDValue();
352 }
353
354 static SDValue PerformSUBECombine(SDNode *N, SelectionDAG& DAG,
355                                   TargetLowering::DAGCombinerInfo &DCI,
356                                   const MipsSubtarget* Subtarget) {
357   if (DCI.isBeforeLegalize())
358     return SDValue();
359
360   if (Subtarget->isMips32() && SelectMsub(N, &DAG))
361     return SDValue(N, 0);
362
363   return SDValue();
364 }
365
366 static SDValue PerformDivRemCombine(SDNode *N, SelectionDAG& DAG,
367                                     TargetLowering::DAGCombinerInfo &DCI,
368                                     const MipsSubtarget* Subtarget) {
369   if (DCI.isBeforeLegalizeOps())
370     return SDValue();
371
372   unsigned opc = N->getOpcode() == ISD::SDIVREM ? MipsISD::DivRem :
373                                                   MipsISD::DivRemU;
374   DebugLoc dl = N->getDebugLoc();
375
376   SDValue DivRem = DAG.getNode(opc, dl, MVT::Glue,
377                                N->getOperand(0), N->getOperand(1));
378   SDValue InChain = DAG.getEntryNode();
379   SDValue InGlue = DivRem;
380
381   // insert MFLO
382   if (N->hasAnyUseOfValue(0)) {
383     SDValue CopyFromLo = DAG.getCopyFromReg(InChain, dl, Mips::LO, MVT::i32,
384                                             InGlue);
385     DAG.ReplaceAllUsesOfValueWith(SDValue(N, 0), CopyFromLo);
386     InChain = CopyFromLo.getValue(1);
387     InGlue = CopyFromLo.getValue(2);
388   }
389
390   // insert MFHI
391   if (N->hasAnyUseOfValue(1)) {
392     SDValue CopyFromHi = DAG.getCopyFromReg(InChain, dl,
393                                             Mips::HI, MVT::i32, InGlue);
394     DAG.ReplaceAllUsesOfValueWith(SDValue(N, 1), CopyFromHi);
395   }
396
397   return SDValue();
398 }
399
400 static Mips::CondCode FPCondCCodeToFCC(ISD::CondCode CC) {
401   switch (CC) {
402   default: llvm_unreachable("Unknown fp condition code!");
403   case ISD::SETEQ:
404   case ISD::SETOEQ: return Mips::FCOND_OEQ;
405   case ISD::SETUNE: return Mips::FCOND_UNE;
406   case ISD::SETLT:
407   case ISD::SETOLT: return Mips::FCOND_OLT;
408   case ISD::SETGT:
409   case ISD::SETOGT: return Mips::FCOND_OGT;
410   case ISD::SETLE:
411   case ISD::SETOLE: return Mips::FCOND_OLE;
412   case ISD::SETGE:
413   case ISD::SETOGE: return Mips::FCOND_OGE;
414   case ISD::SETULT: return Mips::FCOND_ULT;
415   case ISD::SETULE: return Mips::FCOND_ULE;
416   case ISD::SETUGT: return Mips::FCOND_UGT;
417   case ISD::SETUGE: return Mips::FCOND_UGE;
418   case ISD::SETUO:  return Mips::FCOND_UN;
419   case ISD::SETO:   return Mips::FCOND_OR;
420   case ISD::SETNE:
421   case ISD::SETONE: return Mips::FCOND_ONE;
422   case ISD::SETUEQ: return Mips::FCOND_UEQ;
423   }
424 }
425
426
427 // Returns true if condition code has to be inverted.
428 static bool InvertFPCondCode(Mips::CondCode CC) {
429   if (CC >= Mips::FCOND_F && CC <= Mips::FCOND_NGT)
430     return false;
431
432   if (CC >= Mips::FCOND_T && CC <= Mips::FCOND_GT)
433     return true;
434
435   assert(false && "Illegal Condition Code");
436   return false;
437 }
438
439 // Creates and returns an FPCmp node from a setcc node.
440 // Returns Op if setcc is not a floating point comparison.
441 static SDValue CreateFPCmp(SelectionDAG& DAG, const SDValue& Op) {
442   // must be a SETCC node
443   if (Op.getOpcode() != ISD::SETCC)
444     return Op;
445
446   SDValue LHS = Op.getOperand(0);
447
448   if (!LHS.getValueType().isFloatingPoint())
449     return Op;
450
451   SDValue RHS = Op.getOperand(1);
452   DebugLoc dl = Op.getDebugLoc();
453
454   // Assume the 3rd operand is a CondCodeSDNode. Add code to check the type of
455   // node if necessary.
456   ISD::CondCode CC = cast<CondCodeSDNode>(Op.getOperand(2))->get();
457
458   return DAG.getNode(MipsISD::FPCmp, dl, MVT::Glue, LHS, RHS,
459                      DAG.getConstant(FPCondCCodeToFCC(CC), MVT::i32));
460 }
461
462 // Creates and returns a CMovFPT/F node.
463 static SDValue CreateCMovFP(SelectionDAG& DAG, SDValue Cond, SDValue True,
464                             SDValue False, DebugLoc DL) {
465   bool invert = InvertFPCondCode((Mips::CondCode)
466                                  cast<ConstantSDNode>(Cond.getOperand(2))
467                                  ->getSExtValue());
468
469   return DAG.getNode((invert ? MipsISD::CMovFP_F : MipsISD::CMovFP_T), DL,
470                      True.getValueType(), True, False, Cond);
471 }
472
473 static SDValue PerformSETCCCombine(SDNode *N, SelectionDAG& DAG,
474                                    TargetLowering::DAGCombinerInfo &DCI,
475                                    const MipsSubtarget* Subtarget) {
476   if (DCI.isBeforeLegalizeOps())
477     return SDValue();
478
479   SDValue Cond = CreateFPCmp(DAG, SDValue(N, 0));
480
481   if (Cond.getOpcode() != MipsISD::FPCmp)
482     return SDValue();
483
484   SDValue True  = DAG.getConstant(1, MVT::i32);
485   SDValue False = DAG.getConstant(0, MVT::i32);
486
487   return CreateCMovFP(DAG, Cond, True, False, N->getDebugLoc());
488 }
489
490 SDValue  MipsTargetLowering::PerformDAGCombine(SDNode *N, DAGCombinerInfo &DCI)
491   const {
492   SelectionDAG &DAG = DCI.DAG;
493   unsigned opc = N->getOpcode();
494
495   switch (opc) {
496   default: break;
497   case ISD::ADDE:
498     return PerformADDECombine(N, DAG, DCI, Subtarget);
499   case ISD::SUBE:
500     return PerformSUBECombine(N, DAG, DCI, Subtarget);
501   case ISD::SDIVREM:
502   case ISD::UDIVREM:
503     return PerformDivRemCombine(N, DAG, DCI, Subtarget);
504   case ISD::SETCC:
505     return PerformSETCCCombine(N, DAG, DCI, Subtarget);
506   }
507
508   return SDValue();
509 }
510
511 SDValue MipsTargetLowering::
512 LowerOperation(SDValue Op, SelectionDAG &DAG) const
513 {
514   switch (Op.getOpcode())
515   {
516     case ISD::BRCOND:             return LowerBRCOND(Op, DAG);
517     case ISD::ConstantPool:       return LowerConstantPool(Op, DAG);
518     case ISD::DYNAMIC_STACKALLOC: return LowerDYNAMIC_STACKALLOC(Op, DAG);
519     case ISD::GlobalAddress:      return LowerGlobalAddress(Op, DAG);
520     case ISD::BlockAddress:       return LowerBlockAddress(Op, DAG);
521     case ISD::GlobalTLSAddress:   return LowerGlobalTLSAddress(Op, DAG);
522     case ISD::JumpTable:          return LowerJumpTable(Op, DAG);
523     case ISD::SELECT:             return LowerSELECT(Op, DAG);
524     case ISD::VASTART:            return LowerVASTART(Op, DAG);
525     case ISD::FCOPYSIGN:          return LowerFCOPYSIGN(Op, DAG);
526     case ISD::FRAMEADDR:          return LowerFRAMEADDR(Op, DAG);
527   }
528   return SDValue();
529 }
530
531 //===----------------------------------------------------------------------===//
532 //  Lower helper functions
533 //===----------------------------------------------------------------------===//
534
535 // AddLiveIn - This helper function adds the specified physical register to the
536 // MachineFunction as a live in value.  It also creates a corresponding
537 // virtual register for it.
538 static unsigned
539 AddLiveIn(MachineFunction &MF, unsigned PReg, TargetRegisterClass *RC)
540 {
541   assert(RC->contains(PReg) && "Not the correct regclass!");
542   unsigned VReg = MF.getRegInfo().createVirtualRegister(RC);
543   MF.getRegInfo().addLiveIn(PReg, VReg);
544   return VReg;
545 }
546
547 // Get fp branch code (not opcode) from condition code.
548 static Mips::FPBranchCode GetFPBranchCodeFromCond(Mips::CondCode CC) {
549   if (CC >= Mips::FCOND_F && CC <= Mips::FCOND_NGT)
550     return Mips::BRANCH_T;
551
552   if (CC >= Mips::FCOND_T && CC <= Mips::FCOND_GT)
553     return Mips::BRANCH_F;
554
555   return Mips::BRANCH_INVALID;
556 }
557
558 static MachineBasicBlock* ExpandCondMov(MachineInstr *MI, MachineBasicBlock *BB,
559                                         DebugLoc dl,
560                                         const MipsSubtarget* Subtarget,
561                                         const TargetInstrInfo *TII,
562                                         bool isFPCmp, unsigned Opc) {
563   // There is no need to expand CMov instructions if target has
564   // conditional moves.
565   if (Subtarget->hasCondMov())
566     return BB;
567
568   // To "insert" a SELECT_CC instruction, we actually have to insert the
569   // diamond control-flow pattern.  The incoming instruction knows the
570   // destination vreg to set, the condition code register to branch on, the
571   // true/false values to select between, and a branch opcode to use.
572   const BasicBlock *LLVM_BB = BB->getBasicBlock();
573   MachineFunction::iterator It = BB;
574   ++It;
575
576   //  thisMBB:
577   //  ...
578   //   TrueVal = ...
579   //   setcc r1, r2, r3
580   //   bNE   r1, r0, copy1MBB
581   //   fallthrough --> copy0MBB
582   MachineBasicBlock *thisMBB  = BB;
583   MachineFunction *F = BB->getParent();
584   MachineBasicBlock *copy0MBB = F->CreateMachineBasicBlock(LLVM_BB);
585   MachineBasicBlock *sinkMBB  = F->CreateMachineBasicBlock(LLVM_BB);
586   F->insert(It, copy0MBB);
587   F->insert(It, sinkMBB);
588
589   // Transfer the remainder of BB and its successor edges to sinkMBB.
590   sinkMBB->splice(sinkMBB->begin(), BB,
591                   llvm::next(MachineBasicBlock::iterator(MI)),
592                   BB->end());
593   sinkMBB->transferSuccessorsAndUpdatePHIs(BB);
594
595   // Next, add the true and fallthrough blocks as its successors.
596   BB->addSuccessor(copy0MBB);
597   BB->addSuccessor(sinkMBB);
598
599   // Emit the right instruction according to the type of the operands compared
600   if (isFPCmp)
601     BuildMI(BB, dl, TII->get(Opc)).addMBB(sinkMBB);
602   else
603     BuildMI(BB, dl, TII->get(Opc)).addReg(MI->getOperand(2).getReg())
604       .addReg(Mips::ZERO).addMBB(sinkMBB);
605
606   //  copy0MBB:
607   //   %FalseValue = ...
608   //   # fallthrough to sinkMBB
609   BB = copy0MBB;
610
611   // Update machine-CFG edges
612   BB->addSuccessor(sinkMBB);
613
614   //  sinkMBB:
615   //   %Result = phi [ %TrueValue, thisMBB ], [ %FalseValue, copy0MBB ]
616   //  ...
617   BB = sinkMBB;
618
619   if (isFPCmp)
620     BuildMI(*BB, BB->begin(), dl,
621             TII->get(Mips::PHI), MI->getOperand(0).getReg())
622       .addReg(MI->getOperand(2).getReg()).addMBB(thisMBB)
623       .addReg(MI->getOperand(1).getReg()).addMBB(copy0MBB);
624   else
625     BuildMI(*BB, BB->begin(), dl,
626             TII->get(Mips::PHI), MI->getOperand(0).getReg())
627       .addReg(MI->getOperand(3).getReg()).addMBB(thisMBB)
628       .addReg(MI->getOperand(1).getReg()).addMBB(copy0MBB);
629
630   MI->eraseFromParent();   // The pseudo instruction is gone now.
631   return BB;
632 }
633
634 MachineBasicBlock *
635 MipsTargetLowering::EmitInstrWithCustomInserter(MachineInstr *MI,
636                                                 MachineBasicBlock *BB) const {
637   const TargetInstrInfo *TII = getTargetMachine().getInstrInfo();
638   DebugLoc dl = MI->getDebugLoc();
639
640   switch (MI->getOpcode()) {
641   default:
642     assert(false && "Unexpected instr type to insert");
643     return NULL;
644   case Mips::MOVT:
645   case Mips::MOVT_S:
646   case Mips::MOVT_D:
647     return ExpandCondMov(MI, BB, dl, Subtarget, TII, true, Mips::BC1F);
648   case Mips::MOVF:
649   case Mips::MOVF_S:
650   case Mips::MOVF_D:
651     return ExpandCondMov(MI, BB, dl, Subtarget, TII, true, Mips::BC1T);
652   case Mips::MOVZ_I:
653   case Mips::MOVZ_S:
654   case Mips::MOVZ_D:
655     return ExpandCondMov(MI, BB, dl, Subtarget, TII, false, Mips::BNE);
656   case Mips::MOVN_I:
657   case Mips::MOVN_S:
658   case Mips::MOVN_D:
659     return ExpandCondMov(MI, BB, dl, Subtarget, TII, false, Mips::BEQ);
660
661   case Mips::ATOMIC_LOAD_ADD_I8:
662     return EmitAtomicBinaryPartword(MI, BB, 1, Mips::ADDu);
663   case Mips::ATOMIC_LOAD_ADD_I16:
664     return EmitAtomicBinaryPartword(MI, BB, 2, Mips::ADDu);
665   case Mips::ATOMIC_LOAD_ADD_I32:
666     return EmitAtomicBinary(MI, BB, 4, Mips::ADDu);
667
668   case Mips::ATOMIC_LOAD_AND_I8:
669     return EmitAtomicBinaryPartword(MI, BB, 1, Mips::AND);
670   case Mips::ATOMIC_LOAD_AND_I16:
671     return EmitAtomicBinaryPartword(MI, BB, 2, Mips::AND);
672   case Mips::ATOMIC_LOAD_AND_I32:
673     return EmitAtomicBinary(MI, BB, 4, Mips::AND);
674
675   case Mips::ATOMIC_LOAD_OR_I8:
676     return EmitAtomicBinaryPartword(MI, BB, 1, Mips::OR);
677   case Mips::ATOMIC_LOAD_OR_I16:
678     return EmitAtomicBinaryPartword(MI, BB, 2, Mips::OR);
679   case Mips::ATOMIC_LOAD_OR_I32:
680     return EmitAtomicBinary(MI, BB, 4, Mips::OR);
681
682   case Mips::ATOMIC_LOAD_XOR_I8:
683     return EmitAtomicBinaryPartword(MI, BB, 1, Mips::XOR);
684   case Mips::ATOMIC_LOAD_XOR_I16:
685     return EmitAtomicBinaryPartword(MI, BB, 2, Mips::XOR);
686   case Mips::ATOMIC_LOAD_XOR_I32:
687     return EmitAtomicBinary(MI, BB, 4, Mips::XOR);
688
689   case Mips::ATOMIC_LOAD_NAND_I8:
690     return EmitAtomicBinaryPartword(MI, BB, 1, 0, true);
691   case Mips::ATOMIC_LOAD_NAND_I16:
692     return EmitAtomicBinaryPartword(MI, BB, 2, 0, true);
693   case Mips::ATOMIC_LOAD_NAND_I32:
694     return EmitAtomicBinary(MI, BB, 4, 0, true);
695
696   case Mips::ATOMIC_LOAD_SUB_I8:
697     return EmitAtomicBinaryPartword(MI, BB, 1, Mips::SUBu);
698   case Mips::ATOMIC_LOAD_SUB_I16:
699     return EmitAtomicBinaryPartword(MI, BB, 2, Mips::SUBu);
700   case Mips::ATOMIC_LOAD_SUB_I32:
701     return EmitAtomicBinary(MI, BB, 4, Mips::SUBu);
702
703   case Mips::ATOMIC_SWAP_I8:
704     return EmitAtomicBinaryPartword(MI, BB, 1, 0);
705   case Mips::ATOMIC_SWAP_I16:
706     return EmitAtomicBinaryPartword(MI, BB, 2, 0);
707   case Mips::ATOMIC_SWAP_I32:
708     return EmitAtomicBinary(MI, BB, 4, 0);
709
710   case Mips::ATOMIC_CMP_SWAP_I8:
711     return EmitAtomicCmpSwapPartword(MI, BB, 1);
712   case Mips::ATOMIC_CMP_SWAP_I16:
713     return EmitAtomicCmpSwapPartword(MI, BB, 2);
714   case Mips::ATOMIC_CMP_SWAP_I32:
715     return EmitAtomicCmpSwap(MI, BB, 4);
716   }
717 }
718
719 // This function also handles Mips::ATOMIC_SWAP_I32 (when BinOpcode == 0), and
720 // Mips::ATOMIC_LOAD_NAND_I32 (when Nand == true)
721 MachineBasicBlock *
722 MipsTargetLowering::EmitAtomicBinary(MachineInstr *MI, MachineBasicBlock *BB,
723                                      unsigned Size, unsigned BinOpcode,
724                                      bool Nand) const {
725   assert(Size == 4 && "Unsupported size for EmitAtomicBinary.");
726
727   MachineFunction *MF = BB->getParent();
728   MachineRegisterInfo &RegInfo = MF->getRegInfo();
729   const TargetRegisterClass *RC = getRegClassFor(MVT::i32);
730   const TargetInstrInfo *TII = getTargetMachine().getInstrInfo();
731   DebugLoc dl = MI->getDebugLoc();
732
733   unsigned Dest = MI->getOperand(0).getReg();
734   unsigned Ptr = MI->getOperand(1).getReg();
735   unsigned Incr = MI->getOperand(2).getReg();
736
737   unsigned Oldval = RegInfo.createVirtualRegister(RC);
738   unsigned Tmp1 = RegInfo.createVirtualRegister(RC);
739   unsigned Tmp2 = RegInfo.createVirtualRegister(RC);
740
741   // insert new blocks after the current block
742   const BasicBlock *LLVM_BB = BB->getBasicBlock();
743   MachineBasicBlock *loopMBB = MF->CreateMachineBasicBlock(LLVM_BB);
744   MachineBasicBlock *exitMBB = MF->CreateMachineBasicBlock(LLVM_BB);
745   MachineFunction::iterator It = BB;
746   ++It;
747   MF->insert(It, loopMBB);
748   MF->insert(It, exitMBB);
749
750   // Transfer the remainder of BB and its successor edges to exitMBB.
751   exitMBB->splice(exitMBB->begin(), BB,
752                   llvm::next(MachineBasicBlock::iterator(MI)),
753                   BB->end());
754   exitMBB->transferSuccessorsAndUpdatePHIs(BB);
755
756   //  thisMBB:
757   //    ...
758   //    sw incr, fi(sp)           // store incr to stack (when BinOpcode == 0)
759   //    fallthrough --> loopMBB
760
761   // Note: for atomic.swap (when BinOpcode == 0), storing incr to stack before
762   // the loop and then loading it from stack in block loopMBB is necessary to
763   // prevent MachineLICM pass to hoist "or" instruction out of the block
764   // loopMBB.
765
766   int fi = 0;
767   if (BinOpcode == 0 && !Nand) {
768     // Get or create a temporary stack location.
769     MipsFunctionInfo *MipsFI = MF->getInfo<MipsFunctionInfo>();
770     fi = MipsFI->getAtomicFrameIndex();
771     if (fi == -1) {
772       fi = MF->getFrameInfo()->CreateStackObject(Size, Size, false);
773       MipsFI->setAtomicFrameIndex(fi);
774     }
775
776     BuildMI(BB, dl, TII->get(Mips::SW))
777         .addReg(Incr).addImm(0).addFrameIndex(fi);
778   }
779   BB->addSuccessor(loopMBB);
780
781   //  loopMBB:
782   //    ll oldval, 0(ptr)
783   //    or dest, $0, oldval
784   //    <binop> tmp1, oldval, incr
785   //    sc tmp1, 0(ptr)
786   //    beq tmp1, $0, loopMBB
787   BB = loopMBB;
788   BuildMI(BB, dl, TII->get(Mips::LL), Oldval).addImm(0).addReg(Ptr);
789   BuildMI(BB, dl, TII->get(Mips::OR), Dest).addReg(Mips::ZERO).addReg(Oldval);
790   if (Nand) {
791     //  and tmp2, oldval, incr
792     //  nor tmp1, $0, tmp2
793     BuildMI(BB, dl, TII->get(Mips::AND), Tmp2).addReg(Oldval).addReg(Incr);
794     BuildMI(BB, dl, TII->get(Mips::NOR), Tmp1).addReg(Mips::ZERO).addReg(Tmp2);
795   } else if (BinOpcode) {
796     //  <binop> tmp1, oldval, incr
797     BuildMI(BB, dl, TII->get(BinOpcode), Tmp1).addReg(Oldval).addReg(Incr);
798   } else {
799     //  lw tmp2, fi(sp)              // load incr from stack
800     //  or tmp1, $zero, tmp2
801     BuildMI(BB, dl, TII->get(Mips::LW), Tmp2).addImm(0).addFrameIndex(fi);;
802     BuildMI(BB, dl, TII->get(Mips::OR), Tmp1).addReg(Mips::ZERO).addReg(Tmp2);
803   }
804   BuildMI(BB, dl, TII->get(Mips::SC), Tmp1).addReg(Tmp1).addImm(0).addReg(Ptr);
805   BuildMI(BB, dl, TII->get(Mips::BEQ))
806     .addReg(Tmp1).addReg(Mips::ZERO).addMBB(loopMBB);
807   BB->addSuccessor(loopMBB);
808   BB->addSuccessor(exitMBB);
809
810   MI->eraseFromParent();   // The instruction is gone now.
811
812   return BB;
813 }
814
815 MachineBasicBlock *
816 MipsTargetLowering::EmitAtomicBinaryPartword(MachineInstr *MI,
817                                              MachineBasicBlock *BB,
818                                              unsigned Size, unsigned BinOpcode,
819                                              bool Nand) const {
820   assert((Size == 1 || Size == 2) &&
821       "Unsupported size for EmitAtomicBinaryPartial.");
822
823   MachineFunction *MF = BB->getParent();
824   MachineRegisterInfo &RegInfo = MF->getRegInfo();
825   const TargetRegisterClass *RC = getRegClassFor(MVT::i32);
826   const TargetInstrInfo *TII = getTargetMachine().getInstrInfo();
827   DebugLoc dl = MI->getDebugLoc();
828
829   unsigned Dest = MI->getOperand(0).getReg();
830   unsigned Ptr = MI->getOperand(1).getReg();
831   unsigned Incr = MI->getOperand(2).getReg();
832
833   unsigned Addr = RegInfo.createVirtualRegister(RC);
834   unsigned Shift = RegInfo.createVirtualRegister(RC);
835   unsigned Mask = RegInfo.createVirtualRegister(RC);
836   unsigned Mask2 = RegInfo.createVirtualRegister(RC);
837   unsigned Newval = RegInfo.createVirtualRegister(RC);
838   unsigned Oldval = RegInfo.createVirtualRegister(RC);
839   unsigned Incr2 = RegInfo.createVirtualRegister(RC);
840   unsigned Tmp1 = RegInfo.createVirtualRegister(RC);
841   unsigned Tmp2 = RegInfo.createVirtualRegister(RC);
842   unsigned Tmp3 = RegInfo.createVirtualRegister(RC);
843   unsigned Tmp4 = RegInfo.createVirtualRegister(RC);
844   unsigned Tmp5 = RegInfo.createVirtualRegister(RC);
845   unsigned Tmp6 = RegInfo.createVirtualRegister(RC);
846   unsigned Tmp7 = RegInfo.createVirtualRegister(RC);
847   unsigned Tmp8 = RegInfo.createVirtualRegister(RC);
848   unsigned Tmp9 = RegInfo.createVirtualRegister(RC);
849   unsigned Tmp10 = RegInfo.createVirtualRegister(RC);
850   unsigned Tmp11 = RegInfo.createVirtualRegister(RC);
851   unsigned Tmp12 = RegInfo.createVirtualRegister(RC);
852
853   // insert new blocks after the current block
854   const BasicBlock *LLVM_BB = BB->getBasicBlock();
855   MachineBasicBlock *loopMBB = MF->CreateMachineBasicBlock(LLVM_BB);
856   MachineBasicBlock *exitMBB = MF->CreateMachineBasicBlock(LLVM_BB);
857   MachineFunction::iterator It = BB;
858   ++It;
859   MF->insert(It, loopMBB);
860   MF->insert(It, exitMBB);
861
862   // Transfer the remainder of BB and its successor edges to exitMBB.
863   exitMBB->splice(exitMBB->begin(), BB,
864                   llvm::next(MachineBasicBlock::iterator(MI)),
865                   BB->end());
866   exitMBB->transferSuccessorsAndUpdatePHIs(BB);
867
868   //  thisMBB:
869   //    addiu   tmp1,$0,-4                # 0xfffffffc
870   //    and     addr,ptr,tmp1
871   //    andi    tmp2,ptr,3
872   //    sll     shift,tmp2,3
873   //    ori     tmp3,$0,255               # 0xff
874   //    sll     mask,tmp3,shift
875   //    nor     mask2,$0,mask
876   //    andi    tmp4,incr,255
877   //    sll     incr2,tmp4,shift
878   //    sw      incr2, fi(sp)      // store incr2 to stack (when BinOpcode == 0)
879
880   // Note: for atomic.swap (when BinOpcode == 0), storing incr2 to stack before
881   // the loop and then loading it from stack in block loopMBB is necessary to
882   // prevent MachineLICM pass to hoist "or" instruction out of the block
883   // loopMBB.
884
885   int64_t MaskImm = (Size == 1) ? 255 : 65535;
886   BuildMI(BB, dl, TII->get(Mips::ADDiu), Tmp1).addReg(Mips::ZERO).addImm(-4);
887   BuildMI(BB, dl, TII->get(Mips::AND), Addr).addReg(Ptr).addReg(Tmp1);
888   BuildMI(BB, dl, TII->get(Mips::ANDi), Tmp2).addReg(Ptr).addImm(3);
889   BuildMI(BB, dl, TII->get(Mips::SLL), Shift).addReg(Tmp2).addImm(3);
890   BuildMI(BB, dl, TII->get(Mips::ORi), Tmp3).addReg(Mips::ZERO).addImm(MaskImm);
891   BuildMI(BB, dl, TII->get(Mips::SLL), Mask).addReg(Tmp3).addReg(Shift);
892   BuildMI(BB, dl, TII->get(Mips::NOR), Mask2).addReg(Mips::ZERO).addReg(Mask);
893   if (BinOpcode != Mips::SUBu) {
894     BuildMI(BB, dl, TII->get(Mips::ANDi), Tmp4).addReg(Incr).addImm(MaskImm);
895     BuildMI(BB, dl, TII->get(Mips::SLL), Incr2).addReg(Tmp4).addReg(Shift);
896   } else {
897     BuildMI(BB, dl, TII->get(Mips::SUBu), Tmp4).addReg(Mips::ZERO).addReg(Incr);
898     BuildMI(BB, dl, TII->get(Mips::ANDi), Tmp5).addReg(Tmp4).addImm(MaskImm);
899     BuildMI(BB, dl, TII->get(Mips::SLL), Incr2).addReg(Tmp5).addReg(Shift);
900   }
901
902   int fi = 0;
903   if (BinOpcode == 0 && !Nand) {
904     // Get or create a temporary stack location.
905     MipsFunctionInfo *MipsFI = MF->getInfo<MipsFunctionInfo>();
906     fi = MipsFI->getAtomicFrameIndex();
907     if (fi == -1) {
908       fi = MF->getFrameInfo()->CreateStackObject(Size, Size, false);
909       MipsFI->setAtomicFrameIndex(fi);
910     }
911
912     BuildMI(BB, dl, TII->get(Mips::SW))
913         .addReg(Incr2).addImm(0).addFrameIndex(fi);
914   }
915   BB->addSuccessor(loopMBB);
916
917   // loopMBB:
918   //   ll      oldval,0(addr)
919   //   binop   tmp7,oldval,incr2
920   //   and     newval,tmp7,mask
921   //   and     tmp8,oldval,mask2
922   //   or      tmp9,tmp8,newval
923   //   sc      tmp9,0(addr)
924   //   beq     tmp9,$0,loopMBB
925   BB = loopMBB;
926   BuildMI(BB, dl, TII->get(Mips::LL), Oldval).addImm(0).addReg(Addr);
927   if (Nand) {
928     //  and tmp6, oldval, incr2
929     //  nor tmp7, $0, tmp6
930     BuildMI(BB, dl, TII->get(Mips::AND), Tmp6).addReg(Oldval).addReg(Incr2);
931     BuildMI(BB, dl, TII->get(Mips::NOR), Tmp7).addReg(Mips::ZERO).addReg(Tmp6);
932   } else if (BinOpcode == Mips::SUBu) {
933     //  addu tmp7, oldval, incr2
934     BuildMI(BB, dl, TII->get(Mips::ADDu), Tmp7).addReg(Oldval).addReg(Incr2);
935   } else if (BinOpcode) {
936     //  <binop> tmp7, oldval, incr2
937     BuildMI(BB, dl, TII->get(BinOpcode), Tmp7).addReg(Oldval).addReg(Incr2);
938   } else {
939     //  lw tmp6, fi(sp)              // load incr2 from stack
940     //  or tmp7, $zero, tmp6
941     BuildMI(BB, dl, TII->get(Mips::LW), Tmp6).addImm(0).addFrameIndex(fi);;
942     BuildMI(BB, dl, TII->get(Mips::OR), Tmp7).addReg(Mips::ZERO).addReg(Tmp6);
943   }
944   BuildMI(BB, dl, TII->get(Mips::AND), Newval).addReg(Tmp7).addReg(Mask);
945   BuildMI(BB, dl, TII->get(Mips::AND), Tmp8).addReg(Oldval).addReg(Mask2);
946   BuildMI(BB, dl, TII->get(Mips::OR), Tmp9).addReg(Tmp8).addReg(Newval);
947   BuildMI(BB, dl, TII->get(Mips::SC), Tmp9).addReg(Tmp9).addImm(0).addReg(Addr);
948   BuildMI(BB, dl, TII->get(Mips::BEQ))
949       .addReg(Tmp9).addReg(Mips::ZERO).addMBB(loopMBB);
950   BB->addSuccessor(loopMBB);
951   BB->addSuccessor(exitMBB);
952
953   //  exitMBB:
954   //    and     tmp10,oldval,mask
955   //    srl     tmp11,tmp10,shift
956   //    sll     tmp12,tmp11,24
957   //    sra     dest,tmp12,24
958   BB = exitMBB;
959   int64_t ShiftImm = (Size == 1) ? 24 : 16;
960   // reverse order
961   BuildMI(*BB, BB->begin(), dl, TII->get(Mips::SRA), Dest)
962       .addReg(Tmp12).addImm(ShiftImm);
963   BuildMI(*BB, BB->begin(), dl, TII->get(Mips::SLL), Tmp12)
964       .addReg(Tmp11).addImm(ShiftImm);
965   BuildMI(*BB, BB->begin(), dl, TII->get(Mips::SRL), Tmp11)
966       .addReg(Tmp10).addReg(Shift);
967   BuildMI(*BB, BB->begin(), dl, TII->get(Mips::AND), Tmp10)
968     .addReg(Oldval).addReg(Mask);
969
970   MI->eraseFromParent();   // The instruction is gone now.
971
972   return BB;
973 }
974
975 MachineBasicBlock *
976 MipsTargetLowering::EmitAtomicCmpSwap(MachineInstr *MI,
977                                       MachineBasicBlock *BB,
978                                       unsigned Size) const {
979   assert(Size == 4 && "Unsupported size for EmitAtomicCmpSwap.");
980
981   MachineFunction *MF = BB->getParent();
982   MachineRegisterInfo &RegInfo = MF->getRegInfo();
983   const TargetRegisterClass *RC = getRegClassFor(MVT::i32);
984   const TargetInstrInfo *TII = getTargetMachine().getInstrInfo();
985   DebugLoc dl = MI->getDebugLoc();
986
987   unsigned Dest    = MI->getOperand(0).getReg();
988   unsigned Ptr     = MI->getOperand(1).getReg();
989   unsigned Oldval  = MI->getOperand(2).getReg();
990   unsigned Newval  = MI->getOperand(3).getReg();
991
992   unsigned Tmp1 = RegInfo.createVirtualRegister(RC);
993   unsigned Tmp2 = RegInfo.createVirtualRegister(RC);
994
995   // insert new blocks after the current block
996   const BasicBlock *LLVM_BB = BB->getBasicBlock();
997   MachineBasicBlock *loop1MBB = MF->CreateMachineBasicBlock(LLVM_BB);
998   MachineBasicBlock *loop2MBB = MF->CreateMachineBasicBlock(LLVM_BB);
999   MachineBasicBlock *exitMBB = MF->CreateMachineBasicBlock(LLVM_BB);
1000   MachineFunction::iterator It = BB;
1001   ++It;
1002   MF->insert(It, loop1MBB);
1003   MF->insert(It, loop2MBB);
1004   MF->insert(It, exitMBB);
1005
1006   // Transfer the remainder of BB and its successor edges to exitMBB.
1007   exitMBB->splice(exitMBB->begin(), BB,
1008                   llvm::next(MachineBasicBlock::iterator(MI)),
1009                   BB->end());
1010   exitMBB->transferSuccessorsAndUpdatePHIs(BB);
1011
1012   // Get or create a temporary stack location.
1013   MipsFunctionInfo *MipsFI = MF->getInfo<MipsFunctionInfo>();
1014   int fi = MipsFI->getAtomicFrameIndex();
1015   if (fi == -1) {
1016     fi = MF->getFrameInfo()->CreateStackObject(Size, Size, false);
1017     MipsFI->setAtomicFrameIndex(fi);
1018   }
1019
1020   //  thisMBB:
1021   //    ...
1022   //    sw newval, fi(sp)           // store newval to stack
1023   //    fallthrough --> loop1MBB
1024
1025   // Note: storing newval to stack before the loop and then loading it from
1026   // stack in block loop2MBB is necessary to prevent MachineLICM pass to
1027   // hoist "or" instruction out of the block loop2MBB.
1028
1029   BuildMI(BB, dl, TII->get(Mips::SW))
1030       .addReg(Newval).addImm(0).addFrameIndex(fi);
1031   BB->addSuccessor(loop1MBB);
1032
1033   // loop1MBB:
1034   //   ll dest, 0(ptr)
1035   //   bne dest, oldval, exitMBB
1036   BB = loop1MBB;
1037   BuildMI(BB, dl, TII->get(Mips::LL), Dest).addImm(0).addReg(Ptr);
1038   BuildMI(BB, dl, TII->get(Mips::BNE))
1039     .addReg(Dest).addReg(Oldval).addMBB(exitMBB);
1040   BB->addSuccessor(exitMBB);
1041   BB->addSuccessor(loop2MBB);
1042
1043   // loop2MBB:
1044   //   lw tmp2, fi(sp)              // load newval from stack
1045   //   or tmp1, $0, tmp2
1046   //   sc tmp1, 0(ptr)
1047   //   beq tmp1, $0, loop1MBB
1048   BB = loop2MBB;
1049   BuildMI(BB, dl, TII->get(Mips::LW), Tmp2).addImm(0).addFrameIndex(fi);;
1050   BuildMI(BB, dl, TII->get(Mips::OR), Tmp1).addReg(Mips::ZERO).addReg(Tmp2);
1051   BuildMI(BB, dl, TII->get(Mips::SC), Tmp1).addReg(Tmp1).addImm(0).addReg(Ptr);
1052   BuildMI(BB, dl, TII->get(Mips::BEQ))
1053     .addReg(Tmp1).addReg(Mips::ZERO).addMBB(loop1MBB);
1054   BB->addSuccessor(loop1MBB);
1055   BB->addSuccessor(exitMBB);
1056
1057   MI->eraseFromParent();   // The instruction is gone now.
1058
1059   return BB;
1060 }
1061
1062 MachineBasicBlock *
1063 MipsTargetLowering::EmitAtomicCmpSwapPartword(MachineInstr *MI,
1064                                               MachineBasicBlock *BB,
1065                                               unsigned Size) const {
1066   assert((Size == 1 || Size == 2) &&
1067       "Unsupported size for EmitAtomicCmpSwapPartial.");
1068
1069   MachineFunction *MF = BB->getParent();
1070   MachineRegisterInfo &RegInfo = MF->getRegInfo();
1071   const TargetRegisterClass *RC = getRegClassFor(MVT::i32);
1072   const TargetInstrInfo *TII = getTargetMachine().getInstrInfo();
1073   DebugLoc dl = MI->getDebugLoc();
1074
1075   unsigned Dest    = MI->getOperand(0).getReg();
1076   unsigned Ptr     = MI->getOperand(1).getReg();
1077   unsigned Oldval  = MI->getOperand(2).getReg();
1078   unsigned Newval  = MI->getOperand(3).getReg();
1079
1080   unsigned Addr = RegInfo.createVirtualRegister(RC);
1081   unsigned Shift = RegInfo.createVirtualRegister(RC);
1082   unsigned Mask = RegInfo.createVirtualRegister(RC);
1083   unsigned Mask2 = RegInfo.createVirtualRegister(RC);
1084   unsigned Oldval2 = RegInfo.createVirtualRegister(RC);
1085   unsigned Oldval3 = RegInfo.createVirtualRegister(RC);
1086   unsigned Oldval4 = RegInfo.createVirtualRegister(RC);
1087   unsigned Newval2 = RegInfo.createVirtualRegister(RC);
1088   unsigned Tmp1 = RegInfo.createVirtualRegister(RC);
1089   unsigned Tmp2 = RegInfo.createVirtualRegister(RC);
1090   unsigned Tmp3 = RegInfo.createVirtualRegister(RC);
1091   unsigned Tmp4 = RegInfo.createVirtualRegister(RC);
1092   unsigned Tmp5 = RegInfo.createVirtualRegister(RC);
1093   unsigned Tmp6 = RegInfo.createVirtualRegister(RC);
1094   unsigned Tmp7 = RegInfo.createVirtualRegister(RC);
1095   unsigned Tmp8 = RegInfo.createVirtualRegister(RC);
1096   unsigned Tmp9 = RegInfo.createVirtualRegister(RC);
1097
1098   // insert new blocks after the current block
1099   const BasicBlock *LLVM_BB = BB->getBasicBlock();
1100   MachineBasicBlock *loop1MBB = MF->CreateMachineBasicBlock(LLVM_BB);
1101   MachineBasicBlock *loop2MBB = MF->CreateMachineBasicBlock(LLVM_BB);
1102   MachineBasicBlock *exitMBB = MF->CreateMachineBasicBlock(LLVM_BB);
1103   MachineFunction::iterator It = BB;
1104   ++It;
1105   MF->insert(It, loop1MBB);
1106   MF->insert(It, loop2MBB);
1107   MF->insert(It, exitMBB);
1108
1109   // Transfer the remainder of BB and its successor edges to exitMBB.
1110   exitMBB->splice(exitMBB->begin(), BB,
1111                   llvm::next(MachineBasicBlock::iterator(MI)),
1112                   BB->end());
1113   exitMBB->transferSuccessorsAndUpdatePHIs(BB);
1114
1115   //  thisMBB:
1116   //    addiu   tmp1,$0,-4                # 0xfffffffc
1117   //    and     addr,ptr,tmp1
1118   //    andi    tmp2,ptr,3
1119   //    sll     shift,tmp2,3
1120   //    ori     tmp3,$0,255               # 0xff
1121   //    sll     mask,tmp3,shift
1122   //    nor     mask2,$0,mask
1123   //    andi    tmp4,oldval,255
1124   //    sll     oldval2,tmp4,shift
1125   //    andi    tmp5,newval,255
1126   //    sll     newval2,tmp5,shift
1127   int64_t MaskImm = (Size == 1) ? 255 : 65535;
1128   BuildMI(BB, dl, TII->get(Mips::ADDiu), Tmp1).addReg(Mips::ZERO).addImm(-4);
1129   BuildMI(BB, dl, TII->get(Mips::AND), Addr).addReg(Ptr).addReg(Tmp1);
1130   BuildMI(BB, dl, TII->get(Mips::ANDi), Tmp2).addReg(Ptr).addImm(3);
1131   BuildMI(BB, dl, TII->get(Mips::SLL), Shift).addReg(Tmp2).addImm(3);
1132   BuildMI(BB, dl, TII->get(Mips::ORi), Tmp3).addReg(Mips::ZERO).addImm(MaskImm);
1133   BuildMI(BB, dl, TII->get(Mips::SLL), Mask).addReg(Tmp3).addReg(Shift);
1134   BuildMI(BB, dl, TII->get(Mips::NOR), Mask2).addReg(Mips::ZERO).addReg(Mask);
1135   BuildMI(BB, dl, TII->get(Mips::ANDi), Tmp4).addReg(Oldval).addImm(MaskImm);
1136   BuildMI(BB, dl, TII->get(Mips::SLL), Oldval2).addReg(Tmp4).addReg(Shift);
1137   BuildMI(BB, dl, TII->get(Mips::ANDi), Tmp5).addReg(Newval).addImm(MaskImm);
1138   BuildMI(BB, dl, TII->get(Mips::SLL), Newval2).addReg(Tmp5).addReg(Shift);
1139   BB->addSuccessor(loop1MBB);
1140
1141   //  loop1MBB:
1142   //    ll      oldval3,0(addr)
1143   //    and     oldval4,oldval3,mask
1144   //    bne     oldval4,oldval2,exitMBB
1145   BB = loop1MBB;
1146   BuildMI(BB, dl, TII->get(Mips::LL), Oldval3).addImm(0).addReg(Addr);
1147   BuildMI(BB, dl, TII->get(Mips::AND), Oldval4).addReg(Oldval3).addReg(Mask);
1148   BuildMI(BB, dl, TII->get(Mips::BNE))
1149       .addReg(Oldval4).addReg(Oldval2).addMBB(exitMBB);
1150   BB->addSuccessor(exitMBB);
1151   BB->addSuccessor(loop2MBB);
1152
1153   //  loop2MBB:
1154   //    and     tmp6,oldval3,mask2
1155   //    or      tmp7,tmp6,newval2
1156   //    sc      tmp7,0(addr)
1157   //    beq     tmp7,$0,loop1MBB
1158   BB = loop2MBB;
1159   BuildMI(BB, dl, TII->get(Mips::AND), Tmp6).addReg(Oldval3).addReg(Mask2);
1160   BuildMI(BB, dl, TII->get(Mips::OR), Tmp7).addReg(Tmp6).addReg(Newval2);
1161   BuildMI(BB, dl, TII->get(Mips::SC), Tmp7)
1162       .addReg(Tmp7).addImm(0).addReg(Addr);
1163   BuildMI(BB, dl, TII->get(Mips::BEQ))
1164       .addReg(Tmp7).addReg(Mips::ZERO).addMBB(loop1MBB);
1165   BB->addSuccessor(loop1MBB);
1166   BB->addSuccessor(exitMBB);
1167
1168   //  exitMBB:
1169   //    srl     tmp8,oldval4,shift
1170   //    sll     tmp9,tmp8,24
1171   //    sra     dest,tmp9,24
1172   BB = exitMBB;
1173   int64_t ShiftImm = (Size == 1) ? 24 : 16;
1174   // reverse order
1175   BuildMI(*BB, BB->begin(), dl, TII->get(Mips::SRA), Dest)
1176       .addReg(Tmp9).addImm(ShiftImm);
1177   BuildMI(*BB, BB->begin(), dl, TII->get(Mips::SLL), Tmp9)
1178       .addReg(Tmp8).addImm(ShiftImm);
1179   BuildMI(*BB, BB->begin(), dl, TII->get(Mips::SRL), Tmp8)
1180       .addReg(Oldval4).addReg(Shift);
1181
1182   MI->eraseFromParent();   // The instruction is gone now.
1183
1184   return BB;
1185 }
1186
1187 //===----------------------------------------------------------------------===//
1188 //  Misc Lower Operation implementation
1189 //===----------------------------------------------------------------------===//
1190 SDValue MipsTargetLowering::
1191 LowerDYNAMIC_STACKALLOC(SDValue Op, SelectionDAG &DAG) const
1192 {
1193   MachineFunction &MF = DAG.getMachineFunction();
1194   MipsFunctionInfo *MipsFI = MF.getInfo<MipsFunctionInfo>();
1195
1196   assert(getTargetMachine().getFrameLowering()->getStackAlignment() >=
1197          cast<ConstantSDNode>(Op.getOperand(2).getNode())->getZExtValue() &&
1198          "Cannot lower if the alignment of the allocated space is larger than \
1199           that of the stack.");
1200
1201   SDValue Chain = Op.getOperand(0);
1202   SDValue Size = Op.getOperand(1);
1203   DebugLoc dl = Op.getDebugLoc();
1204
1205   // Get a reference from Mips stack pointer
1206   SDValue StackPointer = DAG.getCopyFromReg(Chain, dl, Mips::SP, MVT::i32);
1207
1208   // Subtract the dynamic size from the actual stack size to
1209   // obtain the new stack size.
1210   SDValue Sub = DAG.getNode(ISD::SUB, dl, MVT::i32, StackPointer, Size);
1211
1212   // The Sub result contains the new stack start address, so it
1213   // must be placed in the stack pointer register.
1214   Chain = DAG.getCopyToReg(StackPointer.getValue(1), dl, Mips::SP, Sub,
1215                            SDValue());
1216
1217   // This node always has two return values: a new stack pointer
1218   // value and a chain
1219   SDVTList VTLs = DAG.getVTList(MVT::i32, MVT::Other);
1220   SDValue Ptr = DAG.getFrameIndex(MipsFI->getDynAllocFI(), getPointerTy());
1221   SDValue Ops[] = { Chain, Ptr, Chain.getValue(1) };
1222
1223   return DAG.getNode(MipsISD::DynAlloc, dl, VTLs, Ops, 3);
1224 }
1225
1226 SDValue MipsTargetLowering::
1227 LowerBRCOND(SDValue Op, SelectionDAG &DAG) const
1228 {
1229   // The first operand is the chain, the second is the condition, the third is
1230   // the block to branch to if the condition is true.
1231   SDValue Chain = Op.getOperand(0);
1232   SDValue Dest = Op.getOperand(2);
1233   DebugLoc dl = Op.getDebugLoc();
1234
1235   SDValue CondRes = CreateFPCmp(DAG, Op.getOperand(1));
1236
1237   // Return if flag is not set by a floating point comparison.
1238   if (CondRes.getOpcode() != MipsISD::FPCmp)
1239     return Op;
1240
1241   SDValue CCNode  = CondRes.getOperand(2);
1242   Mips::CondCode CC =
1243     (Mips::CondCode)cast<ConstantSDNode>(CCNode)->getZExtValue();
1244   SDValue BrCode = DAG.getConstant(GetFPBranchCodeFromCond(CC), MVT::i32);
1245
1246   return DAG.getNode(MipsISD::FPBrcond, dl, Op.getValueType(), Chain, BrCode,
1247                      Dest, CondRes);
1248 }
1249
1250 SDValue MipsTargetLowering::
1251 LowerSELECT(SDValue Op, SelectionDAG &DAG) const
1252 {
1253   SDValue Cond = CreateFPCmp(DAG, Op.getOperand(0));
1254
1255   // Return if flag is not set by a floating point comparison.
1256   if (Cond.getOpcode() != MipsISD::FPCmp)
1257     return Op;
1258
1259   return CreateCMovFP(DAG, Cond, Op.getOperand(1), Op.getOperand(2),
1260                       Op.getDebugLoc());
1261 }
1262
1263 SDValue MipsTargetLowering::LowerGlobalAddress(SDValue Op,
1264                                                SelectionDAG &DAG) const {
1265   // FIXME there isn't actually debug info here
1266   DebugLoc dl = Op.getDebugLoc();
1267   const GlobalValue *GV = cast<GlobalAddressSDNode>(Op)->getGlobal();
1268
1269   if (getTargetMachine().getRelocationModel() != Reloc::PIC_) {
1270     SDVTList VTs = DAG.getVTList(MVT::i32);
1271
1272     MipsTargetObjectFile &TLOF = (MipsTargetObjectFile&)getObjFileLowering();
1273
1274     // %gp_rel relocation
1275     if (TLOF.IsGlobalInSmallSection(GV, getTargetMachine())) {
1276       SDValue GA = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1277                                               MipsII::MO_GPREL);
1278       SDValue GPRelNode = DAG.getNode(MipsISD::GPRel, dl, VTs, &GA, 1);
1279       SDValue GOT = DAG.getGLOBAL_OFFSET_TABLE(MVT::i32);
1280       return DAG.getNode(ISD::ADD, dl, MVT::i32, GOT, GPRelNode);
1281     }
1282     // %hi/%lo relocation
1283     SDValue GAHi = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1284                                               MipsII::MO_ABS_HI);
1285     SDValue GALo = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1286                                               MipsII::MO_ABS_LO);
1287     SDValue HiPart = DAG.getNode(MipsISD::Hi, dl, VTs, &GAHi, 1);
1288     SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, GALo);
1289     return DAG.getNode(ISD::ADD, dl, MVT::i32, HiPart, Lo);
1290   }
1291
1292   SDValue GA = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1293                                           MipsII::MO_GOT);
1294   GA = DAG.getNode(MipsISD::WrapperPIC, dl, MVT::i32, GA);
1295   SDValue ResNode = DAG.getLoad(MVT::i32, dl,
1296                                 DAG.getEntryNode(), GA, MachinePointerInfo(),
1297                                 false, false, 0);
1298   // On functions and global targets not internal linked only
1299   // a load from got/GP is necessary for PIC to work.
1300   if (!GV->hasInternalLinkage() &&
1301       (!GV->hasLocalLinkage() || isa<Function>(GV)))
1302     return ResNode;
1303   SDValue GALo = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1304                                             MipsII::MO_ABS_LO);
1305   SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, GALo);
1306   return DAG.getNode(ISD::ADD, dl, MVT::i32, ResNode, Lo);
1307 }
1308
1309 SDValue MipsTargetLowering::LowerBlockAddress(SDValue Op,
1310                                               SelectionDAG &DAG) const {
1311   const BlockAddress *BA = cast<BlockAddressSDNode>(Op)->getBlockAddress();
1312   // FIXME there isn't actually debug info here
1313   DebugLoc dl = Op.getDebugLoc();
1314
1315   if (getTargetMachine().getRelocationModel() != Reloc::PIC_) {
1316     // %hi/%lo relocation
1317     SDValue BAHi = DAG.getBlockAddress(BA, MVT::i32, true,
1318                                        MipsII::MO_ABS_HI);
1319     SDValue BALo = DAG.getBlockAddress(BA, MVT::i32, true,
1320                                        MipsII::MO_ABS_LO);
1321     SDValue Hi = DAG.getNode(MipsISD::Hi, dl, MVT::i32, BAHi);
1322     SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, BALo);
1323     return DAG.getNode(ISD::ADD, dl, MVT::i32, Hi, Lo);
1324   }
1325
1326   SDValue BAGOTOffset = DAG.getBlockAddress(BA, MVT::i32, true,
1327                                             MipsII::MO_GOT);
1328   BAGOTOffset = DAG.getNode(MipsISD::WrapperPIC, dl, MVT::i32, BAGOTOffset);
1329   SDValue BALOOffset = DAG.getBlockAddress(BA, MVT::i32, true,
1330                                            MipsII::MO_ABS_LO);
1331   SDValue Load = DAG.getLoad(MVT::i32, dl,
1332                              DAG.getEntryNode(), BAGOTOffset,
1333                              MachinePointerInfo(), false, false, 0);
1334   SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, BALOOffset);
1335   return DAG.getNode(ISD::ADD, dl, MVT::i32, Load, Lo);
1336 }
1337
1338 SDValue MipsTargetLowering::
1339 LowerGlobalTLSAddress(SDValue Op, SelectionDAG &DAG) const
1340 {
1341   // If the relocation model is PIC, use the General Dynamic TLS Model,
1342   // otherwise use the Initial Exec or Local Exec TLS Model.
1343   // TODO: implement Local Dynamic TLS model
1344
1345   GlobalAddressSDNode *GA = cast<GlobalAddressSDNode>(Op);
1346   DebugLoc dl = GA->getDebugLoc();
1347   const GlobalValue *GV = GA->getGlobal();
1348   EVT PtrVT = getPointerTy();
1349
1350   if (getTargetMachine().getRelocationModel() == Reloc::PIC_) {
1351     // General Dynamic TLS Model
1352     SDValue TGA = DAG.getTargetGlobalAddress(GV, dl, MVT::i32,
1353                                              0, MipsII::MO_TLSGD);
1354     SDValue Tlsgd = DAG.getNode(MipsISD::TlsGd, dl, MVT::i32, TGA);
1355     SDValue GP = DAG.getRegister(Mips::GP, MVT::i32);
1356     SDValue Argument = DAG.getNode(ISD::ADD, dl, MVT::i32, GP, Tlsgd);
1357
1358     ArgListTy Args;
1359     ArgListEntry Entry;
1360     Entry.Node = Argument;
1361     Entry.Ty = (const Type *) Type::getInt32Ty(*DAG.getContext());
1362     Args.push_back(Entry);
1363     std::pair<SDValue, SDValue> CallResult =
1364         LowerCallTo(DAG.getEntryNode(),
1365                     (const Type *) Type::getInt32Ty(*DAG.getContext()),
1366                     false, false, false, false, 0, CallingConv::C, false, true,
1367                     DAG.getExternalSymbol("__tls_get_addr", PtrVT), Args, DAG,
1368                     dl);
1369
1370     return CallResult.first;
1371   }
1372
1373   SDValue Offset;
1374   if (GV->isDeclaration()) {
1375     // Initial Exec TLS Model
1376     SDValue TGA = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1377                                              MipsII::MO_GOTTPREL);
1378     Offset = DAG.getLoad(MVT::i32, dl,
1379                          DAG.getEntryNode(), TGA, MachinePointerInfo(),
1380                          false, false, 0);
1381   } else {
1382     // Local Exec TLS Model
1383     SDVTList VTs = DAG.getVTList(MVT::i32);
1384     SDValue TGAHi = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1385                                                MipsII::MO_TPREL_HI);
1386     SDValue TGALo = DAG.getTargetGlobalAddress(GV, dl, MVT::i32, 0,
1387                                                MipsII::MO_TPREL_LO);
1388     SDValue Hi = DAG.getNode(MipsISD::TprelHi, dl, VTs, &TGAHi, 1);
1389     SDValue Lo = DAG.getNode(MipsISD::TprelLo, dl, MVT::i32, TGALo);
1390     Offset = DAG.getNode(ISD::ADD, dl, MVT::i32, Hi, Lo);
1391   }
1392
1393   SDValue ThreadPointer = DAG.getNode(MipsISD::ThreadPointer, dl, PtrVT);
1394   return DAG.getNode(ISD::ADD, dl, PtrVT, ThreadPointer, Offset);
1395 }
1396
1397 SDValue MipsTargetLowering::
1398 LowerJumpTable(SDValue Op, SelectionDAG &DAG) const
1399 {
1400   SDValue ResNode;
1401   SDValue HiPart;
1402   // FIXME there isn't actually debug info here
1403   DebugLoc dl = Op.getDebugLoc();
1404   bool IsPIC = getTargetMachine().getRelocationModel() == Reloc::PIC_;
1405   unsigned char OpFlag = IsPIC ? MipsII::MO_GOT : MipsII::MO_ABS_HI;
1406
1407   EVT PtrVT = Op.getValueType();
1408   JumpTableSDNode *JT  = cast<JumpTableSDNode>(Op);
1409
1410   SDValue JTI = DAG.getTargetJumpTable(JT->getIndex(), PtrVT, OpFlag);
1411
1412   if (!IsPIC) {
1413     SDValue Ops[] = { JTI };
1414     HiPart = DAG.getNode(MipsISD::Hi, dl, DAG.getVTList(MVT::i32), Ops, 1);
1415   } else {// Emit Load from Global Pointer
1416     JTI = DAG.getNode(MipsISD::WrapperPIC, dl, MVT::i32, JTI);
1417     HiPart = DAG.getLoad(MVT::i32, dl, DAG.getEntryNode(), JTI,
1418                          MachinePointerInfo(),
1419                          false, false, 0);
1420   }
1421
1422   SDValue JTILo = DAG.getTargetJumpTable(JT->getIndex(), PtrVT,
1423                                          MipsII::MO_ABS_LO);
1424   SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, JTILo);
1425   ResNode = DAG.getNode(ISD::ADD, dl, MVT::i32, HiPart, Lo);
1426
1427   return ResNode;
1428 }
1429
1430 SDValue MipsTargetLowering::
1431 LowerConstantPool(SDValue Op, SelectionDAG &DAG) const
1432 {
1433   SDValue ResNode;
1434   ConstantPoolSDNode *N = cast<ConstantPoolSDNode>(Op);
1435   const Constant *C = N->getConstVal();
1436   // FIXME there isn't actually debug info here
1437   DebugLoc dl = Op.getDebugLoc();
1438
1439   // gp_rel relocation
1440   // FIXME: we should reference the constant pool using small data sections,
1441   // but the asm printer currently doesn't support this feature without
1442   // hacking it. This feature should come soon so we can uncomment the
1443   // stuff below.
1444   //if (IsInSmallSection(C->getType())) {
1445   //  SDValue GPRelNode = DAG.getNode(MipsISD::GPRel, MVT::i32, CP);
1446   //  SDValue GOT = DAG.getGLOBAL_OFFSET_TABLE(MVT::i32);
1447   //  ResNode = DAG.getNode(ISD::ADD, MVT::i32, GOT, GPRelNode);
1448
1449   if (getTargetMachine().getRelocationModel() != Reloc::PIC_) {
1450     SDValue CPHi = DAG.getTargetConstantPool(C, MVT::i32, N->getAlignment(),
1451                                              N->getOffset(), MipsII::MO_ABS_HI);
1452     SDValue CPLo = DAG.getTargetConstantPool(C, MVT::i32, N->getAlignment(),
1453                                              N->getOffset(), MipsII::MO_ABS_LO);
1454     SDValue HiPart = DAG.getNode(MipsISD::Hi, dl, MVT::i32, CPHi);
1455     SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, CPLo);
1456     ResNode = DAG.getNode(ISD::ADD, dl, MVT::i32, HiPart, Lo);
1457   } else {
1458     SDValue CP = DAG.getTargetConstantPool(C, MVT::i32, N->getAlignment(),
1459                                            N->getOffset(), MipsII::MO_GOT);
1460     CP = DAG.getNode(MipsISD::WrapperPIC, dl, MVT::i32, CP);
1461     SDValue Load = DAG.getLoad(MVT::i32, dl, DAG.getEntryNode(),
1462                                CP, MachinePointerInfo::getConstantPool(),
1463                                false, false, 0);
1464     SDValue CPLo = DAG.getTargetConstantPool(C, MVT::i32, N->getAlignment(),
1465                                              N->getOffset(), MipsII::MO_ABS_LO);
1466     SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, CPLo);
1467     ResNode = DAG.getNode(ISD::ADD, dl, MVT::i32, Load, Lo);
1468   }
1469
1470   return ResNode;
1471 }
1472
1473 SDValue MipsTargetLowering::LowerVASTART(SDValue Op, SelectionDAG &DAG) const {
1474   MachineFunction &MF = DAG.getMachineFunction();
1475   MipsFunctionInfo *FuncInfo = MF.getInfo<MipsFunctionInfo>();
1476
1477   DebugLoc dl = Op.getDebugLoc();
1478   SDValue FI = DAG.getFrameIndex(FuncInfo->getVarArgsFrameIndex(),
1479                                  getPointerTy());
1480
1481   // vastart just stores the address of the VarArgsFrameIndex slot into the
1482   // memory location argument.
1483   const Value *SV = cast<SrcValueSDNode>(Op.getOperand(2))->getValue();
1484   return DAG.getStore(Op.getOperand(0), dl, FI, Op.getOperand(1),
1485                       MachinePointerInfo(SV),
1486                       false, false, 0);
1487 }
1488
1489 static SDValue LowerFCOPYSIGN32(SDValue Op, SelectionDAG &DAG) {
1490   // FIXME: Use ext/ins instructions if target architecture is Mips32r2.
1491   DebugLoc dl = Op.getDebugLoc();
1492   SDValue Op0 = DAG.getNode(ISD::BITCAST, dl, MVT::i32, Op.getOperand(0));
1493   SDValue Op1 = DAG.getNode(ISD::BITCAST, dl, MVT::i32, Op.getOperand(1));
1494   SDValue And0 = DAG.getNode(ISD::AND, dl, MVT::i32, Op0,
1495                              DAG.getConstant(0x7fffffff, MVT::i32));
1496   SDValue And1 = DAG.getNode(ISD::AND, dl, MVT::i32, Op1,
1497                              DAG.getConstant(0x80000000, MVT::i32));
1498   SDValue Result = DAG.getNode(ISD::OR, dl, MVT::i32, And0, And1);
1499   return DAG.getNode(ISD::BITCAST, dl, MVT::f32, Result);
1500 }
1501
1502 static SDValue LowerFCOPYSIGN64(SDValue Op, SelectionDAG &DAG, bool isLittle) {
1503   // FIXME:
1504   //  Use ext/ins instructions if target architecture is Mips32r2.
1505   //  Eliminate redundant mfc1 and mtc1 instructions.
1506   unsigned LoIdx = 0, HiIdx = 1;
1507
1508   if (!isLittle)
1509     std::swap(LoIdx, HiIdx);
1510
1511   DebugLoc dl = Op.getDebugLoc();
1512   SDValue Word0 = DAG.getNode(MipsISD::ExtractElementF64, dl, MVT::i32,
1513                               Op.getOperand(0),
1514                               DAG.getConstant(LoIdx, MVT::i32));
1515   SDValue Hi0 = DAG.getNode(MipsISD::ExtractElementF64, dl, MVT::i32,
1516                             Op.getOperand(0), DAG.getConstant(HiIdx, MVT::i32));
1517   SDValue Hi1 = DAG.getNode(MipsISD::ExtractElementF64, dl, MVT::i32,
1518                             Op.getOperand(1), DAG.getConstant(HiIdx, MVT::i32));
1519   SDValue And0 = DAG.getNode(ISD::AND, dl, MVT::i32, Hi0,
1520                              DAG.getConstant(0x7fffffff, MVT::i32));
1521   SDValue And1 = DAG.getNode(ISD::AND, dl, MVT::i32, Hi1,
1522                              DAG.getConstant(0x80000000, MVT::i32));
1523   SDValue Word1 = DAG.getNode(ISD::OR, dl, MVT::i32, And0, And1);
1524
1525   if (!isLittle)
1526     std::swap(Word0, Word1);
1527
1528   return DAG.getNode(MipsISD::BuildPairF64, dl, MVT::f64, Word0, Word1);
1529 }
1530
1531 SDValue MipsTargetLowering::LowerFCOPYSIGN(SDValue Op, SelectionDAG &DAG)
1532   const {
1533   EVT Ty = Op.getValueType();
1534
1535   assert(Ty == MVT::f32 || Ty == MVT::f64);
1536
1537   if (Ty == MVT::f32)
1538     return LowerFCOPYSIGN32(Op, DAG);
1539   else
1540     return LowerFCOPYSIGN64(Op, DAG, Subtarget->isLittle());
1541 }
1542
1543 SDValue MipsTargetLowering::
1544 LowerFRAMEADDR(SDValue Op, SelectionDAG &DAG) const {
1545   // check the depth
1546   assert((cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue() == 0) &&
1547          "Frame address can only be determined for current frame.");
1548
1549   MachineFrameInfo *MFI = DAG.getMachineFunction().getFrameInfo();
1550   MFI->setFrameAddressIsTaken(true);
1551   EVT VT = Op.getValueType();
1552   DebugLoc dl = Op.getDebugLoc();
1553   SDValue FrameAddr = DAG.getCopyFromReg(DAG.getEntryNode(), dl, Mips::FP, VT);
1554   return FrameAddr;
1555 }
1556
1557 //===----------------------------------------------------------------------===//
1558 //                      Calling Convention Implementation
1559 //===----------------------------------------------------------------------===//
1560
1561 #include "MipsGenCallingConv.inc"
1562
1563 //===----------------------------------------------------------------------===//
1564 // TODO: Implement a generic logic using tblgen that can support this.
1565 // Mips O32 ABI rules:
1566 // ---
1567 // i32 - Passed in A0, A1, A2, A3 and stack
1568 // f32 - Only passed in f32 registers if no int reg has been used yet to hold
1569 //       an argument. Otherwise, passed in A1, A2, A3 and stack.
1570 // f64 - Only passed in two aliased f32 registers if no int reg has been used
1571 //       yet to hold an argument. Otherwise, use A2, A3 and stack. If A1 is
1572 //       not used, it must be shadowed. If only A3 is avaiable, shadow it and
1573 //       go to stack.
1574 //
1575 //  For vararg functions, all arguments are passed in A0, A1, A2, A3 and stack.
1576 //===----------------------------------------------------------------------===//
1577
1578 static bool CC_MipsO32(unsigned ValNo, MVT ValVT,
1579                        MVT LocVT, CCValAssign::LocInfo LocInfo,
1580                        ISD::ArgFlagsTy ArgFlags, CCState &State) {
1581
1582   static const unsigned IntRegsSize=4, FloatRegsSize=2;
1583
1584   static const unsigned IntRegs[] = {
1585       Mips::A0, Mips::A1, Mips::A2, Mips::A3
1586   };
1587   static const unsigned F32Regs[] = {
1588       Mips::F12, Mips::F14
1589   };
1590   static const unsigned F64Regs[] = {
1591       Mips::D6, Mips::D7
1592   };
1593
1594   // ByVal Args
1595   if (ArgFlags.isByVal()) {
1596     State.HandleByVal(ValNo, ValVT, LocVT, LocInfo,
1597                       1 /*MinSize*/, 4 /*MinAlign*/, ArgFlags);
1598     unsigned NextReg = (State.getNextStackOffset() + 3) / 4;
1599     for (unsigned r = State.getFirstUnallocated(IntRegs, IntRegsSize);
1600          r < std::min(IntRegsSize, NextReg); ++r)
1601       State.AllocateReg(IntRegs[r]);
1602     return false;
1603   }
1604
1605   // Promote i8 and i16
1606   if (LocVT == MVT::i8 || LocVT == MVT::i16) {
1607     LocVT = MVT::i32;
1608     if (ArgFlags.isSExt())
1609       LocInfo = CCValAssign::SExt;
1610     else if (ArgFlags.isZExt())
1611       LocInfo = CCValAssign::ZExt;
1612     else
1613       LocInfo = CCValAssign::AExt;
1614   }
1615
1616   unsigned Reg;
1617
1618   // f32 and f64 are allocated in A0, A1, A2, A3 when either of the following
1619   // is true: function is vararg, argument is 3rd or higher, there is previous
1620   // argument which is not f32 or f64.
1621   bool AllocateFloatsInIntReg = State.isVarArg() || ValNo > 1
1622       || State.getFirstUnallocated(F32Regs, FloatRegsSize) != ValNo;
1623   unsigned OrigAlign = ArgFlags.getOrigAlign();
1624   bool isI64 = (ValVT == MVT::i32 && OrigAlign == 8);
1625
1626   if (ValVT == MVT::i32 || (ValVT == MVT::f32 && AllocateFloatsInIntReg)) {
1627     Reg = State.AllocateReg(IntRegs, IntRegsSize);
1628     // If this is the first part of an i64 arg,
1629     // the allocated register must be either A0 or A2.
1630     if (isI64 && (Reg == Mips::A1 || Reg == Mips::A3))
1631       Reg = State.AllocateReg(IntRegs, IntRegsSize);
1632     LocVT = MVT::i32;
1633   } else if (ValVT == MVT::f64 && AllocateFloatsInIntReg) {
1634     // Allocate int register and shadow next int register. If first
1635     // available register is Mips::A1 or Mips::A3, shadow it too.
1636     Reg = State.AllocateReg(IntRegs, IntRegsSize);
1637     if (Reg == Mips::A1 || Reg == Mips::A3)
1638       Reg = State.AllocateReg(IntRegs, IntRegsSize);
1639     State.AllocateReg(IntRegs, IntRegsSize);
1640     LocVT = MVT::i32;
1641   } else if (ValVT.isFloatingPoint() && !AllocateFloatsInIntReg) {
1642     // we are guaranteed to find an available float register
1643     if (ValVT == MVT::f32) {
1644       Reg = State.AllocateReg(F32Regs, FloatRegsSize);
1645       // Shadow int register
1646       State.AllocateReg(IntRegs, IntRegsSize);
1647     } else {
1648       Reg = State.AllocateReg(F64Regs, FloatRegsSize);
1649       // Shadow int registers
1650       unsigned Reg2 = State.AllocateReg(IntRegs, IntRegsSize);
1651       if (Reg2 == Mips::A1 || Reg2 == Mips::A3)
1652         State.AllocateReg(IntRegs, IntRegsSize);
1653       State.AllocateReg(IntRegs, IntRegsSize);
1654     }
1655   } else
1656     llvm_unreachable("Cannot handle this ValVT.");
1657
1658   unsigned SizeInBytes = ValVT.getSizeInBits() >> 3;
1659   unsigned Offset = State.AllocateStack(SizeInBytes, OrigAlign);
1660
1661   if (!Reg)
1662     State.addLoc(CCValAssign::getMem(ValNo, ValVT, Offset, LocVT, LocInfo));
1663   else
1664     State.addLoc(CCValAssign::getReg(ValNo, ValVT, Reg, LocVT, LocInfo));
1665
1666   return false; // CC must always match
1667 }
1668
1669 //===----------------------------------------------------------------------===//
1670 //                  Call Calling Convention Implementation
1671 //===----------------------------------------------------------------------===//
1672
1673 static const unsigned O32IntRegsSize = 4;
1674
1675 static const unsigned O32IntRegs[] = {
1676   Mips::A0, Mips::A1, Mips::A2, Mips::A3
1677 };
1678
1679 // Write ByVal Arg to arg registers and stack.
1680 static void
1681 WriteByValArg(SDValue& Chain, DebugLoc dl,
1682               SmallVector<std::pair<unsigned, SDValue>, 16>& RegsToPass,
1683               SmallVector<SDValue, 8>& MemOpChains, int& LastFI,
1684               MachineFrameInfo *MFI, SelectionDAG &DAG, SDValue Arg,
1685               const CCValAssign &VA, const ISD::ArgFlagsTy& Flags,
1686               MVT PtrType) {
1687   unsigned FirstWord = VA.getLocMemOffset() / 4;
1688   unsigned NumWords = (Flags.getByValSize() + 3) / 4;
1689   unsigned LastWord = FirstWord + NumWords;
1690   unsigned CurWord;
1691
1692   // copy the first 4 words of byval arg to registers A0 - A3
1693   for (CurWord = FirstWord; CurWord < std::min(LastWord, O32IntRegsSize);
1694        ++CurWord) {
1695     SDValue LoadPtr = DAG.getNode(ISD::ADD, dl, MVT::i32, Arg,
1696                                   DAG.getConstant((CurWord - FirstWord) * 4,
1697                                                   MVT::i32));
1698     SDValue LoadVal = DAG.getLoad(MVT::i32, dl, Chain, LoadPtr,
1699                                   MachinePointerInfo(),
1700                                   false, false, 0);
1701     MemOpChains.push_back(LoadVal.getValue(1));
1702     unsigned DstReg = O32IntRegs[CurWord];
1703     RegsToPass.push_back(std::make_pair(DstReg, LoadVal));
1704   }
1705
1706   // copy remaining part of byval arg to stack.
1707   if (CurWord < LastWord) {
1708     unsigned SizeInBytes = (LastWord - CurWord) * 4;
1709     SDValue Src = DAG.getNode(ISD::ADD, dl, MVT::i32, Arg,
1710                               DAG.getConstant((CurWord - FirstWord) * 4,
1711                                               MVT::i32));
1712     LastFI = MFI->CreateFixedObject(SizeInBytes, CurWord * 4, true);
1713     SDValue Dst = DAG.getFrameIndex(LastFI, PtrType);
1714     Chain = DAG.getMemcpy(Chain, dl, Dst, Src,
1715                           DAG.getConstant(SizeInBytes, MVT::i32),
1716                           /*Align*/4,
1717                           /*isVolatile=*/false, /*AlwaysInline=*/false,
1718                           MachinePointerInfo(0), MachinePointerInfo(0));
1719     MemOpChains.push_back(Chain);
1720   }
1721 }
1722
1723 /// LowerCall - functions arguments are copied from virtual regs to
1724 /// (physical regs)/(stack frame), CALLSEQ_START and CALLSEQ_END are emitted.
1725 /// TODO: isTailCall.
1726 SDValue
1727 MipsTargetLowering::LowerCall(SDValue Chain, SDValue Callee,
1728                               CallingConv::ID CallConv, bool isVarArg,
1729                               bool &isTailCall,
1730                               const SmallVectorImpl<ISD::OutputArg> &Outs,
1731                               const SmallVectorImpl<SDValue> &OutVals,
1732                               const SmallVectorImpl<ISD::InputArg> &Ins,
1733                               DebugLoc dl, SelectionDAG &DAG,
1734                               SmallVectorImpl<SDValue> &InVals) const {
1735   // MIPs target does not yet support tail call optimization.
1736   isTailCall = false;
1737
1738   MachineFunction &MF = DAG.getMachineFunction();
1739   MachineFrameInfo *MFI = MF.getFrameInfo();
1740   const TargetFrameLowering *TFL = MF.getTarget().getFrameLowering();
1741   bool IsPIC = getTargetMachine().getRelocationModel() == Reloc::PIC_;
1742   MipsFunctionInfo *MipsFI = MF.getInfo<MipsFunctionInfo>();
1743
1744   // Analyze operands of the call, assigning locations to each operand.
1745   SmallVector<CCValAssign, 16> ArgLocs;
1746   CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(),
1747                  getTargetMachine(), ArgLocs, *DAG.getContext());
1748
1749   if (Subtarget->isABI_O32())
1750     CCInfo.AnalyzeCallOperands(Outs, CC_MipsO32);
1751   else
1752     CCInfo.AnalyzeCallOperands(Outs, CC_Mips);
1753
1754   // Get a count of how many bytes are to be pushed on the stack.
1755   unsigned NextStackOffset = CCInfo.getNextStackOffset();
1756
1757   Chain = DAG.getCALLSEQ_START(Chain, DAG.getIntPtrConstant(NextStackOffset,
1758                                                             true));
1759
1760   // If this is the first call, create a stack frame object that points to
1761   // a location to which .cprestore saves $gp.
1762   if (IsPIC && !MipsFI->getGPFI())
1763     MipsFI->setGPFI(MFI->CreateFixedObject(4, 0, true));
1764
1765   // Get the frame index of the stack frame object that points to the location
1766   // of dynamically allocated area on the stack.
1767   int DynAllocFI = MipsFI->getDynAllocFI();
1768
1769   // Update size of the maximum argument space.
1770   // For O32, a minimum of four words (16 bytes) of argument space is
1771   // allocated.
1772   if (Subtarget->isABI_O32())
1773     NextStackOffset = std::max(NextStackOffset, (unsigned)16);
1774
1775   unsigned MaxCallFrameSize = MipsFI->getMaxCallFrameSize();
1776
1777   if (MaxCallFrameSize < NextStackOffset) {
1778     MipsFI->setMaxCallFrameSize(NextStackOffset);
1779
1780     // Set the offsets relative to $sp of the $gp restore slot and dynamically
1781     // allocated stack space. These offsets must be aligned to a boundary
1782     // determined by the stack alignment of the ABI.
1783     unsigned StackAlignment = TFL->getStackAlignment();
1784     NextStackOffset = (NextStackOffset + StackAlignment - 1) /
1785                       StackAlignment * StackAlignment;
1786
1787     if (IsPIC)
1788       MFI->setObjectOffset(MipsFI->getGPFI(), NextStackOffset);
1789
1790     MFI->setObjectOffset(DynAllocFI, NextStackOffset);
1791   }
1792
1793   // With EABI is it possible to have 16 args on registers.
1794   SmallVector<std::pair<unsigned, SDValue>, 16> RegsToPass;
1795   SmallVector<SDValue, 8> MemOpChains;
1796
1797   int FirstFI = -MFI->getNumFixedObjects() - 1, LastFI = 0;
1798
1799   // Walk the register/memloc assignments, inserting copies/loads.
1800   for (unsigned i = 0, e = ArgLocs.size(); i != e; ++i) {
1801     SDValue Arg = OutVals[i];
1802     CCValAssign &VA = ArgLocs[i];
1803
1804     // Promote the value if needed.
1805     switch (VA.getLocInfo()) {
1806     default: llvm_unreachable("Unknown loc info!");
1807     case CCValAssign::Full:
1808       if (Subtarget->isABI_O32() && VA.isRegLoc()) {
1809         if (VA.getValVT() == MVT::f32 && VA.getLocVT() == MVT::i32)
1810           Arg = DAG.getNode(ISD::BITCAST, dl, MVT::i32, Arg);
1811         if (VA.getValVT() == MVT::f64 && VA.getLocVT() == MVT::i32) {
1812           SDValue Lo = DAG.getNode(MipsISD::ExtractElementF64, dl, MVT::i32,
1813                                    Arg, DAG.getConstant(0, MVT::i32));
1814           SDValue Hi = DAG.getNode(MipsISD::ExtractElementF64, dl, MVT::i32,
1815                                    Arg, DAG.getConstant(1, MVT::i32));
1816           if (!Subtarget->isLittle())
1817             std::swap(Lo, Hi);
1818           RegsToPass.push_back(std::make_pair(VA.getLocReg(), Lo));
1819           RegsToPass.push_back(std::make_pair(VA.getLocReg()+1, Hi));
1820           continue;
1821         }
1822       }
1823       break;
1824     case CCValAssign::SExt:
1825       Arg = DAG.getNode(ISD::SIGN_EXTEND, dl, VA.getLocVT(), Arg);
1826       break;
1827     case CCValAssign::ZExt:
1828       Arg = DAG.getNode(ISD::ZERO_EXTEND, dl, VA.getLocVT(), Arg);
1829       break;
1830     case CCValAssign::AExt:
1831       Arg = DAG.getNode(ISD::ANY_EXTEND, dl, VA.getLocVT(), Arg);
1832       break;
1833     }
1834
1835     // Arguments that can be passed on register must be kept at
1836     // RegsToPass vector
1837     if (VA.isRegLoc()) {
1838       RegsToPass.push_back(std::make_pair(VA.getLocReg(), Arg));
1839       continue;
1840     }
1841
1842     // Register can't get to this point...
1843     assert(VA.isMemLoc());
1844
1845     // ByVal Arg.
1846     ISD::ArgFlagsTy Flags = Outs[i].Flags;
1847     if (Flags.isByVal()) {
1848       assert(Subtarget->isABI_O32() &&
1849              "No support for ByVal args by ABIs other than O32 yet.");
1850       assert(Flags.getByValSize() &&
1851              "ByVal args of size 0 should have been ignored by front-end.");
1852       WriteByValArg(Chain, dl, RegsToPass, MemOpChains, LastFI, MFI, DAG, Arg,
1853                     VA, Flags, getPointerTy());
1854       continue;
1855     }
1856
1857     // Create the frame index object for this incoming parameter
1858     LastFI = MFI->CreateFixedObject(VA.getValVT().getSizeInBits()/8,
1859                                     VA.getLocMemOffset(), true);
1860     SDValue PtrOff = DAG.getFrameIndex(LastFI, getPointerTy());
1861
1862     // emit ISD::STORE whichs stores the
1863     // parameter value to a stack Location
1864     MemOpChains.push_back(DAG.getStore(Chain, dl, Arg, PtrOff,
1865                                        MachinePointerInfo(),
1866                                        false, false, 0));
1867   }
1868
1869   // Extend range of indices of frame objects for outgoing arguments that were
1870   // created during this function call. Skip this step if no such objects were
1871   // created.
1872   if (LastFI)
1873     MipsFI->extendOutArgFIRange(FirstFI, LastFI);
1874
1875   // Transform all store nodes into one single node because all store
1876   // nodes are independent of each other.
1877   if (!MemOpChains.empty())
1878     Chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other,
1879                         &MemOpChains[0], MemOpChains.size());
1880
1881   // If the callee is a GlobalAddress/ExternalSymbol node (quite common, every
1882   // direct call is) turn it into a TargetGlobalAddress/TargetExternalSymbol
1883   // node so that legalize doesn't hack it.
1884   unsigned char OpFlag = IsPIC ? MipsII::MO_GOT_CALL : MipsII::MO_NO_FLAG;
1885   bool LoadSymAddr = false;
1886   SDValue CalleeLo;
1887
1888   if (GlobalAddressSDNode *G = dyn_cast<GlobalAddressSDNode>(Callee)) {
1889     if (IsPIC && G->getGlobal()->hasInternalLinkage()) {
1890       Callee = DAG.getTargetGlobalAddress(G->getGlobal(), dl,
1891                                           getPointerTy(), 0,MipsII:: MO_GOT);
1892       CalleeLo = DAG.getTargetGlobalAddress(G->getGlobal(), dl, getPointerTy(),
1893                                             0, MipsII::MO_ABS_LO);
1894     } else {
1895       Callee = DAG.getTargetGlobalAddress(G->getGlobal(), dl,
1896                                           getPointerTy(), 0, OpFlag);
1897     }
1898
1899     LoadSymAddr = true;
1900   }
1901   else if (ExternalSymbolSDNode *S = dyn_cast<ExternalSymbolSDNode>(Callee)) {
1902     Callee = DAG.getTargetExternalSymbol(S->getSymbol(),
1903                                 getPointerTy(), OpFlag);
1904     LoadSymAddr = true;
1905   }
1906
1907   SDValue InFlag;
1908
1909   // Create nodes that load address of callee and copy it to T9
1910   if (IsPIC) {
1911     if (LoadSymAddr) {
1912       // Load callee address
1913       Callee = DAG.getNode(MipsISD::WrapperPIC, dl, MVT::i32, Callee);
1914       SDValue LoadValue = DAG.getLoad(MVT::i32, dl, DAG.getEntryNode(), Callee,
1915                                       MachinePointerInfo::getGOT(),
1916                                       false, false, 0);
1917
1918       // Use GOT+LO if callee has internal linkage.
1919       if (CalleeLo.getNode()) {
1920         SDValue Lo = DAG.getNode(MipsISD::Lo, dl, MVT::i32, CalleeLo);
1921         Callee = DAG.getNode(ISD::ADD, dl, MVT::i32, LoadValue, Lo);
1922       } else
1923         Callee = LoadValue;
1924     }
1925
1926     // copy to T9
1927     Chain = DAG.getCopyToReg(Chain, dl, Mips::T9, Callee, SDValue(0, 0));
1928     InFlag = Chain.getValue(1);
1929     Callee = DAG.getRegister(Mips::T9, MVT::i32);
1930   }
1931
1932   // Build a sequence of copy-to-reg nodes chained together with token
1933   // chain and flag operands which copy the outgoing args into registers.
1934   // The InFlag in necessary since all emitted instructions must be
1935   // stuck together.
1936   for (unsigned i = 0, e = RegsToPass.size(); i != e; ++i) {
1937     Chain = DAG.getCopyToReg(Chain, dl, RegsToPass[i].first,
1938                              RegsToPass[i].second, InFlag);
1939     InFlag = Chain.getValue(1);
1940   }
1941
1942   // MipsJmpLink = #chain, #target_address, #opt_in_flags...
1943   //             = Chain, Callee, Reg#1, Reg#2, ...
1944   //
1945   // Returns a chain & a flag for retval copy to use.
1946   SDVTList NodeTys = DAG.getVTList(MVT::Other, MVT::Glue);
1947   SmallVector<SDValue, 8> Ops;
1948   Ops.push_back(Chain);
1949   Ops.push_back(Callee);
1950
1951   // Add argument registers to the end of the list so that they are
1952   // known live into the call.
1953   for (unsigned i = 0, e = RegsToPass.size(); i != e; ++i)
1954     Ops.push_back(DAG.getRegister(RegsToPass[i].first,
1955                                   RegsToPass[i].second.getValueType()));
1956
1957   if (InFlag.getNode())
1958     Ops.push_back(InFlag);
1959
1960   Chain  = DAG.getNode(MipsISD::JmpLink, dl, NodeTys, &Ops[0], Ops.size());
1961   InFlag = Chain.getValue(1);
1962
1963   // Create the CALLSEQ_END node.
1964   Chain = DAG.getCALLSEQ_END(Chain,
1965                              DAG.getIntPtrConstant(NextStackOffset, true),
1966                              DAG.getIntPtrConstant(0, true), InFlag);
1967   InFlag = Chain.getValue(1);
1968
1969   // Handle result values, copying them out of physregs into vregs that we
1970   // return.
1971   return LowerCallResult(Chain, InFlag, CallConv, isVarArg,
1972                          Ins, dl, DAG, InVals);
1973 }
1974
1975 /// LowerCallResult - Lower the result values of a call into the
1976 /// appropriate copies out of appropriate physical registers.
1977 SDValue
1978 MipsTargetLowering::LowerCallResult(SDValue Chain, SDValue InFlag,
1979                                     CallingConv::ID CallConv, bool isVarArg,
1980                                     const SmallVectorImpl<ISD::InputArg> &Ins,
1981                                     DebugLoc dl, SelectionDAG &DAG,
1982                                     SmallVectorImpl<SDValue> &InVals) const {
1983   // Assign locations to each value returned by this call.
1984   SmallVector<CCValAssign, 16> RVLocs;
1985   CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(),
1986                  getTargetMachine(), RVLocs, *DAG.getContext());
1987
1988   CCInfo.AnalyzeCallResult(Ins, RetCC_Mips);
1989
1990   // Copy all of the result registers out of their specified physreg.
1991   for (unsigned i = 0; i != RVLocs.size(); ++i) {
1992     Chain = DAG.getCopyFromReg(Chain, dl, RVLocs[i].getLocReg(),
1993                                RVLocs[i].getValVT(), InFlag).getValue(1);
1994     InFlag = Chain.getValue(2);
1995     InVals.push_back(Chain.getValue(0));
1996   }
1997
1998   return Chain;
1999 }
2000
2001 //===----------------------------------------------------------------------===//
2002 //             Formal Arguments Calling Convention Implementation
2003 //===----------------------------------------------------------------------===//
2004 static void ReadByValArg(MachineFunction &MF, SDValue Chain, DebugLoc dl,
2005                          std::vector<SDValue>& OutChains,
2006                          SelectionDAG &DAG, unsigned NumWords, SDValue FIN,
2007                          const CCValAssign &VA, const ISD::ArgFlagsTy& Flags) {
2008   unsigned LocMem = VA.getLocMemOffset();
2009   unsigned FirstWord = LocMem / 4;
2010
2011   // copy register A0 - A3 to frame object
2012   for (unsigned i = 0; i < NumWords; ++i) {
2013     unsigned CurWord = FirstWord + i;
2014     if (CurWord >= O32IntRegsSize)
2015       break;
2016
2017     unsigned SrcReg = O32IntRegs[CurWord];
2018     unsigned Reg = AddLiveIn(MF, SrcReg, Mips::CPURegsRegisterClass);
2019     SDValue StorePtr = DAG.getNode(ISD::ADD, dl, MVT::i32, FIN,
2020                                    DAG.getConstant(i * 4, MVT::i32));
2021     SDValue Store = DAG.getStore(Chain, dl, DAG.getRegister(Reg, MVT::i32),
2022                                  StorePtr, MachinePointerInfo(), false,
2023                                  false, 0);
2024     OutChains.push_back(Store);
2025   }
2026 }
2027
2028 /// LowerFormalArguments - transform physical registers into virtual registers
2029 /// and generate load operations for arguments places on the stack.
2030 SDValue
2031 MipsTargetLowering::LowerFormalArguments(SDValue Chain,
2032                                          CallingConv::ID CallConv,
2033                                          bool isVarArg,
2034                                          const SmallVectorImpl<ISD::InputArg>
2035                                          &Ins,
2036                                          DebugLoc dl, SelectionDAG &DAG,
2037                                          SmallVectorImpl<SDValue> &InVals)
2038                                           const {
2039   MachineFunction &MF = DAG.getMachineFunction();
2040   MachineFrameInfo *MFI = MF.getFrameInfo();
2041   MipsFunctionInfo *MipsFI = MF.getInfo<MipsFunctionInfo>();
2042
2043   MipsFI->setVarArgsFrameIndex(0);
2044
2045   // Used with vargs to acumulate store chains.
2046   std::vector<SDValue> OutChains;
2047
2048   // Assign locations to all of the incoming arguments.
2049   SmallVector<CCValAssign, 16> ArgLocs;
2050   CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(),
2051                  getTargetMachine(), ArgLocs, *DAG.getContext());
2052
2053   if (Subtarget->isABI_O32())
2054     CCInfo.AnalyzeFormalArguments(Ins, CC_MipsO32);
2055   else
2056     CCInfo.AnalyzeFormalArguments(Ins, CC_Mips);
2057
2058   int LastFI = 0;// MipsFI->LastInArgFI is 0 at the entry of this function.
2059
2060   for (unsigned i = 0, e = ArgLocs.size(); i != e; ++i) {
2061     CCValAssign &VA = ArgLocs[i];
2062
2063     // Arguments stored on registers
2064     if (VA.isRegLoc()) {
2065       EVT RegVT = VA.getLocVT();
2066       unsigned ArgReg = VA.getLocReg();
2067       TargetRegisterClass *RC = 0;
2068
2069       if (RegVT == MVT::i32)
2070         RC = Mips::CPURegsRegisterClass;
2071       else if (RegVT == MVT::f32)
2072         RC = Mips::FGR32RegisterClass;
2073       else if (RegVT == MVT::f64) {
2074         if (!Subtarget->isSingleFloat())
2075           RC = Mips::AFGR64RegisterClass;
2076       } else
2077         llvm_unreachable("RegVT not supported by FormalArguments Lowering");
2078
2079       // Transform the arguments stored on
2080       // physical registers into virtual ones
2081       unsigned Reg = AddLiveIn(DAG.getMachineFunction(), ArgReg, RC);
2082       SDValue ArgValue = DAG.getCopyFromReg(Chain, dl, Reg, RegVT);
2083
2084       // If this is an 8 or 16-bit value, it has been passed promoted
2085       // to 32 bits.  Insert an assert[sz]ext to capture this, then
2086       // truncate to the right size.
2087       if (VA.getLocInfo() != CCValAssign::Full) {
2088         unsigned Opcode = 0;
2089         if (VA.getLocInfo() == CCValAssign::SExt)
2090           Opcode = ISD::AssertSext;
2091         else if (VA.getLocInfo() == CCValAssign::ZExt)
2092           Opcode = ISD::AssertZext;
2093         if (Opcode)
2094           ArgValue = DAG.getNode(Opcode, dl, RegVT, ArgValue,
2095                                  DAG.getValueType(VA.getValVT()));
2096         ArgValue = DAG.getNode(ISD::TRUNCATE, dl, VA.getValVT(), ArgValue);
2097       }
2098
2099       // Handle O32 ABI cases: i32->f32 and (i32,i32)->f64
2100       if (Subtarget->isABI_O32()) {
2101         if (RegVT == MVT::i32 && VA.getValVT() == MVT::f32)
2102           ArgValue = DAG.getNode(ISD::BITCAST, dl, MVT::f32, ArgValue);
2103         if (RegVT == MVT::i32 && VA.getValVT() == MVT::f64) {
2104           unsigned Reg2 = AddLiveIn(DAG.getMachineFunction(),
2105                                     VA.getLocReg()+1, RC);
2106           SDValue ArgValue2 = DAG.getCopyFromReg(Chain, dl, Reg2, RegVT);
2107           if (!Subtarget->isLittle())
2108             std::swap(ArgValue, ArgValue2);
2109           ArgValue = DAG.getNode(MipsISD::BuildPairF64, dl, MVT::f64,
2110                                  ArgValue, ArgValue2);
2111         }
2112       }
2113
2114       InVals.push_back(ArgValue);
2115     } else { // VA.isRegLoc()
2116
2117       // sanity check
2118       assert(VA.isMemLoc());
2119
2120       ISD::ArgFlagsTy Flags = Ins[i].Flags;
2121
2122       if (Flags.isByVal()) {
2123         assert(Subtarget->isABI_O32() &&
2124                "No support for ByVal args by ABIs other than O32 yet.");
2125         assert(Flags.getByValSize() &&
2126                "ByVal args of size 0 should have been ignored by front-end.");
2127         unsigned NumWords = (Flags.getByValSize() + 3) / 4;
2128         LastFI = MFI->CreateFixedObject(NumWords * 4, VA.getLocMemOffset(),
2129                                         true);
2130         SDValue FIN = DAG.getFrameIndex(LastFI, getPointerTy());
2131         InVals.push_back(FIN);
2132         ReadByValArg(MF, Chain, dl, OutChains, DAG, NumWords, FIN, VA, Flags);
2133
2134         continue;
2135       }
2136
2137       // The stack pointer offset is relative to the caller stack frame.
2138       LastFI = MFI->CreateFixedObject(VA.getValVT().getSizeInBits()/8,
2139                                       VA.getLocMemOffset(), true);
2140
2141       // Create load nodes to retrieve arguments from the stack
2142       SDValue FIN = DAG.getFrameIndex(LastFI, getPointerTy());
2143       InVals.push_back(DAG.getLoad(VA.getValVT(), dl, Chain, FIN,
2144                                    MachinePointerInfo::getFixedStack(LastFI),
2145                                    false, false, 0));
2146     }
2147   }
2148
2149   // The mips ABIs for returning structs by value requires that we copy
2150   // the sret argument into $v0 for the return. Save the argument into
2151   // a virtual register so that we can access it from the return points.
2152   if (DAG.getMachineFunction().getFunction()->hasStructRetAttr()) {
2153     unsigned Reg = MipsFI->getSRetReturnReg();
2154     if (!Reg) {
2155       Reg = MF.getRegInfo().createVirtualRegister(getRegClassFor(MVT::i32));
2156       MipsFI->setSRetReturnReg(Reg);
2157     }
2158     SDValue Copy = DAG.getCopyToReg(DAG.getEntryNode(), dl, Reg, InVals[0]);
2159     Chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other, Copy, Chain);
2160   }
2161
2162   if (isVarArg && Subtarget->isABI_O32()) {
2163     // Record the frame index of the first variable argument
2164     // which is a value necessary to VASTART.
2165     unsigned NextStackOffset = CCInfo.getNextStackOffset();
2166     assert(NextStackOffset % 4 == 0 &&
2167            "NextStackOffset must be aligned to 4-byte boundaries.");
2168     LastFI = MFI->CreateFixedObject(4, NextStackOffset, true);
2169     MipsFI->setVarArgsFrameIndex(LastFI);
2170
2171     // If NextStackOffset is smaller than o32's 16-byte reserved argument area,
2172     // copy the integer registers that have not been used for argument passing
2173     // to the caller's stack frame.
2174     for (; NextStackOffset < 16; NextStackOffset += 4) {
2175       TargetRegisterClass *RC = Mips::CPURegsRegisterClass;
2176       unsigned Idx = NextStackOffset / 4;
2177       unsigned Reg = AddLiveIn(DAG.getMachineFunction(), O32IntRegs[Idx], RC);
2178       SDValue ArgValue = DAG.getCopyFromReg(Chain, dl, Reg, MVT::i32);
2179       LastFI = MFI->CreateFixedObject(4, NextStackOffset, true);
2180       SDValue PtrOff = DAG.getFrameIndex(LastFI, getPointerTy());
2181       OutChains.push_back(DAG.getStore(Chain, dl, ArgValue, PtrOff,
2182                                        MachinePointerInfo(),
2183                                        false, false, 0));
2184     }
2185   }
2186
2187   MipsFI->setLastInArgFI(LastFI);
2188
2189   // All stores are grouped in one node to allow the matching between
2190   // the size of Ins and InVals. This only happens when on varg functions
2191   if (!OutChains.empty()) {
2192     OutChains.push_back(Chain);
2193     Chain = DAG.getNode(ISD::TokenFactor, dl, MVT::Other,
2194                         &OutChains[0], OutChains.size());
2195   }
2196
2197   return Chain;
2198 }
2199
2200 //===----------------------------------------------------------------------===//
2201 //               Return Value Calling Convention Implementation
2202 //===----------------------------------------------------------------------===//
2203
2204 SDValue
2205 MipsTargetLowering::LowerReturn(SDValue Chain,
2206                                 CallingConv::ID CallConv, bool isVarArg,
2207                                 const SmallVectorImpl<ISD::OutputArg> &Outs,
2208                                 const SmallVectorImpl<SDValue> &OutVals,
2209                                 DebugLoc dl, SelectionDAG &DAG) const {
2210
2211   // CCValAssign - represent the assignment of
2212   // the return value to a location
2213   SmallVector<CCValAssign, 16> RVLocs;
2214
2215   // CCState - Info about the registers and stack slot.
2216   CCState CCInfo(CallConv, isVarArg, DAG.getMachineFunction(),
2217                  getTargetMachine(), RVLocs, *DAG.getContext());
2218
2219   // Analize return values.
2220   CCInfo.AnalyzeReturn(Outs, RetCC_Mips);
2221
2222   // If this is the first return lowered for this function, add
2223   // the regs to the liveout set for the function.
2224   if (DAG.getMachineFunction().getRegInfo().liveout_empty()) {
2225     for (unsigned i = 0; i != RVLocs.size(); ++i)
2226       if (RVLocs[i].isRegLoc())
2227         DAG.getMachineFunction().getRegInfo().addLiveOut(RVLocs[i].getLocReg());
2228   }
2229
2230   SDValue Flag;
2231
2232   // Copy the result values into the output registers.
2233   for (unsigned i = 0; i != RVLocs.size(); ++i) {
2234     CCValAssign &VA = RVLocs[i];
2235     assert(VA.isRegLoc() && "Can only return in registers!");
2236
2237     Chain = DAG.getCopyToReg(Chain, dl, VA.getLocReg(),
2238                              OutVals[i], Flag);
2239
2240     // guarantee that all emitted copies are
2241     // stuck together, avoiding something bad
2242     Flag = Chain.getValue(1);
2243   }
2244
2245   // The mips ABIs for returning structs by value requires that we copy
2246   // the sret argument into $v0 for the return. We saved the argument into
2247   // a virtual register in the entry block, so now we copy the value out
2248   // and into $v0.
2249   if (DAG.getMachineFunction().getFunction()->hasStructRetAttr()) {
2250     MachineFunction &MF      = DAG.getMachineFunction();
2251     MipsFunctionInfo *MipsFI = MF.getInfo<MipsFunctionInfo>();
2252     unsigned Reg = MipsFI->getSRetReturnReg();
2253
2254     if (!Reg)
2255       llvm_unreachable("sret virtual register not created in the entry block");
2256     SDValue Val = DAG.getCopyFromReg(Chain, dl, Reg, getPointerTy());
2257
2258     Chain = DAG.getCopyToReg(Chain, dl, Mips::V0, Val, Flag);
2259     Flag = Chain.getValue(1);
2260   }
2261
2262   // Return on Mips is always a "jr $ra"
2263   if (Flag.getNode())
2264     return DAG.getNode(MipsISD::Ret, dl, MVT::Other,
2265                        Chain, DAG.getRegister(Mips::RA, MVT::i32), Flag);
2266   else // Return Void
2267     return DAG.getNode(MipsISD::Ret, dl, MVT::Other,
2268                        Chain, DAG.getRegister(Mips::RA, MVT::i32));
2269 }
2270
2271 //===----------------------------------------------------------------------===//
2272 //                           Mips Inline Assembly Support
2273 //===----------------------------------------------------------------------===//
2274
2275 /// getConstraintType - Given a constraint letter, return the type of
2276 /// constraint it is for this target.
2277 MipsTargetLowering::ConstraintType MipsTargetLowering::
2278 getConstraintType(const std::string &Constraint) const
2279 {
2280   // Mips specific constrainy
2281   // GCC config/mips/constraints.md
2282   //
2283   // 'd' : An address register. Equivalent to r
2284   //       unless generating MIPS16 code.
2285   // 'y' : Equivalent to r; retained for
2286   //       backwards compatibility.
2287   // 'f' : Floating Point registers.
2288   if (Constraint.size() == 1) {
2289     switch (Constraint[0]) {
2290       default : break;
2291       case 'd':
2292       case 'y':
2293       case 'f':
2294         return C_RegisterClass;
2295         break;
2296     }
2297   }
2298   return TargetLowering::getConstraintType(Constraint);
2299 }
2300
2301 /// Examine constraint type and operand type and determine a weight value.
2302 /// This object must already have been set up with the operand type
2303 /// and the current alternative constraint selected.
2304 TargetLowering::ConstraintWeight
2305 MipsTargetLowering::getSingleConstraintMatchWeight(
2306     AsmOperandInfo &info, const char *constraint) const {
2307   ConstraintWeight weight = CW_Invalid;
2308   Value *CallOperandVal = info.CallOperandVal;
2309     // If we don't have a value, we can't do a match,
2310     // but allow it at the lowest weight.
2311   if (CallOperandVal == NULL)
2312     return CW_Default;
2313   const Type *type = CallOperandVal->getType();
2314   // Look at the constraint type.
2315   switch (*constraint) {
2316   default:
2317     weight = TargetLowering::getSingleConstraintMatchWeight(info, constraint);
2318     break;
2319   case 'd':
2320   case 'y':
2321     if (type->isIntegerTy())
2322       weight = CW_Register;
2323     break;
2324   case 'f':
2325     if (type->isFloatTy())
2326       weight = CW_Register;
2327     break;
2328   }
2329   return weight;
2330 }
2331
2332 /// Given a register class constraint, like 'r', if this corresponds directly
2333 /// to an LLVM register class, return a register of 0 and the register class
2334 /// pointer.
2335 std::pair<unsigned, const TargetRegisterClass*> MipsTargetLowering::
2336 getRegForInlineAsmConstraint(const std::string &Constraint, EVT VT) const
2337 {
2338   if (Constraint.size() == 1) {
2339     switch (Constraint[0]) {
2340     case 'd': // Address register. Same as 'r' unless generating MIPS16 code.
2341     case 'y': // Same as 'r'. Exists for compatibility.
2342     case 'r':
2343       return std::make_pair(0U, Mips::CPURegsRegisterClass);
2344     case 'f':
2345       if (VT == MVT::f32)
2346         return std::make_pair(0U, Mips::FGR32RegisterClass);
2347       if (VT == MVT::f64)
2348         if ((!Subtarget->isSingleFloat()) && (!Subtarget->isFP64bit()))
2349           return std::make_pair(0U, Mips::AFGR64RegisterClass);
2350       break;
2351     }
2352   }
2353   return TargetLowering::getRegForInlineAsmConstraint(Constraint, VT);
2354 }
2355
2356 bool
2357 MipsTargetLowering::isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const {
2358   // The Mips target isn't yet aware of offsets.
2359   return false;
2360 }
2361
2362 bool MipsTargetLowering::isFPImmLegal(const APFloat &Imm, EVT VT) const {
2363   if (VT != MVT::f32 && VT != MVT::f64)
2364     return false;
2365   if (Imm.isNegZero())
2366     return false;
2367   return Imm.isZero();
2368 }