Add ScheduleDAG support for copytoreg where the src/dst register are
[oota-llvm.git] / lib / CodeGen / SelectionDAG / ScheduleDAG.cpp
1 //===---- ScheduleDAG.cpp - Implement the ScheduleDAG class ---------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This implements a simple two pass scheduler.  The first pass attempts to push
11 // backward any lengthy instructions and critical paths.  The second pass packs
12 // instructions into semi-optimal time slots.
13 //
14 //===----------------------------------------------------------------------===//
15
16 #define DEBUG_TYPE "pre-RA-sched"
17 #include "llvm/Constants.h"
18 #include "llvm/Type.h"
19 #include "llvm/CodeGen/ScheduleDAG.h"
20 #include "llvm/CodeGen/MachineConstantPool.h"
21 #include "llvm/CodeGen/MachineFunction.h"
22 #include "llvm/CodeGen/MachineRegisterInfo.h"
23 #include "llvm/Target/TargetData.h"
24 #include "llvm/Target/TargetMachine.h"
25 #include "llvm/Target/TargetInstrInfo.h"
26 #include "llvm/Target/TargetLowering.h"
27 #include "llvm/ADT/Statistic.h"
28 #include "llvm/Support/Debug.h"
29 #include "llvm/Support/MathExtras.h"
30 using namespace llvm;
31
32 STATISTIC(NumCommutes,   "Number of instructions commuted");
33
34 ScheduleDAG::ScheduleDAG(SelectionDAG &dag, MachineBasicBlock *bb,
35                          const TargetMachine &tm)
36   : DAG(dag), BB(bb), TM(tm), RegInfo(BB->getParent()->getRegInfo()) {
37     TII = TM.getInstrInfo();
38     MF  = &DAG.getMachineFunction();
39     TRI = TM.getRegisterInfo();
40     ConstPool = BB->getParent()->getConstantPool();
41 }
42
43 /// CheckForPhysRegDependency - Check if the dependency between def and use of
44 /// a specified operand is a physical register dependency. If so, returns the
45 /// register and the cost of copying the register.
46 static void CheckForPhysRegDependency(SDNode *Def, SDNode *Use, unsigned Op,
47                                       const TargetRegisterInfo *TRI, 
48                                       const TargetInstrInfo *TII,
49                                       unsigned &PhysReg, int &Cost) {
50   if (Op != 2 || Use->getOpcode() != ISD::CopyToReg)
51     return;
52
53   unsigned Reg = cast<RegisterSDNode>(Use->getOperand(1))->getReg();
54   if (TargetRegisterInfo::isVirtualRegister(Reg))
55     return;
56
57   unsigned ResNo = Use->getOperand(2).ResNo;
58   if (Def->isTargetOpcode()) {
59     const TargetInstrDesc &II = TII->get(Def->getTargetOpcode());
60     if (ResNo >= II.getNumDefs() &&
61         II.ImplicitDefs[ResNo - II.getNumDefs()] == Reg) {
62       PhysReg = Reg;
63       const TargetRegisterClass *RC =
64         TRI->getPhysicalRegisterRegClass(Def->getValueType(ResNo), Reg);
65       Cost = RC->getCopyCost();
66     }
67   }
68 }
69
70 SUnit *ScheduleDAG::Clone(SUnit *Old) {
71   SUnit *SU = NewSUnit(Old->Node);
72   for (unsigned i = 0, e = SU->FlaggedNodes.size(); i != e; ++i)
73     SU->FlaggedNodes.push_back(SU->FlaggedNodes[i]);
74   SU->InstanceNo = SUnitMap[Old->Node].size();
75   SU->Latency = Old->Latency;
76   SU->isTwoAddress = Old->isTwoAddress;
77   SU->isCommutable = Old->isCommutable;
78   SU->hasPhysRegDefs = Old->hasPhysRegDefs;
79   SUnitMap[Old->Node].push_back(SU);
80   return SU;
81 }
82
83
84 /// BuildSchedUnits - Build SUnits from the selection dag that we are input.
85 /// This SUnit graph is similar to the SelectionDAG, but represents flagged
86 /// together nodes with a single SUnit.
87 void ScheduleDAG::BuildSchedUnits() {
88   // Reserve entries in the vector for each of the SUnits we are creating.  This
89   // ensure that reallocation of the vector won't happen, so SUnit*'s won't get
90   // invalidated.
91   SUnits.reserve(std::distance(DAG.allnodes_begin(), DAG.allnodes_end()));
92   
93   for (SelectionDAG::allnodes_iterator NI = DAG.allnodes_begin(),
94        E = DAG.allnodes_end(); NI != E; ++NI) {
95     if (isPassiveNode(NI))  // Leaf node, e.g. a TargetImmediate.
96       continue;
97     
98     // If this node has already been processed, stop now.
99     if (SUnitMap[NI].size()) continue;
100     
101     SUnit *NodeSUnit = NewSUnit(NI);
102     
103     // See if anything is flagged to this node, if so, add them to flagged
104     // nodes.  Nodes can have at most one flag input and one flag output.  Flags
105     // are required the be the last operand and result of a node.
106     
107     // Scan up, adding flagged preds to FlaggedNodes.
108     SDNode *N = NI;
109     if (N->getNumOperands() &&
110         N->getOperand(N->getNumOperands()-1).getValueType() == MVT::Flag) {
111       do {
112         N = N->getOperand(N->getNumOperands()-1).Val;
113         NodeSUnit->FlaggedNodes.push_back(N);
114         SUnitMap[N].push_back(NodeSUnit);
115       } while (N->getNumOperands() &&
116                N->getOperand(N->getNumOperands()-1).getValueType()== MVT::Flag);
117       std::reverse(NodeSUnit->FlaggedNodes.begin(),
118                    NodeSUnit->FlaggedNodes.end());
119     }
120     
121     // Scan down, adding this node and any flagged succs to FlaggedNodes if they
122     // have a user of the flag operand.
123     N = NI;
124     while (N->getValueType(N->getNumValues()-1) == MVT::Flag) {
125       SDOperand FlagVal(N, N->getNumValues()-1);
126       
127       // There are either zero or one users of the Flag result.
128       bool HasFlagUse = false;
129       for (SDNode::use_iterator UI = N->use_begin(), E = N->use_end(); 
130            UI != E; ++UI)
131         if (FlagVal.isOperandOf(*UI)) {
132           HasFlagUse = true;
133           NodeSUnit->FlaggedNodes.push_back(N);
134           SUnitMap[N].push_back(NodeSUnit);
135           N = *UI;
136           break;
137         }
138       if (!HasFlagUse) break;
139     }
140     
141     // Now all flagged nodes are in FlaggedNodes and N is the bottom-most node.
142     // Update the SUnit
143     NodeSUnit->Node = N;
144     SUnitMap[N].push_back(NodeSUnit);
145
146     ComputeLatency(NodeSUnit);
147   }
148   
149   // Pass 2: add the preds, succs, etc.
150   for (unsigned su = 0, e = SUnits.size(); su != e; ++su) {
151     SUnit *SU = &SUnits[su];
152     SDNode *MainNode = SU->Node;
153     
154     if (MainNode->isTargetOpcode()) {
155       unsigned Opc = MainNode->getTargetOpcode();
156       const TargetInstrDesc &TID = TII->get(Opc);
157       for (unsigned i = 0; i != TID.getNumOperands(); ++i) {
158         if (TID.getOperandConstraint(i, TOI::TIED_TO) != -1) {
159           SU->isTwoAddress = true;
160           break;
161         }
162       }
163       if (TID.isCommutable())
164         SU->isCommutable = true;
165     }
166     
167     // Find all predecessors and successors of the group.
168     // Temporarily add N to make code simpler.
169     SU->FlaggedNodes.push_back(MainNode);
170     
171     for (unsigned n = 0, e = SU->FlaggedNodes.size(); n != e; ++n) {
172       SDNode *N = SU->FlaggedNodes[n];
173       if (N->isTargetOpcode() &&
174           TII->get(N->getTargetOpcode()).getImplicitDefs() &&
175           CountResults(N) > TII->get(N->getTargetOpcode()).getNumDefs())
176         SU->hasPhysRegDefs = true;
177       
178       for (unsigned i = 0, e = N->getNumOperands(); i != e; ++i) {
179         SDNode *OpN = N->getOperand(i).Val;
180         if (isPassiveNode(OpN)) continue;   // Not scheduled.
181         SUnit *OpSU = SUnitMap[OpN].front();
182         assert(OpSU && "Node has no SUnit!");
183         if (OpSU == SU) continue;           // In the same group.
184
185         MVT::ValueType OpVT = N->getOperand(i).getValueType();
186         assert(OpVT != MVT::Flag && "Flagged nodes should be in same sunit!");
187         bool isChain = OpVT == MVT::Other;
188
189         unsigned PhysReg = 0;
190         int Cost = 1;
191         // Determine if this is a physical register dependency.
192         CheckForPhysRegDependency(OpN, N, i, TRI, TII, PhysReg, Cost);
193         SU->addPred(OpSU, isChain, false, PhysReg, Cost);
194       }
195     }
196     
197     // Remove MainNode from FlaggedNodes again.
198     SU->FlaggedNodes.pop_back();
199   }
200   
201   return;
202 }
203
204 void ScheduleDAG::ComputeLatency(SUnit *SU) {
205   const InstrItineraryData &InstrItins = TM.getInstrItineraryData();
206   
207   // Compute the latency for the node.  We use the sum of the latencies for
208   // all nodes flagged together into this SUnit.
209   if (InstrItins.isEmpty()) {
210     // No latency information.
211     SU->Latency = 1;
212   } else {
213     SU->Latency = 0;
214     if (SU->Node->isTargetOpcode()) {
215       unsigned SchedClass =
216         TII->get(SU->Node->getTargetOpcode()).getSchedClass();
217       InstrStage *S = InstrItins.begin(SchedClass);
218       InstrStage *E = InstrItins.end(SchedClass);
219       for (; S != E; ++S)
220         SU->Latency += S->Cycles;
221     }
222     for (unsigned i = 0, e = SU->FlaggedNodes.size(); i != e; ++i) {
223       SDNode *FNode = SU->FlaggedNodes[i];
224       if (FNode->isTargetOpcode()) {
225         unsigned SchedClass =TII->get(FNode->getTargetOpcode()).getSchedClass();
226         InstrStage *S = InstrItins.begin(SchedClass);
227         InstrStage *E = InstrItins.end(SchedClass);
228         for (; S != E; ++S)
229           SU->Latency += S->Cycles;
230       }
231     }
232   }
233 }
234
235 /// CalculateDepths - compute depths using algorithms for the longest
236 /// paths in the DAG
237 void ScheduleDAG::CalculateDepths() {
238   unsigned DAGSize = SUnits.size();
239   std::vector<unsigned> InDegree(DAGSize);
240   std::vector<SUnit*> WorkList;
241   WorkList.reserve(DAGSize);
242
243   // Initialize the data structures
244   for (unsigned i = 0, e = DAGSize; i != e; ++i) {
245     SUnit *SU = &SUnits[i];
246     int NodeNum = SU->NodeNum;
247     unsigned Degree = SU->Preds.size();
248     InDegree[NodeNum] = Degree;
249     SU->Depth = 0;
250
251     // Is it a node without dependencies?
252     if (Degree == 0) {
253         assert(SU->Preds.empty() && "SUnit should have no predecessors");
254         // Collect leaf nodes
255         WorkList.push_back(SU);
256     }
257   }
258
259   // Process nodes in the topological order
260   while (!WorkList.empty()) {
261     SUnit *SU = WorkList.back();
262     WorkList.pop_back();
263     unsigned &SUDepth  = SU->Depth;
264
265     // Use dynamic programming:
266     // When current node is being processed, all of its dependencies
267     // are already processed.
268     // So, just iterate over all predecessors and take the longest path
269     for (SUnit::const_pred_iterator I = SU->Preds.begin(), E = SU->Preds.end();
270          I != E; ++I) {
271       unsigned PredDepth = I->Dep->Depth;
272       if (PredDepth+1 > SUDepth) {
273           SUDepth = PredDepth + 1;
274       }
275     }
276
277     // Update InDegrees of all nodes depending on current SUnit
278     for (SUnit::const_succ_iterator I = SU->Succs.begin(), E = SU->Succs.end();
279          I != E; ++I) {
280       SUnit *SU = I->Dep;
281       if (!--InDegree[SU->NodeNum])
282         // If all dependencies of the node are processed already,
283         // then the longest path for the node can be computed now
284         WorkList.push_back(SU);
285     }
286   }
287 }
288
289 /// CalculateHeights - compute heights using algorithms for the longest
290 /// paths in the DAG
291 void ScheduleDAG::CalculateHeights() {
292   unsigned DAGSize = SUnits.size();
293   std::vector<unsigned> InDegree(DAGSize);
294   std::vector<SUnit*> WorkList;
295   WorkList.reserve(DAGSize);
296
297   // Initialize the data structures
298   for (unsigned i = 0, e = DAGSize; i != e; ++i) {
299     SUnit *SU = &SUnits[i];
300     int NodeNum = SU->NodeNum;
301     unsigned Degree = SU->Succs.size();
302     InDegree[NodeNum] = Degree;
303     SU->Height = 0;
304
305     // Is it a node without dependencies?
306     if (Degree == 0) {
307         assert(SU->Succs.empty() && "Something wrong");
308         assert(WorkList.empty() && "Should be empty");
309         // Collect leaf nodes
310         WorkList.push_back(SU);
311     }
312   }
313
314   // Process nodes in the topological order
315   while (!WorkList.empty()) {
316     SUnit *SU = WorkList.back();
317     WorkList.pop_back();
318     unsigned &SUHeight  = SU->Height;
319
320     // Use dynamic programming:
321     // When current node is being processed, all of its dependencies
322     // are already processed.
323     // So, just iterate over all successors and take the longest path
324     for (SUnit::const_succ_iterator I = SU->Succs.begin(), E = SU->Succs.end();
325          I != E; ++I) {
326       unsigned SuccHeight = I->Dep->Height;
327       if (SuccHeight+1 > SUHeight) {
328           SUHeight = SuccHeight + 1;
329       }
330     }
331
332     // Update InDegrees of all nodes depending on current SUnit
333     for (SUnit::const_pred_iterator I = SU->Preds.begin(), E = SU->Preds.end();
334          I != E; ++I) {
335       SUnit *SU = I->Dep;
336       if (!--InDegree[SU->NodeNum])
337         // If all dependencies of the node are processed already,
338         // then the longest path for the node can be computed now
339         WorkList.push_back(SU);
340     }
341   }
342 }
343
344 /// CountResults - The results of target nodes have register or immediate
345 /// operands first, then an optional chain, and optional flag operands (which do
346 /// not go into the resulting MachineInstr).
347 unsigned ScheduleDAG::CountResults(SDNode *Node) {
348   unsigned N = Node->getNumValues();
349   while (N && Node->getValueType(N - 1) == MVT::Flag)
350     --N;
351   if (N && Node->getValueType(N - 1) == MVT::Other)
352     --N;    // Skip over chain result.
353   return N;
354 }
355
356 /// CountOperands - The inputs to target nodes have any actual inputs first,
357 /// followed by special operands that describe memory references, then an
358 /// optional chain operand, then flag operands.  Compute the number of
359 /// actual operands that will go into the resulting MachineInstr.
360 unsigned ScheduleDAG::CountOperands(SDNode *Node) {
361   unsigned N = ComputeMemOperandsEnd(Node);
362   while (N && isa<MemOperandSDNode>(Node->getOperand(N - 1).Val))
363     --N; // Ignore MemOperand nodes
364   return N;
365 }
366
367 /// ComputeMemOperandsEnd - Find the index one past the last MemOperandSDNode
368 /// operand
369 unsigned ScheduleDAG::ComputeMemOperandsEnd(SDNode *Node) {
370   unsigned N = Node->getNumOperands();
371   while (N && Node->getOperand(N - 1).getValueType() == MVT::Flag)
372     --N;
373   if (N && Node->getOperand(N - 1).getValueType() == MVT::Other)
374     --N; // Ignore chain if it exists.
375   return N;
376 }
377
378 static const TargetRegisterClass *getInstrOperandRegClass(
379         const TargetRegisterInfo *TRI, 
380         const TargetInstrInfo *TII,
381         const TargetInstrDesc &II,
382         unsigned Op) {
383   if (Op >= II.getNumOperands()) {
384     assert(II.isVariadic() && "Invalid operand # of instruction");
385     return NULL;
386   }
387   if (II.OpInfo[Op].isLookupPtrRegClass())
388     return TII->getPointerRegClass();
389   return TRI->getRegClass(II.OpInfo[Op].RegClass);
390 }
391
392 void ScheduleDAG::EmitCopyFromReg(SDNode *Node, unsigned ResNo,
393                                   unsigned InstanceNo, unsigned SrcReg,
394                                   DenseMap<SDOperand, unsigned> &VRBaseMap) {
395   unsigned VRBase = 0;
396   if (TargetRegisterInfo::isVirtualRegister(SrcReg)) {
397     // Just use the input register directly!
398     if (InstanceNo > 0)
399       VRBaseMap.erase(SDOperand(Node, ResNo));
400     bool isNew = VRBaseMap.insert(std::make_pair(SDOperand(Node,ResNo),SrcReg));
401     assert(isNew && "Node emitted out of order - early");
402     return;
403   }
404
405   // If the node is only used by a CopyToReg and the dest reg is a vreg, use
406   // the CopyToReg'd destination register instead of creating a new vreg.
407   bool MatchReg = true;
408   for (SDNode::use_iterator UI = Node->use_begin(), E = Node->use_end();
409        UI != E; ++UI) {
410     SDNode *Use = *UI;
411     bool Match = true;
412     if (Use->getOpcode() == ISD::CopyToReg && 
413         Use->getOperand(2).Val == Node &&
414         Use->getOperand(2).ResNo == ResNo) {
415       unsigned DestReg = cast<RegisterSDNode>(Use->getOperand(1))->getReg();
416       if (TargetRegisterInfo::isVirtualRegister(DestReg)) {
417         VRBase = DestReg;
418         Match = false;
419       } else if (DestReg != SrcReg)
420         Match = false;
421     } else {
422       for (unsigned i = 0, e = Use->getNumOperands(); i != e; ++i) {
423         SDOperand Op = Use->getOperand(i);
424         if (Op.Val != Node || Op.ResNo != ResNo)
425           continue;
426         MVT::ValueType VT = Node->getValueType(Op.ResNo);
427         if (VT != MVT::Other && VT != MVT::Flag)
428           Match = false;
429       }
430     }
431     MatchReg &= Match;
432     if (VRBase)
433       break;
434   }
435
436   const TargetRegisterClass *SrcRC = 0, *DstRC = 0;
437   SrcRC = TRI->getPhysicalRegisterRegClass(Node->getValueType(ResNo), SrcReg);
438   
439   // Figure out the register class to create for the destreg.
440   if (VRBase) {
441     DstRC = RegInfo.getRegClass(VRBase);
442   } else {
443     DstRC = DAG.getTargetLoweringInfo()
444              .getRegClassFor(Node->getValueType(ResNo));
445   }
446     
447   // If all uses are reading from the src physical register and copying the
448   // register is either impossible or very expensive, then don't create a copy.
449   if (MatchReg && SrcRC->getCopyCost() < 0) {
450     VRBase = SrcReg;
451   } else {
452     // Create the reg, emit the copy.
453     VRBase = RegInfo.createVirtualRegister(DstRC);
454     TII->copyRegToReg(*BB, BB->end(), VRBase, SrcReg, DstRC, SrcRC);
455   }
456
457   if (InstanceNo > 0)
458     VRBaseMap.erase(SDOperand(Node, ResNo));
459   bool isNew = VRBaseMap.insert(std::make_pair(SDOperand(Node,ResNo), VRBase));
460   assert(isNew && "Node emitted out of order - early");
461 }
462
463 void ScheduleDAG::CreateVirtualRegisters(SDNode *Node,
464                                          MachineInstr *MI,
465                                          const TargetInstrDesc &II,
466                                      DenseMap<SDOperand, unsigned> &VRBaseMap) {
467   for (unsigned i = 0; i < II.getNumDefs(); ++i) {
468     // If the specific node value is only used by a CopyToReg and the dest reg
469     // is a vreg, use the CopyToReg'd destination register instead of creating
470     // a new vreg.
471     unsigned VRBase = 0;
472     for (SDNode::use_iterator UI = Node->use_begin(), E = Node->use_end();
473          UI != E; ++UI) {
474       SDNode *Use = *UI;
475       if (Use->getOpcode() == ISD::CopyToReg && 
476           Use->getOperand(2).Val == Node &&
477           Use->getOperand(2).ResNo == i) {
478         unsigned Reg = cast<RegisterSDNode>(Use->getOperand(1))->getReg();
479         if (TargetRegisterInfo::isVirtualRegister(Reg)) {
480           VRBase = Reg;
481           MI->addOperand(MachineOperand::CreateReg(Reg, true));
482           break;
483         }
484       }
485     }
486
487     // Create the result registers for this node and add the result regs to
488     // the machine instruction.
489     if (VRBase == 0) {
490       const TargetRegisterClass *RC = getInstrOperandRegClass(TRI, TII, II, i);
491       assert(RC && "Isn't a register operand!");
492       VRBase = RegInfo.createVirtualRegister(RC);
493       MI->addOperand(MachineOperand::CreateReg(VRBase, true));
494     }
495
496     bool isNew = VRBaseMap.insert(std::make_pair(SDOperand(Node,i), VRBase));
497     assert(isNew && "Node emitted out of order - early");
498   }
499 }
500
501 /// getVR - Return the virtual register corresponding to the specified result
502 /// of the specified node.
503 static unsigned getVR(SDOperand Op, DenseMap<SDOperand, unsigned> &VRBaseMap) {
504   DenseMap<SDOperand, unsigned>::iterator I = VRBaseMap.find(Op);
505   assert(I != VRBaseMap.end() && "Node emitted out of order - late");
506   return I->second;
507 }
508
509
510 /// AddOperand - Add the specified operand to the specified machine instr.  II
511 /// specifies the instruction information for the node, and IIOpNum is the
512 /// operand number (in the II) that we are adding. IIOpNum and II are used for 
513 /// assertions only.
514 void ScheduleDAG::AddOperand(MachineInstr *MI, SDOperand Op,
515                              unsigned IIOpNum,
516                              const TargetInstrDesc *II,
517                              DenseMap<SDOperand, unsigned> &VRBaseMap) {
518   if (Op.isTargetOpcode()) {
519     // Note that this case is redundant with the final else block, but we
520     // include it because it is the most common and it makes the logic
521     // simpler here.
522     assert(Op.getValueType() != MVT::Other &&
523            Op.getValueType() != MVT::Flag &&
524            "Chain and flag operands should occur at end of operand list!");
525     
526     // Get/emit the operand.
527     unsigned VReg = getVR(Op, VRBaseMap);
528     const TargetInstrDesc &TID = MI->getDesc();
529     bool isOptDef = (IIOpNum < TID.getNumOperands())
530       ? (TID.OpInfo[IIOpNum].isOptionalDef()) : false;
531     MI->addOperand(MachineOperand::CreateReg(VReg, isOptDef));
532     
533     // Verify that it is right.
534     assert(TargetRegisterInfo::isVirtualRegister(VReg) && "Not a vreg?");
535     if (II) {
536       const TargetRegisterClass *RC =
537                           getInstrOperandRegClass(TRI, TII, *II, IIOpNum);
538       assert(RC && "Don't have operand info for this instruction!");
539       const TargetRegisterClass *VRC = RegInfo.getRegClass(VReg);
540       if (VRC != RC) {
541         cerr << "Register class of operand and regclass of use don't agree!\n";
542 #ifndef NDEBUG
543         cerr << "Operand = " << IIOpNum << "\n";
544         cerr << "Op->Val = "; Op.Val->dump(&DAG); cerr << "\n";
545         cerr << "MI = "; MI->print(cerr);
546         cerr << "VReg = " << VReg << "\n";
547         cerr << "VReg RegClass     size = " << VRC->getSize()
548              << ", align = " << VRC->getAlignment() << "\n";
549         cerr << "Expected RegClass size = " << RC->getSize()
550              << ", align = " << RC->getAlignment() << "\n";
551 #endif
552         cerr << "Fatal error, aborting.\n";
553         abort();
554       }
555     }
556   } else if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op)) {
557     MI->addOperand(MachineOperand::CreateImm(C->getValue()));
558   } else if (ConstantFPSDNode *F = dyn_cast<ConstantFPSDNode>(Op)) {
559     const Type *FType = MVT::getTypeForValueType(Op.getValueType());
560     ConstantFP *CFP = ConstantFP::get(FType, F->getValueAPF());
561     MI->addOperand(MachineOperand::CreateFPImm(CFP));
562   } else if (RegisterSDNode *R = dyn_cast<RegisterSDNode>(Op)) {
563     MI->addOperand(MachineOperand::CreateReg(R->getReg(), false));
564   } else if (GlobalAddressSDNode *TGA = dyn_cast<GlobalAddressSDNode>(Op)) {
565     MI->addOperand(MachineOperand::CreateGA(TGA->getGlobal(),TGA->getOffset()));
566   } else if (BasicBlockSDNode *BB = dyn_cast<BasicBlockSDNode>(Op)) {
567     MI->addOperand(MachineOperand::CreateMBB(BB->getBasicBlock()));
568   } else if (FrameIndexSDNode *FI = dyn_cast<FrameIndexSDNode>(Op)) {
569     MI->addOperand(MachineOperand::CreateFI(FI->getIndex()));
570   } else if (JumpTableSDNode *JT = dyn_cast<JumpTableSDNode>(Op)) {
571     MI->addOperand(MachineOperand::CreateJTI(JT->getIndex()));
572   } else if (ConstantPoolSDNode *CP = dyn_cast<ConstantPoolSDNode>(Op)) {
573     int Offset = CP->getOffset();
574     unsigned Align = CP->getAlignment();
575     const Type *Type = CP->getType();
576     // MachineConstantPool wants an explicit alignment.
577     if (Align == 0) {
578       Align = TM.getTargetData()->getPreferredTypeAlignmentShift(Type);
579       if (Align == 0) {
580         // Alignment of vector types.  FIXME!
581         Align = TM.getTargetData()->getABITypeSize(Type);
582         Align = Log2_64(Align);
583       }
584     }
585     
586     unsigned Idx;
587     if (CP->isMachineConstantPoolEntry())
588       Idx = ConstPool->getConstantPoolIndex(CP->getMachineCPVal(), Align);
589     else
590       Idx = ConstPool->getConstantPoolIndex(CP->getConstVal(), Align);
591     MI->addOperand(MachineOperand::CreateCPI(Idx, Offset));
592   } else if (ExternalSymbolSDNode *ES = dyn_cast<ExternalSymbolSDNode>(Op)) {
593     MI->addOperand(MachineOperand::CreateES(ES->getSymbol()));
594   } else {
595     assert(Op.getValueType() != MVT::Other &&
596            Op.getValueType() != MVT::Flag &&
597            "Chain and flag operands should occur at end of operand list!");
598     unsigned VReg = getVR(Op, VRBaseMap);
599     MI->addOperand(MachineOperand::CreateReg(VReg, false));
600     
601     // Verify that it is right.  Note that the reg class of the physreg and the
602     // vreg don't necessarily need to match, but the target copy insertion has
603     // to be able to handle it.  This handles things like copies from ST(0) to
604     // an FP vreg on x86.
605     assert(TargetRegisterInfo::isVirtualRegister(VReg) && "Not a vreg?");
606     if (II) {
607       assert(getInstrOperandRegClass(TRI, TII, *II, IIOpNum) &&
608              "Don't have operand info for this instruction!");
609     }
610   }
611   
612 }
613
614 void ScheduleDAG::AddMemOperand(MachineInstr *MI, const MemOperand &MO) {
615   MI->addMemOperand(MO);
616 }
617
618 // Returns the Register Class of a subregister
619 static const TargetRegisterClass *getSubRegisterRegClass(
620         const TargetRegisterClass *TRC,
621         unsigned SubIdx) {
622   // Pick the register class of the subregister
623   TargetRegisterInfo::regclass_iterator I =
624     TRC->subregclasses_begin() + SubIdx-1;
625   assert(I < TRC->subregclasses_end() && 
626          "Invalid subregister index for register class");
627   return *I;
628 }
629
630 static const TargetRegisterClass *getSuperregRegisterClass(
631         const TargetRegisterClass *TRC,
632         unsigned SubIdx,
633         MVT::ValueType VT) {
634   // Pick the register class of the superegister for this type
635   for (TargetRegisterInfo::regclass_iterator I = TRC->superregclasses_begin(),
636          E = TRC->superregclasses_end(); I != E; ++I)
637     if ((*I)->hasType(VT) && getSubRegisterRegClass(*I, SubIdx) == TRC)
638       return *I;
639   assert(false && "Couldn't find the register class");
640   return 0;
641 }
642
643 /// EmitSubregNode - Generate machine code for subreg nodes.
644 ///
645 void ScheduleDAG::EmitSubregNode(SDNode *Node, 
646                            DenseMap<SDOperand, unsigned> &VRBaseMap) {
647   unsigned VRBase = 0;
648   unsigned Opc = Node->getTargetOpcode();
649   if (Opc == TargetInstrInfo::EXTRACT_SUBREG) {
650     // If the node is only used by a CopyToReg and the dest reg is a vreg, use
651     // the CopyToReg'd destination register instead of creating a new vreg.
652     for (SDNode::use_iterator UI = Node->use_begin(), E = Node->use_end();
653          UI != E; ++UI) {
654       SDNode *Use = *UI;
655       if (Use->getOpcode() == ISD::CopyToReg && 
656           Use->getOperand(2).Val == Node) {
657         unsigned DestReg = cast<RegisterSDNode>(Use->getOperand(1))->getReg();
658         if (TargetRegisterInfo::isVirtualRegister(DestReg)) {
659           VRBase = DestReg;
660           break;
661         }
662       }
663     }
664     
665     unsigned SubIdx = cast<ConstantSDNode>(Node->getOperand(1))->getValue();
666     
667     // TODO: If the node is a use of a CopyFromReg from a physical register
668     // fold the extract into the copy now
669
670     // Create the extract_subreg machine instruction.
671     MachineInstr *MI =
672       new MachineInstr(BB, TII->get(TargetInstrInfo::EXTRACT_SUBREG));
673
674     // Figure out the register class to create for the destreg.
675     unsigned VReg = getVR(Node->getOperand(0), VRBaseMap);
676     const TargetRegisterClass *TRC = RegInfo.getRegClass(VReg);
677     const TargetRegisterClass *SRC = getSubRegisterRegClass(TRC, SubIdx);
678
679     if (VRBase) {
680       // Grab the destination register
681       const TargetRegisterClass *DRC = RegInfo.getRegClass(VRBase);
682       assert(SRC && DRC && SRC == DRC && 
683              "Source subregister and destination must have the same class");
684     } else {
685       // Create the reg
686       assert(SRC && "Couldn't find source register class");
687       VRBase = RegInfo.createVirtualRegister(SRC);
688     }
689     
690     // Add def, source, and subreg index
691     MI->addOperand(MachineOperand::CreateReg(VRBase, true));
692     AddOperand(MI, Node->getOperand(0), 0, 0, VRBaseMap);
693     MI->addOperand(MachineOperand::CreateImm(SubIdx));
694     
695   } else if (Opc == TargetInstrInfo::INSERT_SUBREG) {
696     assert((Node->getNumOperands() == 2 || Node->getNumOperands() == 3) &&
697             "Malformed insert_subreg node");
698     bool isUndefInput = (Node->getNumOperands() == 2);
699     unsigned SubReg = 0;
700     unsigned SubIdx = 0;
701     
702     if (isUndefInput) {
703       SubReg = getVR(Node->getOperand(0), VRBaseMap);
704       SubIdx = cast<ConstantSDNode>(Node->getOperand(1))->getValue();
705     } else {
706       SubReg = getVR(Node->getOperand(1), VRBaseMap);
707       SubIdx = cast<ConstantSDNode>(Node->getOperand(2))->getValue();
708     }
709     
710     // TODO: Add tracking info to MachineRegisterInfo of which vregs are subregs
711     // to allow coalescing in the allocator
712           
713     // If the node is only used by a CopyToReg and the dest reg is a vreg, use
714     // the CopyToReg'd destination register instead of creating a new vreg.
715     // If the CopyToReg'd destination register is physical, then fold the
716     // insert into the copy
717     for (SDNode::use_iterator UI = Node->use_begin(), E = Node->use_end();
718          UI != E; ++UI) {
719       SDNode *Use = *UI;
720       if (Use->getOpcode() == ISD::CopyToReg && 
721           Use->getOperand(2).Val == Node) {
722         unsigned DestReg = cast<RegisterSDNode>(Use->getOperand(1))->getReg();
723         if (TargetRegisterInfo::isVirtualRegister(DestReg)) {
724           VRBase = DestReg;
725           break;
726         }
727       }
728     }
729     
730     // Create the insert_subreg machine instruction.
731     MachineInstr *MI =
732       new MachineInstr(BB, TII->get(TargetInstrInfo::INSERT_SUBREG));
733       
734     // Figure out the register class to create for the destreg.
735     const TargetRegisterClass *TRC = 0;
736     if (VRBase) {
737       TRC = RegInfo.getRegClass(VRBase);
738     } else {
739       TRC = getSuperregRegisterClass(RegInfo.getRegClass(SubReg), SubIdx, 
740                                      Node->getValueType(0));
741       assert(TRC && "Couldn't determine register class for insert_subreg");
742       VRBase = RegInfo.createVirtualRegister(TRC); // Create the reg
743     }
744     
745     MI->addOperand(MachineOperand::CreateReg(VRBase, true));
746     AddOperand(MI, Node->getOperand(0), 0, 0, VRBaseMap);
747     if (!isUndefInput)
748       AddOperand(MI, Node->getOperand(1), 0, 0, VRBaseMap);
749     MI->addOperand(MachineOperand::CreateImm(SubIdx));
750   } else
751     assert(0 && "Node is not a subreg insert or extract");
752      
753   bool isNew = VRBaseMap.insert(std::make_pair(SDOperand(Node,0), VRBase));
754   assert(isNew && "Node emitted out of order - early");
755 }
756
757 /// EmitNode - Generate machine code for an node and needed dependencies.
758 ///
759 void ScheduleDAG::EmitNode(SDNode *Node, unsigned InstanceNo,
760                            DenseMap<SDOperand, unsigned> &VRBaseMap) {
761   // If machine instruction
762   if (Node->isTargetOpcode()) {
763     unsigned Opc = Node->getTargetOpcode();
764     
765     // Handle subreg insert/extract specially
766     if (Opc == TargetInstrInfo::EXTRACT_SUBREG || 
767         Opc == TargetInstrInfo::INSERT_SUBREG) {
768       EmitSubregNode(Node, VRBaseMap);
769       return;
770     }
771     
772     const TargetInstrDesc &II = TII->get(Opc);
773
774     unsigned NumResults = CountResults(Node);
775     unsigned NodeOperands = CountOperands(Node);
776     unsigned MemOperandsEnd = ComputeMemOperandsEnd(Node);
777     unsigned NumMIOperands = NodeOperands + NumResults;
778     bool HasPhysRegOuts = (NumResults > II.getNumDefs()) &&
779                           II.getImplicitDefs() != 0;
780 #ifndef NDEBUG
781     assert((II.getNumOperands() == NumMIOperands ||
782             HasPhysRegOuts || II.isVariadic()) &&
783            "#operands for dag node doesn't match .td file!"); 
784 #endif
785
786     // Create the new machine instruction.
787     MachineInstr *MI = new MachineInstr(II);
788     
789     // Add result register values for things that are defined by this
790     // instruction.
791     if (NumResults)
792       CreateVirtualRegisters(Node, MI, II, VRBaseMap);
793     
794     // Emit all of the actual operands of this instruction, adding them to the
795     // instruction as appropriate.
796     for (unsigned i = 0; i != NodeOperands; ++i)
797       AddOperand(MI, Node->getOperand(i), i+II.getNumDefs(), &II, VRBaseMap);
798
799     // Emit all of the memory operands of this instruction
800     for (unsigned i = NodeOperands; i != MemOperandsEnd; ++i)
801       AddMemOperand(MI, cast<MemOperandSDNode>(Node->getOperand(i))->MO);
802
803     // Commute node if it has been determined to be profitable.
804     if (CommuteSet.count(Node)) {
805       MachineInstr *NewMI = TII->commuteInstruction(MI);
806       if (NewMI == 0)
807         DOUT << "Sched: COMMUTING FAILED!\n";
808       else {
809         DOUT << "Sched: COMMUTED TO: " << *NewMI;
810         if (MI != NewMI) {
811           delete MI;
812           MI = NewMI;
813         }
814         ++NumCommutes;
815       }
816     }
817
818     if (II.usesCustomDAGSchedInsertionHook())
819       // Insert this instruction into the basic block using a target
820       // specific inserter which may returns a new basic block.
821       BB = DAG.getTargetLoweringInfo().EmitInstrWithCustomInserter(MI, BB);
822     else
823       BB->push_back(MI);
824
825     // Additional results must be an physical register def.
826     if (HasPhysRegOuts) {
827       for (unsigned i = II.getNumDefs(); i < NumResults; ++i) {
828         unsigned Reg = II.getImplicitDefs()[i - II.getNumDefs()];
829         if (Node->hasAnyUseOfValue(i))
830           EmitCopyFromReg(Node, i, InstanceNo, Reg, VRBaseMap);
831       }
832     }
833   } else {
834     switch (Node->getOpcode()) {
835     default:
836 #ifndef NDEBUG
837       Node->dump(&DAG);
838 #endif
839       assert(0 && "This target-independent node should have been selected!");
840     case ISD::EntryToken: // fall thru
841     case ISD::TokenFactor:
842     case ISD::LABEL:
843     case ISD::DECLARE:
844     case ISD::SRCVALUE:
845       break;
846     case ISD::CopyToReg: {
847       unsigned InReg;
848       if (RegisterSDNode *R = dyn_cast<RegisterSDNode>(Node->getOperand(2)))
849         InReg = R->getReg();
850       else
851         InReg = getVR(Node->getOperand(2), VRBaseMap);
852       unsigned DestReg = cast<RegisterSDNode>(Node->getOperand(1))->getReg();
853       if (InReg != DestReg)  {// Coalesced away the copy?
854         const TargetRegisterClass *TRC = 0;
855         // Get the target register class
856         if (TargetRegisterInfo::isVirtualRegister(InReg))
857           TRC = RegInfo.getRegClass(InReg);
858         else
859           TRC =
860             TRI->getPhysicalRegisterRegClass(Node->getOperand(2).getValueType(),
861                                             InReg);
862         TII->copyRegToReg(*BB, BB->end(), DestReg, InReg, TRC, TRC);
863       }
864       break;
865     }
866     case ISD::CopyFromReg: {
867       unsigned SrcReg = cast<RegisterSDNode>(Node->getOperand(1))->getReg();
868       EmitCopyFromReg(Node, 0, InstanceNo, SrcReg, VRBaseMap);
869       break;
870     }
871     case ISD::INLINEASM: {
872       unsigned NumOps = Node->getNumOperands();
873       if (Node->getOperand(NumOps-1).getValueType() == MVT::Flag)
874         --NumOps;  // Ignore the flag operand.
875       
876       // Create the inline asm machine instruction.
877       MachineInstr *MI =
878         new MachineInstr(BB, TII->get(TargetInstrInfo::INLINEASM));
879
880       // Add the asm string as an external symbol operand.
881       const char *AsmStr =
882         cast<ExternalSymbolSDNode>(Node->getOperand(1))->getSymbol();
883       MI->addOperand(MachineOperand::CreateES(AsmStr));
884       
885       // Add all of the operand registers to the instruction.
886       for (unsigned i = 2; i != NumOps;) {
887         unsigned Flags = cast<ConstantSDNode>(Node->getOperand(i))->getValue();
888         unsigned NumVals = Flags >> 3;
889         
890         MI->addOperand(MachineOperand::CreateImm(Flags));
891         ++i;  // Skip the ID value.
892         
893         switch (Flags & 7) {
894         default: assert(0 && "Bad flags!");
895         case 1:  // Use of register.
896           for (; NumVals; --NumVals, ++i) {
897             unsigned Reg = cast<RegisterSDNode>(Node->getOperand(i))->getReg();
898             MI->addOperand(MachineOperand::CreateReg(Reg, false));
899           }
900           break;
901         case 2:   // Def of register.
902           for (; NumVals; --NumVals, ++i) {
903             unsigned Reg = cast<RegisterSDNode>(Node->getOperand(i))->getReg();
904             MI->addOperand(MachineOperand::CreateReg(Reg, true));
905           }
906           break;
907         case 3: { // Immediate.
908           for (; NumVals; --NumVals, ++i) {
909             if (ConstantSDNode *CS =
910                    dyn_cast<ConstantSDNode>(Node->getOperand(i))) {
911               MI->addOperand(MachineOperand::CreateImm(CS->getValue()));
912             } else if (GlobalAddressSDNode *GA = 
913                   dyn_cast<GlobalAddressSDNode>(Node->getOperand(i))) {
914               MI->addOperand(MachineOperand::CreateGA(GA->getGlobal(),
915                                                       GA->getOffset()));
916             } else {
917               BasicBlockSDNode *BB =cast<BasicBlockSDNode>(Node->getOperand(i));
918               MI->addOperand(MachineOperand::CreateMBB(BB->getBasicBlock()));
919             }
920           }
921           break;
922         }
923         case 4:  // Addressing mode.
924           // The addressing mode has been selected, just add all of the
925           // operands to the machine instruction.
926           for (; NumVals; --NumVals, ++i)
927             AddOperand(MI, Node->getOperand(i), 0, 0, VRBaseMap);
928           break;
929         }
930       }
931       break;
932     }
933     }
934   }
935 }
936
937 void ScheduleDAG::EmitNoop() {
938   TII->insertNoop(*BB, BB->end());
939 }
940
941 void ScheduleDAG::EmitCrossRCCopy(SUnit *SU,
942                                   DenseMap<SUnit*, unsigned> &VRBaseMap) {
943   for (SUnit::const_pred_iterator I = SU->Preds.begin(), E = SU->Preds.end();
944        I != E; ++I) {
945     if (I->isCtrl) continue;  // ignore chain preds
946     if (!I->Dep->Node) {
947       // Copy to physical register.
948       DenseMap<SUnit*, unsigned>::iterator VRI = VRBaseMap.find(I->Dep);
949       assert(VRI != VRBaseMap.end() && "Node emitted out of order - late");
950       // Find the destination physical register.
951       unsigned Reg = 0;
952       for (SUnit::const_succ_iterator II = SU->Succs.begin(),
953              EE = SU->Succs.end(); II != EE; ++II) {
954         if (I->Reg) {
955           Reg = I->Reg;
956           break;
957         }
958       }
959       assert(I->Reg && "Unknown physical register!");
960       TII->copyRegToReg(*BB, BB->end(), Reg, VRI->second,
961                         SU->CopyDstRC, SU->CopySrcRC);
962     } else {
963       // Copy from physical register.
964       assert(I->Reg && "Unknown physical register!");
965       unsigned VRBase = RegInfo.createVirtualRegister(SU->CopyDstRC);
966       bool isNew = VRBaseMap.insert(std::make_pair(SU, VRBase));
967       assert(isNew && "Node emitted out of order - early");
968       TII->copyRegToReg(*BB, BB->end(), VRBase, I->Reg,
969                         SU->CopyDstRC, SU->CopySrcRC);
970     }
971     break;
972   }
973 }
974
975 /// EmitSchedule - Emit the machine code in scheduled order.
976 void ScheduleDAG::EmitSchedule() {
977   // If this is the first basic block in the function, and if it has live ins
978   // that need to be copied into vregs, emit the copies into the top of the
979   // block before emitting the code for the block.
980   if (&MF->front() == BB) {
981     for (MachineRegisterInfo::livein_iterator LI = RegInfo.livein_begin(),
982          E = RegInfo.livein_end(); LI != E; ++LI)
983       if (LI->second) {
984         const TargetRegisterClass *RC = RegInfo.getRegClass(LI->second);
985         TII->copyRegToReg(*MF->begin(), MF->begin()->end(), LI->second,
986                           LI->first, RC, RC);
987       }
988   }
989   
990   
991   // Finally, emit the code for all of the scheduled instructions.
992   DenseMap<SDOperand, unsigned> VRBaseMap;
993   DenseMap<SUnit*, unsigned> CopyVRBaseMap;
994   for (unsigned i = 0, e = Sequence.size(); i != e; i++) {
995     if (SUnit *SU = Sequence[i]) {
996       for (unsigned j = 0, ee = SU->FlaggedNodes.size(); j != ee; ++j)
997         EmitNode(SU->FlaggedNodes[j], SU->InstanceNo, VRBaseMap);
998       if (SU->Node)
999         EmitNode(SU->Node, SU->InstanceNo, VRBaseMap);
1000       else
1001         EmitCrossRCCopy(SU, CopyVRBaseMap);
1002     } else {
1003       // Null SUnit* is a noop.
1004       EmitNoop();
1005     }
1006   }
1007 }
1008
1009 /// dump - dump the schedule.
1010 void ScheduleDAG::dumpSchedule() const {
1011   for (unsigned i = 0, e = Sequence.size(); i != e; i++) {
1012     if (SUnit *SU = Sequence[i])
1013       SU->dump(&DAG);
1014     else
1015       cerr << "**** NOOP ****\n";
1016   }
1017 }
1018
1019
1020 /// Run - perform scheduling.
1021 ///
1022 MachineBasicBlock *ScheduleDAG::Run() {
1023   Schedule();
1024   return BB;
1025 }
1026
1027 /// SUnit - Scheduling unit. It's an wrapper around either a single SDNode or
1028 /// a group of nodes flagged together.
1029 void SUnit::dump(const SelectionDAG *G) const {
1030   cerr << "SU(" << NodeNum << "): ";
1031   if (Node)
1032     Node->dump(G);
1033   else
1034     cerr << "CROSS RC COPY ";
1035   cerr << "\n";
1036   if (FlaggedNodes.size() != 0) {
1037     for (unsigned i = 0, e = FlaggedNodes.size(); i != e; i++) {
1038       cerr << "    ";
1039       FlaggedNodes[i]->dump(G);
1040       cerr << "\n";
1041     }
1042   }
1043 }
1044
1045 void SUnit::dumpAll(const SelectionDAG *G) const {
1046   dump(G);
1047
1048   cerr << "  # preds left       : " << NumPredsLeft << "\n";
1049   cerr << "  # succs left       : " << NumSuccsLeft << "\n";
1050   cerr << "  Latency            : " << Latency << "\n";
1051   cerr << "  Depth              : " << Depth << "\n";
1052   cerr << "  Height             : " << Height << "\n";
1053
1054   if (Preds.size() != 0) {
1055     cerr << "  Predecessors:\n";
1056     for (SUnit::const_succ_iterator I = Preds.begin(), E = Preds.end();
1057          I != E; ++I) {
1058       if (I->isCtrl)
1059         cerr << "   ch  #";
1060       else
1061         cerr << "   val #";
1062       cerr << I->Dep << " - SU(" << I->Dep->NodeNum << ")";
1063       if (I->isSpecial)
1064         cerr << " *";
1065       cerr << "\n";
1066     }
1067   }
1068   if (Succs.size() != 0) {
1069     cerr << "  Successors:\n";
1070     for (SUnit::const_succ_iterator I = Succs.begin(), E = Succs.end();
1071          I != E; ++I) {
1072       if (I->isCtrl)
1073         cerr << "   ch  #";
1074       else
1075         cerr << "   val #";
1076       cerr << I->Dep << " - SU(" << I->Dep->NodeNum << ")";
1077       if (I->isSpecial)
1078         cerr << " *";
1079       cerr << "\n";
1080     }
1081   }
1082   cerr << "\n";
1083 }