- Mark last use of a split interval as kill instead of letting spiller track it.
[oota-llvm.git] / lib / CodeGen / VirtRegMap.cpp
1 //===-- llvm/CodeGen/VirtRegMap.cpp - Virtual Register Map ----------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file was developed by the LLVM research group and is distributed under
6 // the University of Illinois Open Source License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file implements the VirtRegMap class.
11 //
12 // It also contains implementations of the the Spiller interface, which, given a
13 // virtual register map and a machine function, eliminates all virtual
14 // references by replacing them with physical register references - adding spill
15 // code as necessary.
16 //
17 //===----------------------------------------------------------------------===//
18
19 #define DEBUG_TYPE "spiller"
20 #include "VirtRegMap.h"
21 #include "llvm/Function.h"
22 #include "llvm/CodeGen/MachineFrameInfo.h"
23 #include "llvm/CodeGen/MachineFunction.h"
24 #include "llvm/CodeGen/SSARegMap.h"
25 #include "llvm/Target/TargetMachine.h"
26 #include "llvm/Target/TargetInstrInfo.h"
27 #include "llvm/Support/CommandLine.h"
28 #include "llvm/Support/Debug.h"
29 #include "llvm/Support/Compiler.h"
30 #include "llvm/ADT/BitVector.h"
31 #include "llvm/ADT/Statistic.h"
32 #include "llvm/ADT/STLExtras.h"
33 #include "llvm/ADT/SmallSet.h"
34 #include <algorithm>
35 using namespace llvm;
36
37 STATISTIC(NumSpills, "Number of register spills");
38 STATISTIC(NumReMats, "Number of re-materialization");
39 STATISTIC(NumDRM   , "Number of re-materializable defs elided");
40 STATISTIC(NumStores, "Number of stores added");
41 STATISTIC(NumLoads , "Number of loads added");
42 STATISTIC(NumReused, "Number of values reused");
43 STATISTIC(NumDSE   , "Number of dead stores elided");
44 STATISTIC(NumDCE   , "Number of copies elided");
45
46 namespace {
47   enum SpillerName { simple, local };
48
49   static cl::opt<SpillerName>
50   SpillerOpt("spiller",
51              cl::desc("Spiller to use: (default: local)"),
52              cl::Prefix,
53              cl::values(clEnumVal(simple, "  simple spiller"),
54                         clEnumVal(local,  "  local spiller"),
55                         clEnumValEnd),
56              cl::init(local));
57 }
58
59 //===----------------------------------------------------------------------===//
60 //  VirtRegMap implementation
61 //===----------------------------------------------------------------------===//
62
63 VirtRegMap::VirtRegMap(MachineFunction &mf)
64   : TII(*mf.getTarget().getInstrInfo()), MF(mf), 
65     Virt2PhysMap(NO_PHYS_REG), Virt2StackSlotMap(NO_STACK_SLOT),
66     Virt2ReMatIdMap(NO_STACK_SLOT), Virt2SplitMap(0),
67     ReMatMap(NULL), ReMatId(MAX_STACK_SLOT+1) {
68   grow();
69 }
70
71 void VirtRegMap::grow() {
72   unsigned LastVirtReg = MF.getSSARegMap()->getLastVirtReg();
73   Virt2PhysMap.grow(LastVirtReg);
74   Virt2StackSlotMap.grow(LastVirtReg);
75   Virt2ReMatIdMap.grow(LastVirtReg);
76   Virt2SplitMap.grow(LastVirtReg);
77   ReMatMap.grow(LastVirtReg);
78 }
79
80 int VirtRegMap::assignVirt2StackSlot(unsigned virtReg) {
81   assert(MRegisterInfo::isVirtualRegister(virtReg));
82   assert(Virt2StackSlotMap[virtReg] == NO_STACK_SLOT &&
83          "attempt to assign stack slot to already spilled register");
84   const TargetRegisterClass* RC = MF.getSSARegMap()->getRegClass(virtReg);
85   int frameIndex = MF.getFrameInfo()->CreateStackObject(RC->getSize(),
86                                                         RC->getAlignment());
87   Virt2StackSlotMap[virtReg] = frameIndex;
88   ++NumSpills;
89   return frameIndex;
90 }
91
92 void VirtRegMap::assignVirt2StackSlot(unsigned virtReg, int frameIndex) {
93   assert(MRegisterInfo::isVirtualRegister(virtReg));
94   assert(Virt2StackSlotMap[virtReg] == NO_STACK_SLOT &&
95          "attempt to assign stack slot to already spilled register");
96   assert((frameIndex >= 0 ||
97           (frameIndex >= MF.getFrameInfo()->getObjectIndexBegin())) &&
98          "illegal fixed frame index");
99   Virt2StackSlotMap[virtReg] = frameIndex;
100 }
101
102 int VirtRegMap::assignVirtReMatId(unsigned virtReg) {
103   assert(MRegisterInfo::isVirtualRegister(virtReg));
104   assert(Virt2ReMatIdMap[virtReg] == NO_STACK_SLOT &&
105          "attempt to assign re-mat id to already spilled register");
106   Virt2ReMatIdMap[virtReg] = ReMatId;
107   return ReMatId++;
108 }
109
110 void VirtRegMap::assignVirtReMatId(unsigned virtReg, int id) {
111   assert(MRegisterInfo::isVirtualRegister(virtReg));
112   assert(Virt2ReMatIdMap[virtReg] == NO_STACK_SLOT &&
113          "attempt to assign re-mat id to already spilled register");
114   Virt2ReMatIdMap[virtReg] = id;
115 }
116
117 void VirtRegMap::virtFolded(unsigned VirtReg, MachineInstr *OldMI,
118                             MachineInstr *NewMI, ModRef MRInfo) {
119   // Move previous memory references folded to new instruction.
120   MI2VirtMapTy::iterator IP = MI2VirtMap.lower_bound(NewMI);
121   for (MI2VirtMapTy::iterator I = MI2VirtMap.lower_bound(OldMI),
122          E = MI2VirtMap.end(); I != E && I->first == OldMI; ) {
123     MI2VirtMap.insert(IP, std::make_pair(NewMI, I->second));
124     MI2VirtMap.erase(I++);
125   }
126
127   // add new memory reference
128   MI2VirtMap.insert(IP, std::make_pair(NewMI, std::make_pair(VirtReg, MRInfo)));
129 }
130
131 void VirtRegMap::virtFolded(unsigned VirtReg, MachineInstr *MI, ModRef MRInfo) {
132   MI2VirtMapTy::iterator IP = MI2VirtMap.lower_bound(MI);
133   MI2VirtMap.insert(IP, std::make_pair(MI, std::make_pair(VirtReg, MRInfo)));
134 }
135
136 void VirtRegMap::print(std::ostream &OS) const {
137   const MRegisterInfo* MRI = MF.getTarget().getRegisterInfo();
138
139   OS << "********** REGISTER MAP **********\n";
140   for (unsigned i = MRegisterInfo::FirstVirtualRegister,
141          e = MF.getSSARegMap()->getLastVirtReg(); i <= e; ++i) {
142     if (Virt2PhysMap[i] != (unsigned)VirtRegMap::NO_PHYS_REG)
143       OS << "[reg" << i << " -> " << MRI->getName(Virt2PhysMap[i]) << "]\n";
144
145   }
146
147   for (unsigned i = MRegisterInfo::FirstVirtualRegister,
148          e = MF.getSSARegMap()->getLastVirtReg(); i <= e; ++i)
149     if (Virt2StackSlotMap[i] != VirtRegMap::NO_STACK_SLOT)
150       OS << "[reg" << i << " -> fi#" << Virt2StackSlotMap[i] << "]\n";
151   OS << '\n';
152 }
153
154 void VirtRegMap::dump() const {
155   print(DOUT);
156 }
157
158
159 //===----------------------------------------------------------------------===//
160 // Simple Spiller Implementation
161 //===----------------------------------------------------------------------===//
162
163 Spiller::~Spiller() {}
164
165 namespace {
166   struct VISIBILITY_HIDDEN SimpleSpiller : public Spiller {
167     bool runOnMachineFunction(MachineFunction& mf, VirtRegMap &VRM);
168   };
169 }
170
171 bool SimpleSpiller::runOnMachineFunction(MachineFunction &MF, VirtRegMap &VRM) {
172   DOUT << "********** REWRITE MACHINE CODE **********\n";
173   DOUT << "********** Function: " << MF.getFunction()->getName() << '\n';
174   const TargetMachine &TM = MF.getTarget();
175   const MRegisterInfo &MRI = *TM.getRegisterInfo();
176
177   // LoadedRegs - Keep track of which vregs are loaded, so that we only load
178   // each vreg once (in the case where a spilled vreg is used by multiple
179   // operands).  This is always smaller than the number of operands to the
180   // current machine instr, so it should be small.
181   std::vector<unsigned> LoadedRegs;
182
183   for (MachineFunction::iterator MBBI = MF.begin(), E = MF.end();
184        MBBI != E; ++MBBI) {
185     DOUT << MBBI->getBasicBlock()->getName() << ":\n";
186     MachineBasicBlock &MBB = *MBBI;
187     for (MachineBasicBlock::iterator MII = MBB.begin(),
188            E = MBB.end(); MII != E; ++MII) {
189       MachineInstr &MI = *MII;
190       for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
191         MachineOperand &MO = MI.getOperand(i);
192         if (MO.isRegister() && MO.getReg())
193           if (MRegisterInfo::isVirtualRegister(MO.getReg())) {
194             unsigned VirtReg = MO.getReg();
195             unsigned PhysReg = VRM.getPhys(VirtReg);
196             if (!VRM.isAssignedReg(VirtReg)) {
197               int StackSlot = VRM.getStackSlot(VirtReg);
198               const TargetRegisterClass* RC =
199                 MF.getSSARegMap()->getRegClass(VirtReg);
200
201               if (MO.isUse() &&
202                   std::find(LoadedRegs.begin(), LoadedRegs.end(), VirtReg)
203                   == LoadedRegs.end()) {
204                 MRI.loadRegFromStackSlot(MBB, &MI, PhysReg, StackSlot, RC);
205                 LoadedRegs.push_back(VirtReg);
206                 ++NumLoads;
207                 DOUT << '\t' << *prior(MII);
208               }
209
210               if (MO.isDef()) {
211                 MRI.storeRegToStackSlot(MBB, next(MII), PhysReg, true,
212                                         StackSlot, RC);
213                 ++NumStores;
214               }
215             }
216             MF.setPhysRegUsed(PhysReg);
217             MI.getOperand(i).setReg(PhysReg);
218           } else {
219             MF.setPhysRegUsed(MO.getReg());
220           }
221       }
222
223       DOUT << '\t' << MI;
224       LoadedRegs.clear();
225     }
226   }
227   return true;
228 }
229
230 //===----------------------------------------------------------------------===//
231 //  Local Spiller Implementation
232 //===----------------------------------------------------------------------===//
233
234 namespace {
235   class AvailableSpills;
236
237   /// LocalSpiller - This spiller does a simple pass over the machine basic
238   /// block to attempt to keep spills in registers as much as possible for
239   /// blocks that have low register pressure (the vreg may be spilled due to
240   /// register pressure in other blocks).
241   class VISIBILITY_HIDDEN LocalSpiller : public Spiller {
242     SSARegMap *RegMap;
243     const MRegisterInfo *MRI;
244     const TargetInstrInfo *TII;
245   public:
246     bool runOnMachineFunction(MachineFunction &MF, VirtRegMap &VRM) {
247       RegMap = MF.getSSARegMap();
248       MRI = MF.getTarget().getRegisterInfo();
249       TII = MF.getTarget().getInstrInfo();
250       DOUT << "\n**** Local spiller rewriting function '"
251            << MF.getFunction()->getName() << "':\n";
252       DOUT << "**** Machine Instrs (NOTE! Does not include spills and reloads!) ****\n";
253       DEBUG(MF.dump());
254
255       for (MachineFunction::iterator MBB = MF.begin(), E = MF.end();
256            MBB != E; ++MBB)
257         RewriteMBB(*MBB, VRM);
258
259       DOUT << "**** Post Machine Instrs ****\n";
260       DEBUG(MF.dump());
261
262       return true;
263     }
264   private:
265     bool PrepForUnfoldOpti(MachineBasicBlock &MBB,
266                            MachineBasicBlock::iterator &MII,
267                            std::vector<MachineInstr*> &MaybeDeadStores,
268                            AvailableSpills &Spills, BitVector &RegKills,
269                            std::vector<MachineOperand*> &KillOps,
270                            VirtRegMap &VRM);
271     void SpillRegToStackSlot(MachineBasicBlock &MBB,
272                              MachineBasicBlock::iterator &MII,
273                              int Idx, unsigned PhysReg, int StackSlot,
274                              const TargetRegisterClass *RC,
275                              bool isAvailable, MachineInstr *&LastStore,
276                              AvailableSpills &Spills,
277                              SmallSet<MachineInstr*, 4> &ReMatDefs,
278                              BitVector &RegKills,
279                              std::vector<MachineOperand*> &KillOps,
280                              VirtRegMap &VRM);
281     void RewriteMBB(MachineBasicBlock &MBB, VirtRegMap &VRM);
282   };
283 }
284
285 /// AvailableSpills - As the local spiller is scanning and rewriting an MBB from
286 /// top down, keep track of which spills slots or remat are available in each
287 /// register.
288 ///
289 /// Note that not all physregs are created equal here.  In particular, some
290 /// physregs are reloads that we are allowed to clobber or ignore at any time.
291 /// Other physregs are values that the register allocated program is using that
292 /// we cannot CHANGE, but we can read if we like.  We keep track of this on a 
293 /// per-stack-slot / remat id basis as the low bit in the value of the
294 /// SpillSlotsAvailable entries.  The predicate 'canClobberPhysReg()' checks
295 /// this bit and addAvailable sets it if.
296 namespace {
297 class VISIBILITY_HIDDEN AvailableSpills {
298   const MRegisterInfo *MRI;
299   const TargetInstrInfo *TII;
300
301   // SpillSlotsOrReMatsAvailable - This map keeps track of all of the spilled
302   // or remat'ed virtual register values that are still available, due to being
303   // loaded or stored to, but not invalidated yet.
304   std::map<int, unsigned> SpillSlotsOrReMatsAvailable;
305     
306   // PhysRegsAvailable - This is the inverse of SpillSlotsOrReMatsAvailable,
307   // indicating which stack slot values are currently held by a physreg.  This
308   // is used to invalidate entries in SpillSlotsOrReMatsAvailable when a
309   // physreg is modified.
310   std::multimap<unsigned, int> PhysRegsAvailable;
311   
312   void disallowClobberPhysRegOnly(unsigned PhysReg);
313
314   void ClobberPhysRegOnly(unsigned PhysReg);
315 public:
316   AvailableSpills(const MRegisterInfo *mri, const TargetInstrInfo *tii)
317     : MRI(mri), TII(tii) {
318   }
319   
320   const MRegisterInfo *getRegInfo() const { return MRI; }
321
322   /// getSpillSlotOrReMatPhysReg - If the specified stack slot or remat is
323   /// available in a  physical register, return that PhysReg, otherwise
324   /// return 0.
325   unsigned getSpillSlotOrReMatPhysReg(int Slot) const {
326     std::map<int, unsigned>::const_iterator I =
327       SpillSlotsOrReMatsAvailable.find(Slot);
328     if (I != SpillSlotsOrReMatsAvailable.end()) {
329       return I->second >> 1;  // Remove the CanClobber bit.
330     }
331     return 0;
332   }
333
334   /// addAvailable - Mark that the specified stack slot / remat is available in
335   /// the specified physreg.  If CanClobber is true, the physreg can be modified
336   /// at any time without changing the semantics of the program.
337   void addAvailable(int SlotOrReMat, MachineInstr *MI, unsigned Reg,
338                     bool CanClobber = true) {
339     // If this stack slot is thought to be available in some other physreg, 
340     // remove its record.
341     ModifyStackSlotOrReMat(SlotOrReMat);
342     
343     PhysRegsAvailable.insert(std::make_pair(Reg, SlotOrReMat));
344     SpillSlotsOrReMatsAvailable[SlotOrReMat]= (Reg << 1) | (unsigned)CanClobber;
345   
346     if (SlotOrReMat > VirtRegMap::MAX_STACK_SLOT)
347       DOUT << "Remembering RM#" << SlotOrReMat-VirtRegMap::MAX_STACK_SLOT-1;
348     else
349       DOUT << "Remembering SS#" << SlotOrReMat;
350     DOUT << " in physreg " << MRI->getName(Reg) << "\n";
351   }
352
353   /// canClobberPhysReg - Return true if the spiller is allowed to change the 
354   /// value of the specified stackslot register if it desires.  The specified
355   /// stack slot must be available in a physreg for this query to make sense.
356   bool canClobberPhysReg(int SlotOrReMat) const {
357     assert(SpillSlotsOrReMatsAvailable.count(SlotOrReMat) &&
358            "Value not available!");
359     return SpillSlotsOrReMatsAvailable.find(SlotOrReMat)->second & 1;
360   }
361
362   /// disallowClobberPhysReg - Unset the CanClobber bit of the specified
363   /// stackslot register. The register is still available but is no longer
364   /// allowed to be modifed.
365   void disallowClobberPhysReg(unsigned PhysReg);
366   
367   /// ClobberPhysReg - This is called when the specified physreg changes
368   /// value.  We use this to invalidate any info about stuff that lives in
369   /// it and any of its aliases.
370   void ClobberPhysReg(unsigned PhysReg);
371
372   /// ModifyStackSlotOrReMat - This method is called when the value in a stack
373   /// slot changes.  This removes information about which register the previous
374   /// value for this slot lives in (as the previous value is dead now).
375   void ModifyStackSlotOrReMat(int SlotOrReMat);
376 };
377 }
378
379 /// disallowClobberPhysRegOnly - Unset the CanClobber bit of the specified
380 /// stackslot register. The register is still available but is no longer
381 /// allowed to be modifed.
382 void AvailableSpills::disallowClobberPhysRegOnly(unsigned PhysReg) {
383   std::multimap<unsigned, int>::iterator I =
384     PhysRegsAvailable.lower_bound(PhysReg);
385   while (I != PhysRegsAvailable.end() && I->first == PhysReg) {
386     int SlotOrReMat = I->second;
387     I++;
388     assert((SpillSlotsOrReMatsAvailable[SlotOrReMat] >> 1) == PhysReg &&
389            "Bidirectional map mismatch!");
390     SpillSlotsOrReMatsAvailable[SlotOrReMat] &= ~1;
391     DOUT << "PhysReg " << MRI->getName(PhysReg)
392          << " copied, it is available for use but can no longer be modified\n";
393   }
394 }
395
396 /// disallowClobberPhysReg - Unset the CanClobber bit of the specified
397 /// stackslot register and its aliases. The register and its aliases may
398 /// still available but is no longer allowed to be modifed.
399 void AvailableSpills::disallowClobberPhysReg(unsigned PhysReg) {
400   for (const unsigned *AS = MRI->getAliasSet(PhysReg); *AS; ++AS)
401     disallowClobberPhysRegOnly(*AS);
402   disallowClobberPhysRegOnly(PhysReg);
403 }
404
405 /// ClobberPhysRegOnly - This is called when the specified physreg changes
406 /// value.  We use this to invalidate any info about stuff we thing lives in it.
407 void AvailableSpills::ClobberPhysRegOnly(unsigned PhysReg) {
408   std::multimap<unsigned, int>::iterator I =
409     PhysRegsAvailable.lower_bound(PhysReg);
410   while (I != PhysRegsAvailable.end() && I->first == PhysReg) {
411     int SlotOrReMat = I->second;
412     PhysRegsAvailable.erase(I++);
413     assert((SpillSlotsOrReMatsAvailable[SlotOrReMat] >> 1) == PhysReg &&
414            "Bidirectional map mismatch!");
415     SpillSlotsOrReMatsAvailable.erase(SlotOrReMat);
416     DOUT << "PhysReg " << MRI->getName(PhysReg)
417          << " clobbered, invalidating ";
418     if (SlotOrReMat > VirtRegMap::MAX_STACK_SLOT)
419       DOUT << "RM#" << SlotOrReMat-VirtRegMap::MAX_STACK_SLOT-1 << "\n";
420     else
421       DOUT << "SS#" << SlotOrReMat << "\n";
422   }
423 }
424
425 /// ClobberPhysReg - This is called when the specified physreg changes
426 /// value.  We use this to invalidate any info about stuff we thing lives in
427 /// it and any of its aliases.
428 void AvailableSpills::ClobberPhysReg(unsigned PhysReg) {
429   for (const unsigned *AS = MRI->getAliasSet(PhysReg); *AS; ++AS)
430     ClobberPhysRegOnly(*AS);
431   ClobberPhysRegOnly(PhysReg);
432 }
433
434 /// ModifyStackSlotOrReMat - This method is called when the value in a stack
435 /// slot changes.  This removes information about which register the previous
436 /// value for this slot lives in (as the previous value is dead now).
437 void AvailableSpills::ModifyStackSlotOrReMat(int SlotOrReMat) {
438   std::map<int, unsigned>::iterator It =
439     SpillSlotsOrReMatsAvailable.find(SlotOrReMat);
440   if (It == SpillSlotsOrReMatsAvailable.end()) return;
441   unsigned Reg = It->second >> 1;
442   SpillSlotsOrReMatsAvailable.erase(It);
443   
444   // This register may hold the value of multiple stack slots, only remove this
445   // stack slot from the set of values the register contains.
446   std::multimap<unsigned, int>::iterator I = PhysRegsAvailable.lower_bound(Reg);
447   for (; ; ++I) {
448     assert(I != PhysRegsAvailable.end() && I->first == Reg &&
449            "Map inverse broken!");
450     if (I->second == SlotOrReMat) break;
451   }
452   PhysRegsAvailable.erase(I);
453 }
454
455
456
457 /// InvalidateKills - MI is going to be deleted. If any of its operands are
458 /// marked kill, then invalidate the information.
459 static void InvalidateKills(MachineInstr &MI, BitVector &RegKills,
460                             std::vector<MachineOperand*> &KillOps,
461                             SmallVector<unsigned, 2> *KillRegs = NULL) {
462   for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
463     MachineOperand &MO = MI.getOperand(i);
464     if (!MO.isRegister() || !MO.isUse() || !MO.isKill())
465       continue;
466     unsigned Reg = MO.getReg();
467     if (KillRegs)
468       KillRegs->push_back(Reg);
469     if (KillOps[Reg] == &MO) {
470       RegKills.reset(Reg);
471       KillOps[Reg] = NULL;
472     }
473   }
474 }
475
476 /// InvalidateRegDef - If the def operand of the specified def MI is now dead
477 /// (since it's spill instruction is removed), mark it isDead. Also checks if
478 /// the def MI has other definition operands that are not dead. Returns it by
479 /// reference.
480 static bool InvalidateRegDef(MachineBasicBlock::iterator I,
481                              MachineInstr &NewDef, unsigned Reg,
482                              bool &HasLiveDef) {
483   // Due to remat, it's possible this reg isn't being reused. That is,
484   // the def of this reg (by prev MI) is now dead.
485   MachineInstr *DefMI = I;
486   MachineOperand *DefOp = NULL;
487   for (unsigned i = 0, e = DefMI->getNumOperands(); i != e; ++i) {
488     MachineOperand &MO = DefMI->getOperand(i);
489     if (MO.isRegister() && MO.isDef()) {
490       if (MO.getReg() == Reg)
491         DefOp = &MO;
492       else if (!MO.isDead())
493         HasLiveDef = true;
494     }
495   }
496   if (!DefOp)
497     return false;
498
499   bool FoundUse = false, Done = false;
500   MachineBasicBlock::iterator E = NewDef;
501   ++I; ++E;
502   for (; !Done && I != E; ++I) {
503     MachineInstr *NMI = I;
504     for (unsigned j = 0, ee = NMI->getNumOperands(); j != ee; ++j) {
505       MachineOperand &MO = NMI->getOperand(j);
506       if (!MO.isRegister() || MO.getReg() != Reg)
507         continue;
508       if (MO.isUse())
509         FoundUse = true;
510       Done = true; // Stop after scanning all the operands of this MI.
511     }
512   }
513   if (!FoundUse) {
514     // Def is dead!
515     DefOp->setIsDead();
516     return true;
517   }
518   return false;
519 }
520
521 /// UpdateKills - Track and update kill info. If a MI reads a register that is
522 /// marked kill, then it must be due to register reuse. Transfer the kill info
523 /// over.
524 static void UpdateKills(MachineInstr &MI, BitVector &RegKills,
525                         std::vector<MachineOperand*> &KillOps) {
526   const TargetInstrDescriptor *TID = MI.getInstrDescriptor();
527   for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
528     MachineOperand &MO = MI.getOperand(i);
529     if (!MO.isRegister() || !MO.isUse())
530       continue;
531     unsigned Reg = MO.getReg();
532     if (Reg == 0)
533       continue;
534     
535     if (RegKills[Reg]) {
536       // That can't be right. Register is killed but not re-defined and it's
537       // being reused. Let's fix that.
538       KillOps[Reg]->unsetIsKill();
539       if (i < TID->numOperands &&
540           TID->getOperandConstraint(i, TOI::TIED_TO) == -1)
541         // Unless it's a two-address operand, this is the new kill.
542         MO.setIsKill();
543     }
544
545     if (MO.isKill()) {
546       RegKills.set(Reg);
547       KillOps[Reg] = &MO;
548     }
549   }
550
551   for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
552     const MachineOperand &MO = MI.getOperand(i);
553     if (!MO.isRegister() || !MO.isDef())
554       continue;
555     unsigned Reg = MO.getReg();
556     RegKills.reset(Reg);
557     KillOps[Reg] = NULL;
558   }
559 }
560
561
562 // ReusedOp - For each reused operand, we keep track of a bit of information, in
563 // case we need to rollback upon processing a new operand.  See comments below.
564 namespace {
565   struct ReusedOp {
566     // The MachineInstr operand that reused an available value.
567     unsigned Operand;
568
569     // StackSlotOrReMat - The spill slot or remat id of the value being reused.
570     unsigned StackSlotOrReMat;
571
572     // PhysRegReused - The physical register the value was available in.
573     unsigned PhysRegReused;
574
575     // AssignedPhysReg - The physreg that was assigned for use by the reload.
576     unsigned AssignedPhysReg;
577     
578     // VirtReg - The virtual register itself.
579     unsigned VirtReg;
580
581     ReusedOp(unsigned o, unsigned ss, unsigned prr, unsigned apr,
582              unsigned vreg)
583       : Operand(o), StackSlotOrReMat(ss), PhysRegReused(prr),
584         AssignedPhysReg(apr), VirtReg(vreg) {}
585   };
586   
587   /// ReuseInfo - This maintains a collection of ReuseOp's for each operand that
588   /// is reused instead of reloaded.
589   class VISIBILITY_HIDDEN ReuseInfo {
590     MachineInstr &MI;
591     std::vector<ReusedOp> Reuses;
592     BitVector PhysRegsClobbered;
593   public:
594     ReuseInfo(MachineInstr &mi, const MRegisterInfo *mri) : MI(mi) {
595       PhysRegsClobbered.resize(mri->getNumRegs());
596     }
597     
598     bool hasReuses() const {
599       return !Reuses.empty();
600     }
601     
602     /// addReuse - If we choose to reuse a virtual register that is already
603     /// available instead of reloading it, remember that we did so.
604     void addReuse(unsigned OpNo, unsigned StackSlotOrReMat,
605                   unsigned PhysRegReused, unsigned AssignedPhysReg,
606                   unsigned VirtReg) {
607       // If the reload is to the assigned register anyway, no undo will be
608       // required.
609       if (PhysRegReused == AssignedPhysReg) return;
610       
611       // Otherwise, remember this.
612       Reuses.push_back(ReusedOp(OpNo, StackSlotOrReMat, PhysRegReused, 
613                                 AssignedPhysReg, VirtReg));
614     }
615
616     void markClobbered(unsigned PhysReg) {
617       PhysRegsClobbered.set(PhysReg);
618     }
619
620     bool isClobbered(unsigned PhysReg) const {
621       return PhysRegsClobbered.test(PhysReg);
622     }
623     
624     /// GetRegForReload - We are about to emit a reload into PhysReg.  If there
625     /// is some other operand that is using the specified register, either pick
626     /// a new register to use, or evict the previous reload and use this reg. 
627     unsigned GetRegForReload(unsigned PhysReg, MachineInstr *MI,
628                              AvailableSpills &Spills,
629                              std::vector<MachineInstr*> &MaybeDeadStores,
630                              SmallSet<unsigned, 8> &Rejected,
631                              BitVector &RegKills,
632                              std::vector<MachineOperand*> &KillOps,
633                              VirtRegMap &VRM) {
634       if (Reuses.empty()) return PhysReg;  // This is most often empty.
635
636       for (unsigned ro = 0, e = Reuses.size(); ro != e; ++ro) {
637         ReusedOp &Op = Reuses[ro];
638         // If we find some other reuse that was supposed to use this register
639         // exactly for its reload, we can change this reload to use ITS reload
640         // register. That is, unless its reload register has already been
641         // considered and subsequently rejected because it has also been reused
642         // by another operand.
643         if (Op.PhysRegReused == PhysReg &&
644             Rejected.count(Op.AssignedPhysReg) == 0) {
645           // Yup, use the reload register that we didn't use before.
646           unsigned NewReg = Op.AssignedPhysReg;
647           Rejected.insert(PhysReg);
648           return GetRegForReload(NewReg, MI, Spills, MaybeDeadStores, Rejected,
649                                  RegKills, KillOps, VRM);
650         } else {
651           // Otherwise, we might also have a problem if a previously reused
652           // value aliases the new register.  If so, codegen the previous reload
653           // and use this one.          
654           unsigned PRRU = Op.PhysRegReused;
655           const MRegisterInfo *MRI = Spills.getRegInfo();
656           if (MRI->areAliases(PRRU, PhysReg)) {
657             // Okay, we found out that an alias of a reused register
658             // was used.  This isn't good because it means we have
659             // to undo a previous reuse.
660             MachineBasicBlock *MBB = MI->getParent();
661             const TargetRegisterClass *AliasRC =
662               MBB->getParent()->getSSARegMap()->getRegClass(Op.VirtReg);
663
664             // Copy Op out of the vector and remove it, we're going to insert an
665             // explicit load for it.
666             ReusedOp NewOp = Op;
667             Reuses.erase(Reuses.begin()+ro);
668
669             // Ok, we're going to try to reload the assigned physreg into the
670             // slot that we were supposed to in the first place.  However, that
671             // register could hold a reuse.  Check to see if it conflicts or
672             // would prefer us to use a different register.
673             unsigned NewPhysReg = GetRegForReload(NewOp.AssignedPhysReg,
674                                                   MI, Spills, MaybeDeadStores,
675                                               Rejected, RegKills, KillOps, VRM);
676             
677             if (NewOp.StackSlotOrReMat > VirtRegMap::MAX_STACK_SLOT) {
678               MRI->reMaterialize(*MBB, MI, NewPhysReg,
679                                  VRM.getReMaterializedMI(NewOp.VirtReg));
680               ++NumReMats;
681             } else {
682               MRI->loadRegFromStackSlot(*MBB, MI, NewPhysReg,
683                                         NewOp.StackSlotOrReMat, AliasRC);
684               // Any stores to this stack slot are not dead anymore.
685               MaybeDeadStores[NewOp.StackSlotOrReMat] = NULL;            
686               ++NumLoads;
687             }
688             Spills.ClobberPhysReg(NewPhysReg);
689             Spills.ClobberPhysReg(NewOp.PhysRegReused);
690             
691             MI->getOperand(NewOp.Operand).setReg(NewPhysReg);
692             
693             Spills.addAvailable(NewOp.StackSlotOrReMat, MI, NewPhysReg);
694             MachineBasicBlock::iterator MII = MI;
695             --MII;
696             UpdateKills(*MII, RegKills, KillOps);
697             DOUT << '\t' << *MII;
698             
699             DOUT << "Reuse undone!\n";
700             --NumReused;
701             
702             // Finally, PhysReg is now available, go ahead and use it.
703             return PhysReg;
704           }
705         }
706       }
707       return PhysReg;
708     }
709
710     /// GetRegForReload - Helper for the above GetRegForReload(). Add a
711     /// 'Rejected' set to remember which registers have been considered and
712     /// rejected for the reload. This avoids infinite looping in case like
713     /// this:
714     /// t1 := op t2, t3
715     /// t2 <- assigned r0 for use by the reload but ended up reuse r1
716     /// t3 <- assigned r1 for use by the reload but ended up reuse r0
717     /// t1 <- desires r1
718     ///       sees r1 is taken by t2, tries t2's reload register r0
719     ///       sees r0 is taken by t3, tries t3's reload register r1
720     ///       sees r1 is taken by t2, tries t2's reload register r0 ...
721     unsigned GetRegForReload(unsigned PhysReg, MachineInstr *MI,
722                              AvailableSpills &Spills,
723                              std::vector<MachineInstr*> &MaybeDeadStores,
724                              BitVector &RegKills,
725                              std::vector<MachineOperand*> &KillOps,
726                              VirtRegMap &VRM) {
727       SmallSet<unsigned, 8> Rejected;
728       return GetRegForReload(PhysReg, MI, Spills, MaybeDeadStores, Rejected,
729                              RegKills, KillOps, VRM);
730     }
731   };
732 }
733
734 /// PrepForUnfoldOpti - Turn a store folding instruction into a load folding
735 /// instruction. e.g.
736 ///     xorl  %edi, %eax
737 ///     movl  %eax, -32(%ebp)
738 ///     movl  -36(%ebp), %eax
739 ///     orl   %eax, -32(%ebp)
740 /// ==>
741 ///     xorl  %edi, %eax
742 ///     orl   -36(%ebp), %eax
743 ///     mov   %eax, -32(%ebp)
744 /// This enables unfolding optimization for a subsequent instruction which will
745 /// also eliminate the newly introduced store instruction.
746 bool LocalSpiller::PrepForUnfoldOpti(MachineBasicBlock &MBB,
747                                      MachineBasicBlock::iterator &MII,
748                                     std::vector<MachineInstr*> &MaybeDeadStores,
749                                      AvailableSpills &Spills,
750                                      BitVector &RegKills,
751                                      std::vector<MachineOperand*> &KillOps,
752                                      VirtRegMap &VRM) {
753   MachineFunction &MF = *MBB.getParent();
754   MachineInstr &MI = *MII;
755   unsigned UnfoldedOpc = 0;
756   unsigned UnfoldPR = 0;
757   unsigned UnfoldVR = 0;
758   int FoldedSS = VirtRegMap::NO_STACK_SLOT;
759   VirtRegMap::MI2VirtMapTy::const_iterator I, End;
760   for (tie(I, End) = VRM.getFoldedVirts(&MI); I != End; ++I) {
761     // Only transform a MI that folds a single register.
762     if (UnfoldedOpc)
763       return false;
764     UnfoldVR = I->second.first;
765     VirtRegMap::ModRef MR = I->second.second;
766     if (VRM.isAssignedReg(UnfoldVR))
767       continue;
768     // If this reference is not a use, any previous store is now dead.
769     // Otherwise, the store to this stack slot is not dead anymore.
770     FoldedSS = VRM.getStackSlot(UnfoldVR);
771     MachineInstr* DeadStore = MaybeDeadStores[FoldedSS];
772     if (DeadStore && (MR & VirtRegMap::isModRef)) {
773       unsigned PhysReg = Spills.getSpillSlotOrReMatPhysReg(FoldedSS);
774       if (!PhysReg ||
775           DeadStore->findRegisterUseOperandIdx(PhysReg, true) == -1)
776         continue;
777       UnfoldPR = PhysReg;
778       UnfoldedOpc = MRI->getOpcodeAfterMemoryUnfold(MI.getOpcode(),
779                                                     false, true);
780     }
781   }
782
783   if (!UnfoldedOpc)
784     return false;
785
786   for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
787     MachineOperand &MO = MI.getOperand(i);
788     if (!MO.isRegister() || MO.getReg() == 0 || !MO.isUse())
789       continue;
790     unsigned VirtReg = MO.getReg();
791     if (MRegisterInfo::isPhysicalRegister(VirtReg) || MO.getSubReg())
792       continue;
793     if (VRM.isAssignedReg(VirtReg)) {
794       unsigned PhysReg = VRM.getPhys(VirtReg);
795       if (PhysReg && MRI->regsOverlap(PhysReg, UnfoldPR))
796         return false;
797     } else if (VRM.isReMaterialized(VirtReg))
798       continue;
799     int SS = VRM.getStackSlot(VirtReg);
800     unsigned PhysReg = Spills.getSpillSlotOrReMatPhysReg(SS);
801     if (PhysReg) {
802       if (MRI->regsOverlap(PhysReg, UnfoldPR))
803         return false;
804       continue;
805     }
806     PhysReg = VRM.getPhys(VirtReg);
807     if (!MRI->regsOverlap(PhysReg, UnfoldPR))
808       continue;
809
810     // Ok, we'll need to reload the value into a register which makes
811     // it impossible to perform the store unfolding optimization later.
812     // Let's see if it is possible to fold the load if the store is
813     // unfolded. This allows us to perform the store unfolding
814     // optimization.
815     SmallVector<MachineInstr*, 4> NewMIs;
816     if (MRI->unfoldMemoryOperand(MF, &MI, UnfoldVR, false, false, NewMIs)) {
817       assert(NewMIs.size() == 1);
818       MachineInstr *NewMI = NewMIs.back();
819       NewMIs.clear();
820       int Idx = NewMI->findRegisterUseOperandIdx(VirtReg);
821       assert(Idx != -1);
822       SmallVector<unsigned, 2> Ops;
823       Ops.push_back(Idx);
824       MachineInstr *FoldedMI = MRI->foldMemoryOperand(NewMI, Ops, SS);
825       if (FoldedMI) {
826         if (!VRM.hasPhys(UnfoldVR))
827           VRM.assignVirt2Phys(UnfoldVR, UnfoldPR);
828         VRM.virtFolded(VirtReg, FoldedMI, VirtRegMap::isRef);
829         MII = MBB.insert(MII, FoldedMI);
830         VRM.RemoveMachineInstrFromMaps(&MI);
831         MBB.erase(&MI);
832         return true;
833       }
834       delete NewMI;
835     }
836   }
837   return false;
838 }
839
840 /// findSuperReg - Find the SubReg's super-register of given register class
841 /// where its SubIdx sub-register is SubReg.
842 static unsigned findSuperReg(const TargetRegisterClass *RC, unsigned SubReg,
843                              unsigned SubIdx, const MRegisterInfo *MRI) {
844   for (TargetRegisterClass::iterator I = RC->begin(), E = RC->end();
845        I != E; ++I) {
846     unsigned Reg = *I;
847     if (MRI->getSubReg(Reg, SubIdx) == SubReg)
848       return Reg;
849   }
850   return 0;
851 }
852
853 /// SpillRegToStackSlot - Spill a register to a specified stack slot. Check if
854 /// the last store to the same slot is now dead. If so, remove the last store.
855 void LocalSpiller::SpillRegToStackSlot(MachineBasicBlock &MBB,
856                                   MachineBasicBlock::iterator &MII,
857                                   int Idx, unsigned PhysReg, int StackSlot,
858                                   const TargetRegisterClass *RC,
859                                   bool isAvailable, MachineInstr *&LastStore,
860                                   AvailableSpills &Spills,
861                                   SmallSet<MachineInstr*, 4> &ReMatDefs,
862                                   BitVector &RegKills,
863                                   std::vector<MachineOperand*> &KillOps,
864                                   VirtRegMap &VRM) {
865   MRI->storeRegToStackSlot(MBB, next(MII), PhysReg, true, StackSlot, RC);
866   DOUT << "Store:\t" << *next(MII);
867
868   // If there is a dead store to this stack slot, nuke it now.
869   if (LastStore) {
870     DOUT << "Removed dead store:\t" << *LastStore;
871     ++NumDSE;
872     SmallVector<unsigned, 2> KillRegs;
873     InvalidateKills(*LastStore, RegKills, KillOps, &KillRegs);
874     MachineBasicBlock::iterator PrevMII = LastStore;
875     bool CheckDef = PrevMII != MBB.begin();
876     if (CheckDef)
877       --PrevMII;
878     MBB.erase(LastStore);
879     VRM.RemoveMachineInstrFromMaps(LastStore);
880     if (CheckDef) {
881       // Look at defs of killed registers on the store. Mark the defs
882       // as dead since the store has been deleted and they aren't
883       // being reused.
884       for (unsigned j = 0, ee = KillRegs.size(); j != ee; ++j) {
885         bool HasOtherDef = false;
886         if (InvalidateRegDef(PrevMII, *MII, KillRegs[j], HasOtherDef)) {
887           MachineInstr *DeadDef = PrevMII;
888           if (ReMatDefs.count(DeadDef) && !HasOtherDef) {
889             // FIXME: This assumes a remat def does not have side
890             // effects.
891             MBB.erase(DeadDef);
892             VRM.RemoveMachineInstrFromMaps(DeadDef);
893             ++NumDRM;
894           }
895         }
896       }
897     }
898   }
899
900   LastStore = next(MII);
901
902   // If the stack slot value was previously available in some other
903   // register, change it now.  Otherwise, make the register available,
904   // in PhysReg.
905   Spills.ModifyStackSlotOrReMat(StackSlot);
906   Spills.ClobberPhysReg(PhysReg);
907   Spills.addAvailable(StackSlot, LastStore, PhysReg, isAvailable);
908   ++NumStores;
909 }
910
911 /// rewriteMBB - Keep track of which spills are available even after the
912 /// register allocator is done with them.  If possible, avid reloading vregs.
913 void LocalSpiller::RewriteMBB(MachineBasicBlock &MBB, VirtRegMap &VRM) {
914   DOUT << MBB.getBasicBlock()->getName() << ":\n";
915
916   MachineFunction &MF = *MBB.getParent();
917
918   // Spills - Keep track of which spilled values are available in physregs so
919   // that we can choose to reuse the physregs instead of emitting reloads.
920   AvailableSpills Spills(MRI, TII);
921   
922   // MaybeDeadStores - When we need to write a value back into a stack slot,
923   // keep track of the inserted store.  If the stack slot value is never read
924   // (because the value was used from some available register, for example), and
925   // subsequently stored to, the original store is dead.  This map keeps track
926   // of inserted stores that are not used.  If we see a subsequent store to the
927   // same stack slot, the original store is deleted.
928   std::vector<MachineInstr*> MaybeDeadStores;
929   MaybeDeadStores.resize(MF.getFrameInfo()->getObjectIndexEnd(), NULL);
930
931   // ReMatDefs - These are rematerializable def MIs which are not deleted.
932   SmallSet<MachineInstr*, 4> ReMatDefs;
933
934   // Keep track of kill information.
935   BitVector RegKills(MRI->getNumRegs());
936   std::vector<MachineOperand*>  KillOps;
937   KillOps.resize(MRI->getNumRegs(), NULL);
938
939   for (MachineBasicBlock::iterator MII = MBB.begin(), E = MBB.end();
940        MII != E; ) {
941     MachineBasicBlock::iterator NextMII = MII; ++NextMII;
942
943     VirtRegMap::MI2VirtMapTy::const_iterator I, End;
944     bool Erased = false;
945     bool BackTracked = false;
946     if (PrepForUnfoldOpti(MBB, MII,
947                           MaybeDeadStores, Spills, RegKills, KillOps, VRM))
948       NextMII = next(MII);
949
950     MachineInstr &MI = *MII;
951     const TargetInstrDescriptor *TID = MI.getInstrDescriptor();
952
953     // Insert restores here if asked to.
954     if (VRM.isRestorePt(&MI)) {
955       std::vector<unsigned> &RestoreRegs = VRM.getRestorePtRestores(&MI);
956       for (unsigned i = 0, e = RestoreRegs.size(); i != e; ++i) {
957         unsigned VirtReg = RestoreRegs[i];
958         if (!VRM.getPreSplitReg(VirtReg))
959           continue; // Split interval spilled again.
960         unsigned Phys = VRM.getPhys(VirtReg);
961         MF.setPhysRegUsed(Phys);
962         if (VRM.isReMaterialized(VirtReg)) {
963           MRI->reMaterialize(MBB, &MI, Phys,
964                              VRM.getReMaterializedMI(VirtReg));
965           ++NumReMats;
966         } else {
967           const TargetRegisterClass* RC = RegMap->getRegClass(VirtReg);
968           MRI->loadRegFromStackSlot(MBB, &MI, Phys, VRM.getStackSlot(VirtReg), RC);
969           ++NumLoads;
970         }
971         // This invalidates Phys.
972         Spills.ClobberPhysReg(Phys);
973         UpdateKills(*prior(MII), RegKills, KillOps);
974         DOUT << '\t' << *prior(MII);
975       }
976     }
977
978     // Insert spills here if asked to.
979     if (VRM.isSpillPt(&MI)) {
980       std::vector<unsigned> &SpillRegs = VRM.getSpillPtSpills(&MI);
981       for (unsigned i = 0, e = SpillRegs.size(); i != e; ++i) {
982         unsigned VirtReg = SpillRegs[i];
983         if (!VRM.getPreSplitReg(VirtReg))
984           continue; // Split interval spilled again.
985         const TargetRegisterClass *RC = RegMap->getRegClass(VirtReg);
986         unsigned Phys = VRM.getPhys(VirtReg);
987         int StackSlot = VRM.getStackSlot(VirtReg);
988         MRI->storeRegToStackSlot(MBB, next(MII), Phys, false, StackSlot, RC);
989         MachineInstr *StoreMI = next(MII);
990         DOUT << "Store:\t" << StoreMI;
991         VRM.virtFolded(VirtReg, StoreMI, VirtRegMap::isMod);
992       }
993       NextMII = next(MII);
994     }
995
996     /// ReusedOperands - Keep track of operand reuse in case we need to undo
997     /// reuse.
998     ReuseInfo ReusedOperands(MI, MRI);
999     // Process all of the spilled uses and all non spilled reg references.
1000     for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
1001       MachineOperand &MO = MI.getOperand(i);
1002       if (!MO.isRegister() || MO.getReg() == 0)
1003         continue;   // Ignore non-register operands.
1004       
1005       unsigned VirtReg = MO.getReg();
1006       if (MRegisterInfo::isPhysicalRegister(VirtReg)) {
1007         // Ignore physregs for spilling, but remember that it is used by this
1008         // function.
1009         MF.setPhysRegUsed(VirtReg);
1010         continue;
1011       }
1012       
1013       assert(MRegisterInfo::isVirtualRegister(VirtReg) &&
1014              "Not a virtual or a physical register?");
1015
1016       unsigned SubIdx = MO.getSubReg();
1017       if (VRM.isAssignedReg(VirtReg)) {
1018         // This virtual register was assigned a physreg!
1019         unsigned Phys = VRM.getPhys(VirtReg);
1020         MF.setPhysRegUsed(Phys);
1021         if (MO.isDef())
1022           ReusedOperands.markClobbered(Phys);
1023         unsigned RReg = SubIdx ? MRI->getSubReg(Phys, SubIdx) : Phys;
1024         MI.getOperand(i).setReg(RReg);
1025         continue;
1026       }
1027       
1028       // This virtual register is now known to be a spilled value.
1029       if (!MO.isUse())
1030         continue;  // Handle defs in the loop below (handle use&def here though)
1031
1032       bool DoReMat = VRM.isReMaterialized(VirtReg);
1033       int SSorRMId = DoReMat
1034         ? VRM.getReMatId(VirtReg) : VRM.getStackSlot(VirtReg);
1035       int ReuseSlot = SSorRMId;
1036
1037       // Check to see if this stack slot is available.
1038       unsigned PhysReg = Spills.getSpillSlotOrReMatPhysReg(SSorRMId);
1039
1040       // If this is a sub-register use, make sure the reuse register is in the
1041       // right register class. For example, for x86 not all of the 32-bit
1042       // registers have accessible sub-registers.
1043       // Similarly so for EXTRACT_SUBREG. Consider this:
1044       // EDI = op
1045       // MOV32_mr fi#1, EDI
1046       // ...
1047       //       = EXTRACT_SUBREG fi#1
1048       // fi#1 is available in EDI, but it cannot be reused because it's not in
1049       // the right register file.
1050       if (PhysReg &&
1051           (SubIdx || MI.getOpcode() == TargetInstrInfo::EXTRACT_SUBREG)) {
1052         const TargetRegisterClass* RC = RegMap->getRegClass(VirtReg);
1053         if (!RC->contains(PhysReg))
1054           PhysReg = 0;
1055       }
1056
1057       if (PhysReg) {
1058         // This spilled operand might be part of a two-address operand.  If this
1059         // is the case, then changing it will necessarily require changing the 
1060         // def part of the instruction as well.  However, in some cases, we
1061         // aren't allowed to modify the reused register.  If none of these cases
1062         // apply, reuse it.
1063         bool CanReuse = true;
1064         int ti = TID->getOperandConstraint(i, TOI::TIED_TO);
1065         if (ti != -1 &&
1066             MI.getOperand(ti).isRegister() && 
1067             MI.getOperand(ti).getReg() == VirtReg) {
1068           // Okay, we have a two address operand.  We can reuse this physreg as
1069           // long as we are allowed to clobber the value and there isn't an
1070           // earlier def that has already clobbered the physreg.
1071           CanReuse = Spills.canClobberPhysReg(ReuseSlot) &&
1072             !ReusedOperands.isClobbered(PhysReg);
1073         }
1074         
1075         if (CanReuse) {
1076           // If this stack slot value is already available, reuse it!
1077           if (ReuseSlot > VirtRegMap::MAX_STACK_SLOT)
1078             DOUT << "Reusing RM#" << ReuseSlot-VirtRegMap::MAX_STACK_SLOT-1;
1079           else
1080             DOUT << "Reusing SS#" << ReuseSlot;
1081           DOUT << " from physreg "
1082                << MRI->getName(PhysReg) << " for vreg"
1083                << VirtReg <<" instead of reloading into physreg "
1084                << MRI->getName(VRM.getPhys(VirtReg)) << "\n";
1085           unsigned RReg = SubIdx ? MRI->getSubReg(PhysReg, SubIdx) : PhysReg;
1086           MI.getOperand(i).setReg(RReg);
1087
1088           // The only technical detail we have is that we don't know that
1089           // PhysReg won't be clobbered by a reloaded stack slot that occurs
1090           // later in the instruction.  In particular, consider 'op V1, V2'.
1091           // If V1 is available in physreg R0, we would choose to reuse it
1092           // here, instead of reloading it into the register the allocator
1093           // indicated (say R1).  However, V2 might have to be reloaded
1094           // later, and it might indicate that it needs to live in R0.  When
1095           // this occurs, we need to have information available that
1096           // indicates it is safe to use R1 for the reload instead of R0.
1097           //
1098           // To further complicate matters, we might conflict with an alias,
1099           // or R0 and R1 might not be compatible with each other.  In this
1100           // case, we actually insert a reload for V1 in R1, ensuring that
1101           // we can get at R0 or its alias.
1102           ReusedOperands.addReuse(i, ReuseSlot, PhysReg,
1103                                   VRM.getPhys(VirtReg), VirtReg);
1104           if (ti != -1)
1105             // Only mark it clobbered if this is a use&def operand.
1106             ReusedOperands.markClobbered(PhysReg);
1107           ++NumReused;
1108
1109           if (MI.getOperand(i).isKill() &&
1110               ReuseSlot <= VirtRegMap::MAX_STACK_SLOT) {
1111             // This was the last use and the spilled value is still available
1112             // for reuse. That means the spill was unnecessary!
1113             MachineInstr* DeadStore = MaybeDeadStores[ReuseSlot];
1114             if (DeadStore) {
1115               DOUT << "Removed dead store:\t" << *DeadStore;
1116               InvalidateKills(*DeadStore, RegKills, KillOps);
1117               VRM.RemoveMachineInstrFromMaps(DeadStore);
1118               MBB.erase(DeadStore);
1119               MaybeDeadStores[ReuseSlot] = NULL;
1120               ++NumDSE;
1121             }
1122           }
1123           continue;
1124         }  // CanReuse
1125         
1126         // Otherwise we have a situation where we have a two-address instruction
1127         // whose mod/ref operand needs to be reloaded.  This reload is already
1128         // available in some register "PhysReg", but if we used PhysReg as the
1129         // operand to our 2-addr instruction, the instruction would modify
1130         // PhysReg.  This isn't cool if something later uses PhysReg and expects
1131         // to get its initial value.
1132         //
1133         // To avoid this problem, and to avoid doing a load right after a store,
1134         // we emit a copy from PhysReg into the designated register for this
1135         // operand.
1136         unsigned DesignatedReg = VRM.getPhys(VirtReg);
1137         assert(DesignatedReg && "Must map virtreg to physreg!");
1138
1139         // Note that, if we reused a register for a previous operand, the
1140         // register we want to reload into might not actually be
1141         // available.  If this occurs, use the register indicated by the
1142         // reuser.
1143         if (ReusedOperands.hasReuses())
1144           DesignatedReg = ReusedOperands.GetRegForReload(DesignatedReg, &MI, 
1145                                Spills, MaybeDeadStores, RegKills, KillOps, VRM);
1146         
1147         // If the mapped designated register is actually the physreg we have
1148         // incoming, we don't need to inserted a dead copy.
1149         if (DesignatedReg == PhysReg) {
1150           // If this stack slot value is already available, reuse it!
1151           if (ReuseSlot > VirtRegMap::MAX_STACK_SLOT)
1152             DOUT << "Reusing RM#" << ReuseSlot-VirtRegMap::MAX_STACK_SLOT-1;
1153           else
1154             DOUT << "Reusing SS#" << ReuseSlot;
1155           DOUT << " from physreg " << MRI->getName(PhysReg) << " for vreg"
1156                << VirtReg
1157                << " instead of reloading into same physreg.\n";
1158           unsigned RReg = SubIdx ? MRI->getSubReg(PhysReg, SubIdx) : PhysReg;
1159           MI.getOperand(i).setReg(RReg);
1160           ReusedOperands.markClobbered(RReg);
1161           ++NumReused;
1162           continue;
1163         }
1164         
1165         const TargetRegisterClass* RC = RegMap->getRegClass(VirtReg);
1166         MF.setPhysRegUsed(DesignatedReg);
1167         ReusedOperands.markClobbered(DesignatedReg);
1168         MRI->copyRegToReg(MBB, &MI, DesignatedReg, PhysReg, RC, RC);
1169
1170         MachineInstr *CopyMI = prior(MII);
1171         UpdateKills(*CopyMI, RegKills, KillOps);
1172
1173         // This invalidates DesignatedReg.
1174         Spills.ClobberPhysReg(DesignatedReg);
1175         
1176         Spills.addAvailable(ReuseSlot, &MI, DesignatedReg);
1177         unsigned RReg =
1178           SubIdx ? MRI->getSubReg(DesignatedReg, SubIdx) : DesignatedReg;
1179         MI.getOperand(i).setReg(RReg);
1180         DOUT << '\t' << *prior(MII);
1181         ++NumReused;
1182         continue;
1183       } // if (PhysReg)
1184       
1185       // Otherwise, reload it and remember that we have it.
1186       PhysReg = VRM.getPhys(VirtReg);
1187       assert(PhysReg && "Must map virtreg to physreg!");
1188
1189       // Note that, if we reused a register for a previous operand, the
1190       // register we want to reload into might not actually be
1191       // available.  If this occurs, use the register indicated by the
1192       // reuser.
1193       if (ReusedOperands.hasReuses())
1194         PhysReg = ReusedOperands.GetRegForReload(PhysReg, &MI, 
1195                                Spills, MaybeDeadStores, RegKills, KillOps, VRM);
1196       
1197       MF.setPhysRegUsed(PhysReg);
1198       ReusedOperands.markClobbered(PhysReg);
1199       if (DoReMat) {
1200         MRI->reMaterialize(MBB, &MI, PhysReg, VRM.getReMaterializedMI(VirtReg));
1201         ++NumReMats;
1202       } else {
1203         const TargetRegisterClass* RC = RegMap->getRegClass(VirtReg);
1204         MRI->loadRegFromStackSlot(MBB, &MI, PhysReg, SSorRMId, RC);
1205         ++NumLoads;
1206       }
1207       // This invalidates PhysReg.
1208       Spills.ClobberPhysReg(PhysReg);
1209
1210       // Any stores to this stack slot are not dead anymore.
1211       if (!DoReMat)
1212         MaybeDeadStores[SSorRMId] = NULL;
1213       Spills.addAvailable(SSorRMId, &MI, PhysReg);
1214       // Assumes this is the last use. IsKill will be unset if reg is reused
1215       // unless it's a two-address operand.
1216       if (TID->getOperandConstraint(i, TOI::TIED_TO) == -1)
1217         MI.getOperand(i).setIsKill();
1218       unsigned RReg = SubIdx ? MRI->getSubReg(PhysReg, SubIdx) : PhysReg;
1219       MI.getOperand(i).setReg(RReg);
1220       UpdateKills(*prior(MII), RegKills, KillOps);
1221       DOUT << '\t' << *prior(MII);
1222     }
1223
1224     DOUT << '\t' << MI;
1225
1226
1227     // If we have folded references to memory operands, make sure we clear all
1228     // physical registers that may contain the value of the spilled virtual
1229     // register
1230     SmallSet<int, 2> FoldedSS;
1231     for (tie(I, End) = VRM.getFoldedVirts(&MI); I != End; ++I) {
1232       unsigned VirtReg = I->second.first;
1233       VirtRegMap::ModRef MR = I->second.second;
1234       DOUT << "Folded vreg: " << VirtReg << "  MR: " << MR;
1235
1236       int SS = VRM.getStackSlot(VirtReg);
1237       if (SS == VirtRegMap::NO_STACK_SLOT)
1238         continue;
1239       FoldedSS.insert(SS);
1240       DOUT << " - StackSlot: " << SS << "\n";
1241       
1242       // If this folded instruction is just a use, check to see if it's a
1243       // straight load from the virt reg slot.
1244       if ((MR & VirtRegMap::isRef) && !(MR & VirtRegMap::isMod)) {
1245         int FrameIdx;
1246         unsigned DestReg = TII->isLoadFromStackSlot(&MI, FrameIdx);
1247         if (DestReg && FrameIdx == SS) {
1248           // If this spill slot is available, turn it into a copy (or nothing)
1249           // instead of leaving it as a load!
1250           if (unsigned InReg = Spills.getSpillSlotOrReMatPhysReg(SS)) {
1251             DOUT << "Promoted Load To Copy: " << MI;
1252             if (DestReg != InReg) {
1253               const TargetRegisterClass *RC = RegMap->getRegClass(VirtReg);
1254               MRI->copyRegToReg(MBB, &MI, DestReg, InReg, RC, RC);
1255               // Revisit the copy so we make sure to notice the effects of the
1256               // operation on the destreg (either needing to RA it if it's 
1257               // virtual or needing to clobber any values if it's physical).
1258               NextMII = &MI;
1259               --NextMII;  // backtrack to the copy.
1260               BackTracked = true;
1261             } else
1262               DOUT << "Removing now-noop copy: " << MI;
1263
1264             VRM.RemoveMachineInstrFromMaps(&MI);
1265             MBB.erase(&MI);
1266             Erased = true;
1267             goto ProcessNextInst;
1268           }
1269         } else {
1270           unsigned PhysReg = Spills.getSpillSlotOrReMatPhysReg(SS);
1271           SmallVector<MachineInstr*, 4> NewMIs;
1272           if (PhysReg &&
1273               MRI->unfoldMemoryOperand(MF, &MI, PhysReg, false, false, NewMIs)) {
1274             MBB.insert(MII, NewMIs[0]);
1275             VRM.RemoveMachineInstrFromMaps(&MI);
1276             MBB.erase(&MI);
1277             Erased = true;
1278             --NextMII;  // backtrack to the unfolded instruction.
1279             BackTracked = true;
1280             goto ProcessNextInst;
1281           }
1282         }
1283       }
1284
1285       // If this reference is not a use, any previous store is now dead.
1286       // Otherwise, the store to this stack slot is not dead anymore.
1287       MachineInstr* DeadStore = MaybeDeadStores[SS];
1288       if (DeadStore) {
1289         bool isDead = !(MR & VirtRegMap::isRef);
1290         MachineInstr *NewStore = NULL;
1291         if (MR & VirtRegMap::isModRef) {
1292           unsigned PhysReg = Spills.getSpillSlotOrReMatPhysReg(SS);
1293           SmallVector<MachineInstr*, 4> NewMIs;
1294           // We can reuse this physreg as long as we are allowed to clobber
1295           // the value and there isn't an earlier def that has already clobbered the
1296           // physreg.
1297           if (PhysReg &&
1298               DeadStore->findRegisterUseOperandIdx(PhysReg, true) != -1 &&
1299               MRI->unfoldMemoryOperand(MF, &MI, PhysReg, false, true, NewMIs)) {
1300             MBB.insert(MII, NewMIs[0]);
1301             NewStore = NewMIs[1];
1302             MBB.insert(MII, NewStore);
1303             VRM.RemoveMachineInstrFromMaps(&MI);
1304             MBB.erase(&MI);
1305             Erased = true;
1306             --NextMII;
1307             --NextMII;  // backtrack to the unfolded instruction.
1308             BackTracked = true;
1309             isDead = true;
1310           }
1311         }
1312
1313         if (isDead) {  // Previous store is dead.
1314           // If we get here, the store is dead, nuke it now.
1315           DOUT << "Removed dead store:\t" << *DeadStore;
1316           InvalidateKills(*DeadStore, RegKills, KillOps);
1317           VRM.RemoveMachineInstrFromMaps(DeadStore);
1318           MBB.erase(DeadStore);
1319           if (!NewStore)
1320             ++NumDSE;
1321         }
1322
1323         MaybeDeadStores[SS] = NULL;
1324         if (NewStore) {
1325           // Treat this store as a spill merged into a copy. That makes the
1326           // stack slot value available.
1327           VRM.virtFolded(VirtReg, NewStore, VirtRegMap::isMod);
1328           goto ProcessNextInst;
1329         }
1330       }
1331
1332       // If the spill slot value is available, and this is a new definition of
1333       // the value, the value is not available anymore.
1334       if (MR & VirtRegMap::isMod) {
1335         // Notice that the value in this stack slot has been modified.
1336         Spills.ModifyStackSlotOrReMat(SS);
1337         
1338         // If this is *just* a mod of the value, check to see if this is just a
1339         // store to the spill slot (i.e. the spill got merged into the copy). If
1340         // so, realize that the vreg is available now, and add the store to the
1341         // MaybeDeadStore info.
1342         int StackSlot;
1343         if (!(MR & VirtRegMap::isRef)) {
1344           if (unsigned SrcReg = TII->isStoreToStackSlot(&MI, StackSlot)) {
1345             assert(MRegisterInfo::isPhysicalRegister(SrcReg) &&
1346                    "Src hasn't been allocated yet?");
1347             // Okay, this is certainly a store of SrcReg to [StackSlot].  Mark
1348             // this as a potentially dead store in case there is a subsequent
1349             // store into the stack slot without a read from it.
1350             MaybeDeadStores[StackSlot] = &MI;
1351
1352             // If the stack slot value was previously available in some other
1353             // register, change it now.  Otherwise, make the register available,
1354             // in PhysReg.
1355             Spills.addAvailable(StackSlot, &MI, SrcReg, false/*don't clobber*/);
1356           }
1357         }
1358       }
1359     }
1360
1361     // Process all of the spilled defs.
1362     for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
1363       MachineOperand &MO = MI.getOperand(i);
1364       if (!(MO.isRegister() && MO.getReg() && MO.isDef()))
1365         continue;
1366
1367       unsigned VirtReg = MO.getReg();
1368       if (!MRegisterInfo::isVirtualRegister(VirtReg)) {
1369         // Check to see if this is a noop copy.  If so, eliminate the
1370         // instruction before considering the dest reg to be changed.
1371         unsigned Src, Dst;
1372         if (TII->isMoveInstr(MI, Src, Dst) && Src == Dst) {
1373           ++NumDCE;
1374           DOUT << "Removing now-noop copy: " << MI;
1375           MBB.erase(&MI);
1376           Erased = true;
1377           VRM.RemoveMachineInstrFromMaps(&MI);
1378           Spills.disallowClobberPhysReg(VirtReg);
1379           goto ProcessNextInst;
1380         }
1381           
1382         // If it's not a no-op copy, it clobbers the value in the destreg.
1383         Spills.ClobberPhysReg(VirtReg);
1384         ReusedOperands.markClobbered(VirtReg);
1385  
1386         // Check to see if this instruction is a load from a stack slot into
1387         // a register.  If so, this provides the stack slot value in the reg.
1388         int FrameIdx;
1389         if (unsigned DestReg = TII->isLoadFromStackSlot(&MI, FrameIdx)) {
1390           assert(DestReg == VirtReg && "Unknown load situation!");
1391
1392           // If it is a folded reference, then it's not safe to clobber.
1393           bool Folded = FoldedSS.count(FrameIdx);
1394           // Otherwise, if it wasn't available, remember that it is now!
1395           Spills.addAvailable(FrameIdx, &MI, DestReg, !Folded);
1396           goto ProcessNextInst;
1397         }
1398             
1399         continue;
1400       }
1401
1402       unsigned SubIdx = MO.getSubReg();
1403       bool DoReMat = VRM.isReMaterialized(VirtReg);
1404       if (DoReMat)
1405         ReMatDefs.insert(&MI);
1406
1407       // The only vregs left are stack slot definitions.
1408       int StackSlot = VRM.getStackSlot(VirtReg);
1409       const TargetRegisterClass *RC = RegMap->getRegClass(VirtReg);
1410
1411       // If this def is part of a two-address operand, make sure to execute
1412       // the store from the correct physical register.
1413       unsigned PhysReg;
1414       int TiedOp = MI.getInstrDescriptor()->findTiedToSrcOperand(i);
1415       if (TiedOp != -1) {
1416         PhysReg = MI.getOperand(TiedOp).getReg();
1417         if (SubIdx) {
1418           unsigned SuperReg = findSuperReg(RC, PhysReg, SubIdx, MRI);
1419           assert(SuperReg && MRI->getSubReg(SuperReg, SubIdx) == PhysReg &&
1420                  "Can't find corresponding super-register!");
1421           PhysReg = SuperReg;
1422         }
1423       } else {
1424         PhysReg = VRM.getPhys(VirtReg);
1425         if (ReusedOperands.isClobbered(PhysReg)) {
1426           // Another def has taken the assigned physreg. It must have been a
1427           // use&def which got it due to reuse. Undo the reuse!
1428           PhysReg = ReusedOperands.GetRegForReload(PhysReg, &MI, 
1429                                Spills, MaybeDeadStores, RegKills, KillOps, VRM);
1430         }
1431       }
1432
1433       MF.setPhysRegUsed(PhysReg);
1434       unsigned RReg = SubIdx ? MRI->getSubReg(PhysReg, SubIdx) : PhysReg;
1435       ReusedOperands.markClobbered(RReg);
1436       MI.getOperand(i).setReg(RReg);
1437
1438       if (!MO.isDead()) {
1439         MachineInstr *&LastStore = MaybeDeadStores[StackSlot];
1440         SpillRegToStackSlot(MBB, MII, -1, PhysReg, StackSlot, RC, true,
1441                           LastStore, Spills, ReMatDefs, RegKills, KillOps, VRM);
1442         NextMII = next(MII);
1443
1444         // Check to see if this is a noop copy.  If so, eliminate the
1445         // instruction before considering the dest reg to be changed.
1446         {
1447           unsigned Src, Dst;
1448           if (TII->isMoveInstr(MI, Src, Dst) && Src == Dst) {
1449             ++NumDCE;
1450             DOUT << "Removing now-noop copy: " << MI;
1451             MBB.erase(&MI);
1452             Erased = true;
1453             VRM.RemoveMachineInstrFromMaps(&MI);
1454             UpdateKills(*LastStore, RegKills, KillOps);
1455             goto ProcessNextInst;
1456           }
1457         }
1458       }    
1459     }
1460   ProcessNextInst:
1461     if (!Erased && !BackTracked) {
1462       for (MachineBasicBlock::iterator II = MI; II != NextMII; ++II)
1463         UpdateKills(*II, RegKills, KillOps);
1464     }
1465     MII = NextMII;
1466   }
1467 }
1468
1469 llvm::Spiller* llvm::createSpiller() {
1470   switch (SpillerOpt) {
1471   default: assert(0 && "Unreachable!");
1472   case local:
1473     return new LocalSpiller();
1474   case simple:
1475     return new SimpleSpiller();
1476   }
1477 }