Downwards growing stack allocation order reverses relative offsets
[oota-llvm.git] / lib / CodeGen / LocalStackSlotAllocation.cpp
1 //===- LocalStackSlotAllocation.cpp - Pre-allocate locals to stack slots --===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This pass assigns local frame indices to stack slots relative to one another
11 // and allocates additional base registers to access them when the target
12 // estimates the are likely to be out of range of stack pointer and frame
13 // pointer relative addressing.
14 //
15 //===----------------------------------------------------------------------===//
16
17 #define DEBUG_TYPE "localstackalloc"
18 #include "llvm/Constants.h"
19 #include "llvm/DerivedTypes.h"
20 #include "llvm/Instructions.h"
21 #include "llvm/Intrinsics.h"
22 #include "llvm/LLVMContext.h"
23 #include "llvm/Module.h"
24 #include "llvm/Pass.h"
25 #include "llvm/ADT/SmallSet.h"
26 #include "llvm/ADT/Statistic.h"
27 #include "llvm/CodeGen/MachineFrameInfo.h"
28 #include "llvm/CodeGen/MachineFunction.h"
29 #include "llvm/CodeGen/MachineFunctionPass.h"
30 #include "llvm/CodeGen/MachineRegisterInfo.h"
31 #include "llvm/CodeGen/Passes.h"
32 #include "llvm/Support/Debug.h"
33 #include "llvm/Support/ErrorHandling.h"
34 #include "llvm/Support/raw_ostream.h"
35 #include "llvm/Target/TargetRegisterInfo.h"
36 #include "llvm/Target/TargetFrameInfo.h"
37
38 using namespace llvm;
39
40 STATISTIC(NumAllocations, "Number of frame indices allocated into local block");
41 STATISTIC(NumBaseRegisters, "Number of virtual frame base registers allocated");
42 STATISTIC(NumReplacements, "Number of frame indices references replaced");
43
44 namespace {
45   class LocalStackSlotPass: public MachineFunctionPass {
46     SmallVector<int64_t,16> LocalOffsets;
47
48     void AdjustStackOffset(MachineFrameInfo *MFI, int FrameIdx, int64_t &Offset,
49                            unsigned &MaxAlign);
50     void calculateFrameObjectOffsets(MachineFunction &Fn);
51     bool insertFrameReferenceRegisters(MachineFunction &Fn);
52   public:
53     static char ID; // Pass identification, replacement for typeid
54     explicit LocalStackSlotPass() : MachineFunctionPass(ID) { }
55     bool runOnMachineFunction(MachineFunction &MF);
56
57     virtual void getAnalysisUsage(AnalysisUsage &AU) const {
58       AU.setPreservesCFG();
59       MachineFunctionPass::getAnalysisUsage(AU);
60     }
61     const char *getPassName() const {
62       return "Local Stack Slot Allocation";
63     }
64
65   private:
66   };
67 } // end anonymous namespace
68
69 char LocalStackSlotPass::ID = 0;
70
71 FunctionPass *llvm::createLocalStackSlotAllocationPass() {
72   return new LocalStackSlotPass();
73 }
74
75 bool LocalStackSlotPass::runOnMachineFunction(MachineFunction &MF) {
76   MachineFrameInfo *MFI = MF.getFrameInfo();
77   unsigned LocalObjectCount = MFI->getObjectIndexEnd();
78
79   // Early exit if there are no locals to consider
80   if (!LocalObjectCount)
81     return true;
82
83   // Make sure we have enough space to store the local offsets.
84   LocalOffsets.resize(MFI->getObjectIndexEnd());
85
86   // Lay out the local blob.
87   calculateFrameObjectOffsets(MF);
88
89   // Insert virtual base registers to resolve frame index references.
90   bool UsedBaseRegs = insertFrameReferenceRegisters(MF);
91
92   // Tell MFI whether any base registers were allocated. PEI will only
93   // want to use the local block allocations from this pass if there were any.
94   // Otherwise, PEI can do a bit better job of getting the alignment right
95   // without a hole at the start since it knows the alignment of the stack
96   // at the start of local allocation, and this pass doesn't.
97   MFI->setUseLocalStackAllocationBlock(UsedBaseRegs);
98
99   return true;
100 }
101
102 /// AdjustStackOffset - Helper function used to adjust the stack frame offset.
103 void LocalStackSlotPass::AdjustStackOffset(MachineFrameInfo *MFI,
104                                            int FrameIdx, int64_t &Offset,
105                                            unsigned &MaxAlign) {
106   unsigned Align = MFI->getObjectAlignment(FrameIdx);
107
108   // If the alignment of this object is greater than that of the stack, then
109   // increase the stack alignment to match.
110   MaxAlign = std::max(MaxAlign, Align);
111
112   // Adjust to alignment boundary.
113   Offset = (Offset + Align - 1) / Align * Align;
114
115   DEBUG(dbgs() << "Allocate FI(" << FrameIdx << ") to local offset "
116         << Offset << "\n");
117   // Keep the offset available for base register allocation
118   LocalOffsets[FrameIdx] = Offset;
119   // And tell MFI about it for PEI to use later
120   MFI->mapLocalFrameObject(FrameIdx, Offset);
121   Offset += MFI->getObjectSize(FrameIdx);
122
123   ++NumAllocations;
124 }
125
126 /// calculateFrameObjectOffsets - Calculate actual frame offsets for all of the
127 /// abstract stack objects.
128 ///
129 void LocalStackSlotPass::calculateFrameObjectOffsets(MachineFunction &Fn) {
130   // Loop over all of the stack objects, assigning sequential addresses...
131   MachineFrameInfo *MFI = Fn.getFrameInfo();
132   int64_t Offset = 0;
133   unsigned MaxAlign = 0;
134
135   // Make sure that the stack protector comes before the local variables on the
136   // stack.
137   SmallSet<int, 16> LargeStackObjs;
138   if (MFI->getStackProtectorIndex() >= 0) {
139     AdjustStackOffset(MFI, MFI->getStackProtectorIndex(), Offset, MaxAlign);
140
141     // Assign large stack objects first.
142     for (unsigned i = 0, e = MFI->getObjectIndexEnd(); i != e; ++i) {
143       if (MFI->isDeadObjectIndex(i))
144         continue;
145       if (MFI->getStackProtectorIndex() == (int)i)
146         continue;
147       if (!MFI->MayNeedStackProtector(i))
148         continue;
149
150       AdjustStackOffset(MFI, i, Offset, MaxAlign);
151       LargeStackObjs.insert(i);
152     }
153   }
154
155   // Then assign frame offsets to stack objects that are not used to spill
156   // callee saved registers.
157   for (unsigned i = 0, e = MFI->getObjectIndexEnd(); i != e; ++i) {
158     if (MFI->isDeadObjectIndex(i))
159       continue;
160     if (MFI->getStackProtectorIndex() == (int)i)
161       continue;
162     if (LargeStackObjs.count(i))
163       continue;
164
165     AdjustStackOffset(MFI, i, Offset, MaxAlign);
166   }
167
168   // Remember how big this blob of stack space is
169   MFI->setLocalFrameSize(Offset);
170   MFI->setLocalFrameMaxAlign(MaxAlign);
171 }
172
173 static inline bool
174 lookupCandidateBaseReg(const SmallVector<std::pair<unsigned, int64_t>, 8> &Regs,
175                        std::pair<unsigned, int64_t> &RegOffset,
176                        int64_t LocalFrameOffset,
177                        bool StackGrowsDown,
178                        const MachineInstr *MI,
179                        const TargetRegisterInfo *TRI) {
180   unsigned e = Regs.size();
181   for (unsigned i = 0; i < e; ++i) {
182     RegOffset = Regs[i];
183     // Check if the relative offset from the where the base register references
184     // to the target address is in range for the instruction.
185     int64_t Offset = LocalFrameOffset - RegOffset.second;
186     if (StackGrowsDown)
187       Offset = -Offset;
188     if (TRI->isFrameOffsetLegal(MI, Offset))
189       return true;
190   }
191   return false;
192 }
193
194 bool LocalStackSlotPass::insertFrameReferenceRegisters(MachineFunction &Fn) {
195   // Scan the function's instructions looking for frame index references.
196   // For each, ask the target if it wants a virtual base register for it
197   // based on what we can tell it about where the local will end up in the
198   // stack frame. If it wants one, re-use a suitable one we've previously
199   // allocated, or if there isn't one that fits the bill, allocate a new one
200   // and ask the target to create a defining instruction for it.
201   bool UsedBaseReg = false;
202
203   MachineFrameInfo *MFI = Fn.getFrameInfo();
204   const TargetRegisterInfo *TRI = Fn.getTarget().getRegisterInfo();
205   const TargetFrameInfo &TFI = *Fn.getTarget().getFrameInfo();
206   bool StackGrowsDown =
207     TFI.getStackGrowthDirection() == TargetFrameInfo::StackGrowsDown;
208
209   for (MachineFunction::iterator BB = Fn.begin(),
210          E = Fn.end(); BB != E; ++BB) {
211     // A base register definition is a register+offset pair.
212     SmallVector<std::pair<unsigned, int64_t>, 8> BaseRegisters;
213
214     for (MachineBasicBlock::iterator I = BB->begin(); I != BB->end(); ++I) {
215       MachineInstr *MI = I;
216       // Debug value instructions can't be out of range, so they don't need
217       // any updates.
218       // FIXME: When we extend this stuff to handle functions with both
219       // VLAs and dynamic realignment, we should update the debug values
220       // to reference the new base pointer when possible.
221       if (MI->isDebugValue())
222         continue;
223
224       // For now, allocate the base register(s) within the basic block
225       // where they're used, and don't try to keep them around outside
226       // of that. It may be beneficial to try sharing them more broadly
227       // than that, but the increased register pressure makes that a
228       // tricky thing to balance. Investigate if re-materializing these
229       // becomes an issue.
230       for (unsigned i = 0, e = MI->getNumOperands(); i != e; ++i) {
231         // Consider replacing all frame index operands that reference
232         // an object allocated in the local block.
233         if (MI->getOperand(i).isFI()) {
234           int FrameIdx = MI->getOperand(i).getIndex();
235
236           // Don't try this with values not in the local block.
237           if (!MFI->isObjectPreAllocated(FrameIdx))
238             continue;
239
240           DEBUG(dbgs() << "Considering: " << *MI);
241           if (TRI->needsFrameBaseReg(MI, i)) {
242             unsigned BaseReg = 0;
243             int64_t Offset = 0;
244
245             DEBUG(dbgs() << "  Replacing FI in: " << *MI);
246
247             // If we have a suitable base register available, use it; otherwise
248             // create a new one. Note that any offset encoded in the
249             // instruction itself will be taken into account by the target,
250             // so we don't have to adjust for it here when reusing a base
251             // register.
252             std::pair<unsigned, int64_t> RegOffset;
253             if (lookupCandidateBaseReg(BaseRegisters, RegOffset,
254                                        LocalOffsets[FrameIdx],
255                                        StackGrowsDown, MI, TRI)) {
256               DEBUG(dbgs() << "  Reusing base register " <<
257                     RegOffset.first << "\n");
258               // We found a register to reuse.
259               BaseReg = RegOffset.first;
260               Offset = LocalOffsets[FrameIdx] - RegOffset.second;
261               if (StackGrowsDown)
262                 Offset = -Offset;
263             } else {
264               // No previously defined register was in range, so create a
265               // new one.
266               int64_t InstrOffset = TRI->getFrameIndexInstrOffset(MI, i);
267               const TargetRegisterClass *RC = TRI->getPointerRegClass();
268               BaseReg = Fn.getRegInfo().createVirtualRegister(RC);
269
270               DEBUG(dbgs() << "  Materializing base register " << BaseReg <<
271                     " at frame local offset " <<
272                     LocalOffsets[FrameIdx] + InstrOffset << "\n");
273               // Tell the target to insert the instruction to initialize
274               // the base register.
275               TRI->materializeFrameBaseRegister(I, BaseReg, FrameIdx,
276                                                 InstrOffset);
277
278               // The base register already includes any offset specified
279               // by the instruction, so account for that so it doesn't get
280               // applied twice.
281               Offset = -InstrOffset;
282
283               BaseRegisters.push_back(
284                 std::pair<unsigned, int64_t>(BaseReg,
285                                       LocalOffsets[FrameIdx] + InstrOffset));
286               ++NumBaseRegisters;
287               UsedBaseReg = true;
288             }
289             assert(BaseReg != 0 && "Unable to allocate virtual base register!");
290
291             // Modify the instruction to use the new base register rather
292             // than the frame index operand.
293             TRI->resolveFrameIndex(I, BaseReg, Offset);
294             DEBUG(dbgs() << "Resolved: " << *MI);
295
296             ++NumReplacements;
297           }
298
299         }
300       }
301     }
302   }
303   return UsedBaseReg;
304 }