Merge current work back to tree to minimize diffs and drift. Major highlights
[oota-llvm.git] / lib / Target / CellSPU / SPUInstrInfo.cpp
1 //===- SPUInstrInfo.cpp - Cell SPU Instruction Information ----------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file contains the Cell SPU implementation of the TargetInstrInfo class.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "SPURegisterNames.h"
15 #include "SPUInstrInfo.h"
16 #include "SPUInstrBuilder.h"
17 #include "SPUTargetMachine.h"
18 #include "SPUGenInstrInfo.inc"
19 #include "llvm/CodeGen/MachineInstrBuilder.h"
20 #include <iostream>
21
22 using namespace llvm;
23
24 SPUInstrInfo::SPUInstrInfo(SPUTargetMachine &tm)
25   : TargetInstrInfoImpl(SPUInsts, sizeof(SPUInsts)/sizeof(SPUInsts[0])),
26     TM(tm),
27     RI(*TM.getSubtargetImpl(), *this)
28 {
29   /* NOP */
30 }
31
32 /// getPointerRegClass - Return the register class to use to hold pointers.
33 /// This is used for addressing modes.
34 const TargetRegisterClass *
35 SPUInstrInfo::getPointerRegClass() const
36 {
37   return &SPU::R32CRegClass;
38 }
39
40 bool
41 SPUInstrInfo::isMoveInstr(const MachineInstr& MI,
42                           unsigned& sourceReg,
43                           unsigned& destReg) const {
44   // Primarily, ORI and OR are generated by copyRegToReg. But, there are other
45   // cases where we can safely say that what's being done is really a move
46   // (see how PowerPC does this -- it's the model for this code too.)
47   switch (MI.getOpcode()) {
48   default:
49     break;
50   case SPU::ORIv4i32:
51   case SPU::ORIr32:
52   case SPU::ORHIv8i16:
53   case SPU::ORHIr16:
54   case SPU::ORHIi8i16:
55   case SPU::ORBIv16i8:
56   case SPU::ORBIr8:
57   case SPU::ORIi16i32:
58   case SPU::ORIi8i32:
59   case SPU::AHIvec:
60   case SPU::AHIr16:
61   case SPU::AIvec:
62     assert(MI.getNumOperands() == 3 &&
63            MI.getOperand(0).isRegister() &&
64            MI.getOperand(1).isRegister() &&
65            MI.getOperand(2).isImmediate() &&
66            "invalid SPU ORI/ORHI/ORBI/AHI/AI/SFI/SFHI instruction!");
67     if (MI.getOperand(2).getImm() == 0) {
68       sourceReg = MI.getOperand(1).getReg();
69       destReg = MI.getOperand(0).getReg();
70       return true;
71     }
72     break;
73   case SPU::AIr32:
74     assert(MI.getNumOperands() == 3 &&
75            "wrong number of operands to AIr32");
76     if (MI.getOperand(0).isRegister() &&
77         (MI.getOperand(1).isRegister() ||
78          MI.getOperand(1).isFrameIndex()) &&
79         (MI.getOperand(2).isImmediate() &&
80          MI.getOperand(2).getImm() == 0)) {
81       sourceReg = MI.getOperand(1).getReg();
82       destReg = MI.getOperand(0).getReg();
83       return true;
84     }
85     break;
86   case SPU::ORv16i8_i8:
87   case SPU::ORv8i16_i16:
88   case SPU::ORv4i32_i32:
89   case SPU::ORv2i64_i64:
90   case SPU::ORv4f32_f32:
91   case SPU::ORv2f64_f64:
92   case SPU::ORi8_v16i8:
93   case SPU::ORi16_v8i16:
94   case SPU::ORi32_v4i32:
95   case SPU::ORi64_v2i64:
96   case SPU::ORf32_v4f32:
97   case SPU::ORf64_v2f64:
98   case SPU::ORv16i8:
99   case SPU::ORv8i16:
100   case SPU::ORv4i32:
101   case SPU::ORr32:
102   case SPU::ORr64:
103   case SPU::ORf32:
104   case SPU::ORf64:
105     assert(MI.getNumOperands() == 3 &&
106            MI.getOperand(0).isRegister() &&
107            MI.getOperand(1).isRegister() &&
108            MI.getOperand(2).isRegister() &&
109            "invalid SPU OR(vec|r32|r64|gprc) instruction!");
110     if (MI.getOperand(1).getReg() == MI.getOperand(2).getReg()) {
111       sourceReg = MI.getOperand(1).getReg();
112       destReg = MI.getOperand(0).getReg();
113       return true;
114     }
115     break;
116   }
117
118   return false;
119 }
120
121 unsigned
122 SPUInstrInfo::isLoadFromStackSlot(MachineInstr *MI, int &FrameIndex) const {
123   switch (MI->getOpcode()) {
124   default: break;
125   case SPU::LQDv16i8:
126   case SPU::LQDv8i16:
127   case SPU::LQDv4i32:
128   case SPU::LQDv4f32:
129   case SPU::LQDv2f64:
130   case SPU::LQDr128:
131   case SPU::LQDr64:
132   case SPU::LQDr32:
133   case SPU::LQDr16:
134   case SPU::LQXv4i32:
135   case SPU::LQXr128:
136   case SPU::LQXr64:
137   case SPU::LQXr32:
138   case SPU::LQXr16:
139     if (MI->getOperand(1).isImmediate() && !MI->getOperand(1).getImm() &&
140         MI->getOperand(2).isFrameIndex()) {
141       FrameIndex = MI->getOperand(2).getIndex();
142       return MI->getOperand(0).getReg();
143     }
144     break;
145   }
146   return 0;
147 }
148
149 unsigned
150 SPUInstrInfo::isStoreToStackSlot(MachineInstr *MI, int &FrameIndex) const {
151   switch (MI->getOpcode()) {
152   default: break;
153   case SPU::STQDv16i8:
154   case SPU::STQDv8i16:
155   case SPU::STQDv4i32:
156   case SPU::STQDv4f32:
157   case SPU::STQDv2f64:
158   case SPU::STQDr128:
159   case SPU::STQDr64:
160   case SPU::STQDr32:
161   case SPU::STQDr16:
162     // case SPU::STQDr8:
163   case SPU::STQXv16i8:
164   case SPU::STQXv8i16:
165   case SPU::STQXv4i32:
166   case SPU::STQXv4f32:
167   case SPU::STQXv2f64:
168   case SPU::STQXr128:
169   case SPU::STQXr64:
170   case SPU::STQXr32:
171   case SPU::STQXr16:
172     // case SPU::STQXr8:
173     if (MI->getOperand(1).isImmediate() && !MI->getOperand(1).getImm() &&
174         MI->getOperand(2).isFrameIndex()) {
175       FrameIndex = MI->getOperand(2).getIndex();
176       return MI->getOperand(0).getReg();
177     }
178     break;
179   }
180   return 0;
181 }
182
183 void SPUInstrInfo::copyRegToReg(MachineBasicBlock &MBB,
184                                    MachineBasicBlock::iterator MI,
185                                    unsigned DestReg, unsigned SrcReg,
186                                    const TargetRegisterClass *DestRC,
187                                    const TargetRegisterClass *SrcRC) const
188 {
189   if (DestRC != SrcRC) {
190     cerr << "SPUInstrInfo::copyRegToReg(): DestRC != SrcRC not supported!\n";
191     abort();
192   }
193
194   if (DestRC == SPU::R8CRegisterClass) {
195     BuildMI(MBB, MI, get(SPU::ORBIr8), DestReg).addReg(SrcReg).addImm(0);
196   } else if (DestRC == SPU::R16CRegisterClass) {
197     BuildMI(MBB, MI, get(SPU::ORHIr16), DestReg).addReg(SrcReg).addImm(0);
198   } else if (DestRC == SPU::R32CRegisterClass) {
199     BuildMI(MBB, MI, get(SPU::ORIr32), DestReg).addReg(SrcReg).addImm(0);
200   } else if (DestRC == SPU::R32FPRegisterClass) {
201     BuildMI(MBB, MI, get(SPU::ORf32), DestReg).addReg(SrcReg)
202       .addReg(SrcReg);
203   } else if (DestRC == SPU::R64CRegisterClass) {
204     BuildMI(MBB, MI, get(SPU::ORr64), DestReg).addReg(SrcReg)
205       .addReg(SrcReg);
206   } else if (DestRC == SPU::R64FPRegisterClass) {
207     BuildMI(MBB, MI, get(SPU::ORf64), DestReg).addReg(SrcReg)
208       .addReg(SrcReg);
209   } /* else if (DestRC == SPU::GPRCRegisterClass) {
210     BuildMI(MBB, MI, get(SPU::ORgprc), DestReg).addReg(SrcReg)
211       .addReg(SrcReg);
212   } */ else if (DestRC == SPU::VECREGRegisterClass) {
213     BuildMI(MBB, MI, get(SPU::ORv4i32), DestReg).addReg(SrcReg)
214       .addReg(SrcReg);
215   } else {
216     std::cerr << "Attempt to copy unknown/unsupported register class!\n";
217     abort();
218   }
219 }
220
221 void
222 SPUInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
223                                      MachineBasicBlock::iterator MI,
224                                      unsigned SrcReg, bool isKill, int FrameIdx,
225                                      const TargetRegisterClass *RC) const
226 {
227   unsigned opc;
228   if (RC == SPU::GPRCRegisterClass) {
229     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
230       ? SPU::STQDr128
231       : SPU::STQXr128;
232   } else if (RC == SPU::R64CRegisterClass) {
233     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
234       ? SPU::STQDr64
235       : SPU::STQXr64;
236   } else if (RC == SPU::R64FPRegisterClass) {
237     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
238       ? SPU::STQDr64
239       : SPU::STQXr64;
240   } else if (RC == SPU::R32CRegisterClass) {
241     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
242       ? SPU::STQDr32
243       : SPU::STQXr32;
244   } else if (RC == SPU::R32FPRegisterClass) {
245     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
246       ? SPU::STQDr32
247       : SPU::STQXr32;
248   } else if (RC == SPU::R16CRegisterClass) {
249     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset()) ?
250       SPU::STQDr16
251       : SPU::STQXr16;
252   } else {
253     assert(0 && "Unknown regclass!");
254     abort();
255   }
256
257   addFrameReference(BuildMI(MBB, MI, get(opc))
258                     .addReg(SrcReg, false, false, isKill), FrameIdx);
259 }
260
261 void SPUInstrInfo::storeRegToAddr(MachineFunction &MF, unsigned SrcReg,
262                                      bool isKill,
263                                      SmallVectorImpl<MachineOperand> &Addr,
264                                      const TargetRegisterClass *RC,
265                                      SmallVectorImpl<MachineInstr*> &NewMIs) const {
266   cerr << "storeRegToAddr() invoked!\n";
267   abort();
268
269   if (Addr[0].isFrameIndex()) {
270     /* do what storeRegToStackSlot does here */
271   } else {
272     unsigned Opc = 0;
273     if (RC == SPU::GPRCRegisterClass) {
274       /* Opc = PPC::STW; */
275     } else if (RC == SPU::R16CRegisterClass) {
276       /* Opc = PPC::STD; */
277     } else if (RC == SPU::R32CRegisterClass) {
278       /* Opc = PPC::STFD; */
279     } else if (RC == SPU::R32FPRegisterClass) {
280       /* Opc = PPC::STFD; */
281     } else if (RC == SPU::R64FPRegisterClass) {
282       /* Opc = PPC::STFS; */
283     } else if (RC == SPU::VECREGRegisterClass) {
284       /* Opc = PPC::STVX; */
285     } else {
286       assert(0 && "Unknown regclass!");
287       abort();
288     }
289     MachineInstrBuilder MIB = BuildMI(get(Opc))
290       .addReg(SrcReg, false, false, isKill);
291     for (unsigned i = 0, e = Addr.size(); i != e; ++i) {
292       MachineOperand &MO = Addr[i];
293       if (MO.isRegister())
294         MIB.addReg(MO.getReg());
295       else if (MO.isImmediate())
296         MIB.addImm(MO.getImm());
297       else
298         MIB.addFrameIndex(MO.getIndex());
299     }
300     NewMIs.push_back(MIB);
301   }
302 }
303
304 void
305 SPUInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
306                                         MachineBasicBlock::iterator MI,
307                                         unsigned DestReg, int FrameIdx,
308                                         const TargetRegisterClass *RC) const
309 {
310   unsigned opc;
311   if (RC == SPU::GPRCRegisterClass) {
312     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
313       ? SPU::LQDr128
314       : SPU::LQXr128;
315   } else if (RC == SPU::R64CRegisterClass) {
316     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
317       ? SPU::LQDr64
318       : SPU::LQXr64;
319   } else if (RC == SPU::R64FPRegisterClass) {
320     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
321       ? SPU::LQDr64
322       : SPU::LQXr64;
323   } else if (RC == SPU::R32CRegisterClass) {
324     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
325       ? SPU::LQDr32
326       : SPU::LQXr32;
327   } else if (RC == SPU::R32FPRegisterClass) {
328     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
329       ? SPU::LQDr32
330       : SPU::LQXr32;
331   } else if (RC == SPU::R16CRegisterClass) {
332     opc = (FrameIdx < SPUFrameInfo::maxFrameOffset())
333       ? SPU::LQDr16
334       : SPU::LQXr16;
335   } else {
336     assert(0 && "Unknown regclass in loadRegFromStackSlot!");
337     abort();
338   }
339
340   addFrameReference(BuildMI(MBB, MI, get(opc)).addReg(DestReg), FrameIdx);
341 }
342
343 /*!
344   \note We are really pessimistic here about what kind of a load we're doing.
345  */
346 void SPUInstrInfo::loadRegFromAddr(MachineFunction &MF, unsigned DestReg,
347                                       SmallVectorImpl<MachineOperand> &Addr,
348                                       const TargetRegisterClass *RC,
349                                       SmallVectorImpl<MachineInstr*> &NewMIs)
350     const {
351   cerr << "loadRegToAddr() invoked!\n";
352   abort();
353
354   if (Addr[0].isFrameIndex()) {
355     /* do what loadRegFromStackSlot does here... */
356   } else {
357     unsigned Opc = 0;
358     if (RC == SPU::R8CRegisterClass) {
359       /* do brilliance here */
360     } else if (RC == SPU::R16CRegisterClass) {
361       /* Opc = PPC::LWZ; */
362     } else if (RC == SPU::R32CRegisterClass) {
363       /* Opc = PPC::LD; */
364     } else if (RC == SPU::R32FPRegisterClass) {
365       /* Opc = PPC::LFD; */
366     } else if (RC == SPU::R64FPRegisterClass) {
367       /* Opc = PPC::LFS; */
368     } else if (RC == SPU::VECREGRegisterClass) {
369       /* Opc = PPC::LVX; */
370     } else if (RC == SPU::GPRCRegisterClass) {
371       /* Opc = something else! */
372     } else {
373       assert(0 && "Unknown regclass!");
374       abort();
375     }
376     MachineInstrBuilder MIB = BuildMI(get(Opc), DestReg);
377     for (unsigned i = 0, e = Addr.size(); i != e; ++i) {
378       MachineOperand &MO = Addr[i];
379       if (MO.isRegister())
380         MIB.addReg(MO.getReg());
381       else if (MO.isImmediate())
382         MIB.addImm(MO.getImm());
383       else
384         MIB.addFrameIndex(MO.getIndex());
385     }
386     NewMIs.push_back(MIB);
387   }
388 }
389
390 /// foldMemoryOperand - SPU, like PPC, can only fold spills into
391 /// copy instructions, turning them into load/store instructions.
392 MachineInstr *
393 SPUInstrInfo::foldMemoryOperand(MachineFunction &MF,
394                                 MachineInstr *MI,
395                                 SmallVectorImpl<unsigned> &Ops,
396                                 int FrameIndex) const
397 {
398 #if SOMEDAY_SCOTT_LOOKS_AT_ME_AGAIN
399   if (Ops.size() != 1) return NULL;
400
401   unsigned OpNum = Ops[0];
402   unsigned Opc = MI->getOpcode();
403   MachineInstr *NewMI = 0;
404   
405   if ((Opc == SPU::ORr32
406        || Opc == SPU::ORv4i32)
407        && MI->getOperand(1).getReg() == MI->getOperand(2).getReg()) {
408     if (OpNum == 0) {  // move -> store
409       unsigned InReg = MI->getOperand(1).getReg();
410       if (FrameIndex < SPUFrameInfo::maxFrameOffset()) {
411         NewMI = addFrameReference(BuildMI(TII.get(SPU::STQDr32)).addReg(InReg),
412                                   FrameIndex);
413       }
414     } else {           // move -> load
415       unsigned OutReg = MI->getOperand(0).getReg();
416       Opc = (FrameIndex < SPUFrameInfo::maxFrameOffset()) ? SPU::STQDr32 : SPU::STQXr32;
417       NewMI = addFrameReference(BuildMI(TII.get(Opc), OutReg), FrameIndex);
418     }
419   }
420
421   if (NewMI)
422     NewMI->copyKillDeadInfo(MI);
423
424   return NewMI;
425 #else
426   return 0;
427 #endif
428 }
429