Revert r194865 and r194874.

[oota-llvm.git] / lib / Target / R600 / R600InstrInfo.cpp
diff --git a/lib/Target/R600/R600InstrInfo.cpp b/lib/Target/R600/R600InstrInfo.cpp

index a11d54a9f7d9230e68919b99a74c0ac30a8d1207..6381c38919a328de60a60e31e93b5c975ff54033 100644 (file)
--- a/lib/Target/R600/R600InstrInfo.cpp
+++ b/lib/Target/R600/R600InstrInfo.cpp
@@ -141,6 +141,14 @@ bool R600InstrInfo::isLDSInstr(unsigned Opcode) const {
            (TargetFlags & R600_InstFlag::LDS_1A2D));
  }
  
+bool R600InstrInfo::isLDSNoRetInstr(unsigned Opcode) const {
+  return isLDSInstr(Opcode) && getOperandIdx(Opcode, AMDGPU::OpName::dst) == -1;
+}
+
+bool R600InstrInfo::isLDSRetInstr(unsigned Opcode) const {
+  return isLDSInstr(Opcode) && getOperandIdx(Opcode, AMDGPU::OpName::dst) != -1;
+}
+
  bool R600InstrInfo::canBeConsideredALU(const MachineInstr *MI) const {
    if (isALUInstr(MI->getOpcode()))
      return true;
@@ -1001,6 +1009,20 @@ R600InstrInfo::PredicateInstruction(MachineInstr *MI,
      return true;
    }
  
+  if (MI->getOpcode() == AMDGPU::DOT_4) {
+    MI->getOperand(getOperandIdx(*MI, AMDGPU::OpName::pred_sel_X))
+        .setReg(Pred[2].getReg());
+    MI->getOperand(getOperandIdx(*MI, AMDGPU::OpName::pred_sel_Y))
+        .setReg(Pred[2].getReg());
+    MI->getOperand(getOperandIdx(*MI, AMDGPU::OpName::pred_sel_Z))
+        .setReg(Pred[2].getReg());
+    MI->getOperand(getOperandIdx(*MI, AMDGPU::OpName::pred_sel_W))
+        .setReg(Pred[2].getReg());
+    MachineInstrBuilder MIB(*MI->getParent()->getParent(), MI);
+    MIB.addReg(AMDGPU::PREDICATE_BIT, RegState::Implicit);
+    return true;
+  }
+
    if (PIdx != -1) {
      MachineOperand &PMO = MI->getOperand(PIdx);
      PMO.setReg(Pred[2].getReg());
@@ -1024,67 +1046,25 @@ unsigned int R600InstrInfo::getInstrLatency(const InstrItineraryData *ItinData,
    return 2;
  }
  
-int R600InstrInfo::getIndirectIndexBegin(const MachineFunction &MF) const {
-  const MachineRegisterInfo &MRI = MF.getRegInfo();
-  const MachineFrameInfo *MFI = MF.getFrameInfo();
-  int Offset = 0;
-
-  if (MFI->getNumObjects() == 0) {
-    return -1;
-  }
-
-  if (MRI.livein_empty()) {
-    return 0;
-  }
-
-  for (MachineRegisterInfo::livein_iterator LI = MRI.livein_begin(),
-                                            LE = MRI.livein_end();
-                                            LI != LE; ++LI) {
-    Offset = std::max(Offset,
-                      GET_REG_INDEX(RI.getEncodingValue(LI->first)));
-  }
-
-  return Offset + 1;
-}
-
-int R600InstrInfo::getIndirectIndexEnd(const MachineFunction &MF) const {
-  int Offset = 0;
-  const MachineFrameInfo *MFI = MF.getFrameInfo();
-
-  // Variable sized objects are not supported
-  assert(!MFI->hasVarSizedObjects());
-
-  if (MFI->getNumObjects() == 0) {
-    return -1;
-  }
-
-  Offset = TM.getFrameLowering()->getFrameIndexOffset(MF, -1);
-
-  return getIndirectIndexBegin(MF) + Offset;
-}
-
-std::vector<unsigned> R600InstrInfo::getIndirectReservedRegs(
+void  R600InstrInfo::reserveIndirectRegisters(BitVector &Reserved,
                                               const MachineFunction &MF) const {
    const AMDGPUFrameLowering *TFL =
                   static_cast<const AMDGPUFrameLowering*>(TM.getFrameLowering());
-  std::vector<unsigned> Regs;
  
    unsigned StackWidth = TFL->getStackWidth(MF);
    int End = getIndirectIndexEnd(MF);
  
-  if (End == -1) {
-    return Regs;
-  }
+  if (End == -1)
+    return;
  
    for (int Index = getIndirectIndexBegin(MF); Index <= End; ++Index) {
      unsigned SuperReg = AMDGPU::R600_Reg128RegClass.getRegister(Index);
-    Regs.push_back(SuperReg);
+    Reserved.set(SuperReg);
      for (unsigned Chan = 0; Chan < StackWidth; ++Chan) {
        unsigned Reg = AMDGPU::R600_TReg32RegClass.getRegister((4 * Index) + Chan);
-      Regs.push_back(Reg);
+      Reserved.set(Reg);
      }
    }
-  return Regs;
  }
  
  unsigned R600InstrInfo::calculateIndirectAddress(unsigned RegIndex,
@@ -1251,6 +1231,11 @@ MachineInstr *R600InstrInfo::buildSlotOfVectorInstruction(
      AMDGPU::OpName::src1_sel,
    };
  
+  MachineOperand &MO = MI->getOperand(getOperandIdx(MI->getOpcode(),
+      getSlotedOps(AMDGPU::OpName::pred_sel, Slot)));
+  MIB->getOperand(getOperandIdx(Opcode, AMDGPU::OpName::pred_sel))
+      .setReg(MO.getReg());
+
    for (unsigned i = 0; i < 14; i++) {
      MachineOperand &MO = MI->getOperand(
          getOperandIdx(MI->getOpcode(), getSlotedOps(Operands[i], Slot)));