R600/SI: Remove VReg_32 register class

[oota-llvm.git] / lib / Target / R600 / SIISelLowering.cpp
diff --git a/lib/Target/R600/SIISelLowering.cpp b/lib/Target/R600/SIISelLowering.cpp

index 0690792fb7240127d22f4c749ce9bb440c9fd606..f132bf1548a3d036dbcc7def8d0a10f26596a58a 100644 (file)
--- a/lib/Target/R600/SIISelLowering.cpp
+++ b/lib/Target/R600/SIISelLowering.cpp
@@ -44,7 +44,7 @@ SITargetLowering::SITargetLowering(TargetMachine &TM) :
    addRegisterClass(MVT::v64i8, &AMDGPU::SReg_512RegClass);
  
    addRegisterClass(MVT::i32, &AMDGPU::SReg_32RegClass);
-  addRegisterClass(MVT::f32, &AMDGPU::VReg_32RegClass);
+  addRegisterClass(MVT::f32, &AMDGPU::VGPR_32RegClass);
  
    addRegisterClass(MVT::f64, &AMDGPU::VReg_64RegClass);
    addRegisterClass(MVT::v2i32, &AMDGPU::SReg_64RegClass);
@@ -218,6 +218,7 @@ SITargetLowering::SITargetLowering(TargetMachine &TM) :
    setTargetDAGCombine(ISD::FMAXNUM);
    setTargetDAGCombine(ISD::SELECT_CC);
    setTargetDAGCombine(ISD::SETCC);
+  setTargetDAGCombine(ISD::AND);
    setTargetDAGCombine(ISD::OR);
    setTargetDAGCombine(ISD::UINT_TO_FP);
  
@@ -875,13 +876,13 @@ SDValue SITargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,
      return CreateLiveInRegister(DAG, &AMDGPU::SReg_32RegClass,
        TRI->getPreloadedValue(MF, SIRegisterInfo::TGID_Z), VT);
    case Intrinsic::r600_read_tidig_x:
-    return CreateLiveInRegister(DAG, &AMDGPU::VReg_32RegClass,
+    return CreateLiveInRegister(DAG, &AMDGPU::VGPR_32RegClass,
        TRI->getPreloadedValue(MF, SIRegisterInfo::TIDIG_X), VT);
    case Intrinsic::r600_read_tidig_y:
-    return CreateLiveInRegister(DAG, &AMDGPU::VReg_32RegClass,
+    return CreateLiveInRegister(DAG, &AMDGPU::VGPR_32RegClass,
        TRI->getPreloadedValue(MF, SIRegisterInfo::TIDIG_Y), VT);
    case Intrinsic::r600_read_tidig_z:
-    return CreateLiveInRegister(DAG, &AMDGPU::VReg_32RegClass,
+    return CreateLiveInRegister(DAG, &AMDGPU::VGPR_32RegClass,
        TRI->getPreloadedValue(MF, SIRegisterInfo::TIDIG_Z), VT);
    case AMDGPUIntrinsic::SI_load_const: {
      SDValue Ops[] = {
@@ -1302,6 +1303,59 @@ SDValue SITargetLowering::performSHLPtrCombine(SDNode *N,
    return DAG.getNode(ISD::ADD, SL, VT, ShlX, COffset);
  }
  
+SDValue SITargetLowering::performAndCombine(SDNode *N,
+                                            DAGCombinerInfo &DCI) const {
+  if (DCI.isBeforeLegalize())
+    return SDValue();
+
+  SelectionDAG &DAG = DCI.DAG;
+
+  // (and (fcmp ord x, x), (fcmp une (fabs x), inf)) ->
+  // fp_class x, ~(s_nan | q_nan | n_infinity | p_infinity)
+  SDValue LHS = N->getOperand(0);
+  SDValue RHS = N->getOperand(1);
+
+  if (LHS.getOpcode() == ISD::SETCC &&
+      RHS.getOpcode() == ISD::SETCC) {
+    ISD::CondCode LCC = cast<CondCodeSDNode>(LHS.getOperand(2))->get();
+    ISD::CondCode RCC = cast<CondCodeSDNode>(RHS.getOperand(2))->get();
+
+    SDValue X = LHS.getOperand(0);
+    SDValue Y = RHS.getOperand(0);
+    if (Y.getOpcode() != ISD::FABS || Y.getOperand(0) != X)
+      return SDValue();
+
+    if (LCC == ISD::SETO) {
+      if (X != LHS.getOperand(1))
+        return SDValue();
+
+      if (RCC == ISD::SETUNE) {
+        const ConstantFPSDNode *C1 = dyn_cast<ConstantFPSDNode>(RHS.getOperand(1));
+        if (!C1 || !C1->isInfinity() || C1->isNegative())
+          return SDValue();
+
+        const uint32_t Mask = SIInstrFlags::N_NORMAL |
+                              SIInstrFlags::N_SUBNORMAL |
+                              SIInstrFlags::N_ZERO |
+                              SIInstrFlags::P_ZERO |
+                              SIInstrFlags::P_SUBNORMAL |
+                              SIInstrFlags::P_NORMAL;
+
+        static_assert(((~(SIInstrFlags::S_NAN |
+                          SIInstrFlags::Q_NAN |
+                          SIInstrFlags::N_INFINITY |
+                          SIInstrFlags::P_INFINITY)) & 0x3ff) == Mask,
+                      "mask not equal");
+
+        return DAG.getNode(AMDGPUISD::FP_CLASS, SDLoc(N), MVT::i1,
+                           X, DAG.getConstant(Mask, MVT::i32));
+      }
+    }
+  }
+
+  return SDValue();
+}
+
  SDValue SITargetLowering::performOrCombine(SDNode *N,
                                             DAGCombinerInfo &DCI) const {
    SelectionDAG &DAG = DCI.DAG;
@@ -1607,6 +1661,8 @@ SDValue SITargetLowering::PerformDAGCombine(SDNode *N,
      }
      break;
    }
+  case ISD::AND:
+    return performAndCombine(N, DCI);
    case ISD::OR:
      return performOrCombine(N, DCI);
    case AMDGPUISD::FP_CLASS:
@@ -1957,7 +2013,7 @@ void SITargetLowering::adjustWritemask(MachineSDNode *&Node,
    // If we only got one lane, replace it with a copy
    // (if NewDmask has only one bit set...)
    if (NewDmask && (NewDmask & (NewDmask-1)) == 0) {
-    SDValue RC = DAG.getTargetConstant(AMDGPU::VReg_32RegClassID, MVT::i32);
+    SDValue RC = DAG.getTargetConstant(AMDGPU::VGPR_32RegClassID, MVT::i32);
      SDNode *Copy = DAG.getMachineNode(TargetOpcode::COPY_TO_REGCLASS,
                                        SDLoc(), Users[Lane]->getValueType(0),
                                        SDValue(Node, 0), RC);
@@ -2045,7 +2101,7 @@ void SITargetLowering::AdjustInstrPostInstrSelection(MachineInstr *MI,
      const TargetRegisterClass *RC;
      switch (BitsSet) {
      default: return;
-    case 1:  RC = &AMDGPU::VReg_32RegClass; break;
+    case 1:  RC = &AMDGPU::VGPR_32RegClass; break;
      case 2:  RC = &AMDGPU::VReg_64RegClass; break;
      case 3:  RC = &AMDGPU::VReg_96RegClass; break;
      }