R600/SI: Prettier display of input modifiers

[oota-llvm.git] / lib / Target / R600 / AMDGPUISelLowering.cpp
diff --git a/lib/Target/R600/AMDGPUISelLowering.cpp b/lib/Target/R600/AMDGPUISelLowering.cpp

index 015f0ae4d7860490efce49008b3420b787bc4c03..a17dc181d38136718c2d9c0c28052bdc48504894 100644 (file)
--- a/lib/Target/R600/AMDGPUISelLowering.cpp
+++ b/lib/Target/R600/AMDGPUISelLowering.cpp
@@ -130,6 +130,9 @@ AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :
    setOperationAction(ISD::STORE, MVT::f64, Promote);
    AddPromotedToType(ISD::STORE, MVT::f64, MVT::i64);
  
+  setOperationAction(ISD::STORE, MVT::v2f64, Promote);
+  AddPromotedToType(ISD::STORE, MVT::v2f64, MVT::v2i64);
+
    // Custom lowering of vector stores is required for local address space
    // stores.
    setOperationAction(ISD::STORE, MVT::v4i32, Custom);
@@ -145,6 +148,8 @@ AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :
    // handle 64-bit stores.
    setTruncStoreAction(MVT::v4i32, MVT::v4i16, Expand);
  
+  setTruncStoreAction(MVT::i64, MVT::i16, Expand);
+  setTruncStoreAction(MVT::i64, MVT::i8, Expand);
    setTruncStoreAction(MVT::i64, MVT::i1, Expand);
    setTruncStoreAction(MVT::v2i64, MVT::v2i1, Expand);
    setTruncStoreAction(MVT::v4i64, MVT::v4i1, Expand);
@@ -168,6 +173,9 @@ AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :
    setOperationAction(ISD::LOAD, MVT::f64, Promote);
    AddPromotedToType(ISD::LOAD, MVT::f64, MVT::i64);
  
+  setOperationAction(ISD::LOAD, MVT::v2f64, Promote);
+  AddPromotedToType(ISD::LOAD, MVT::v2f64, MVT::v2i64);
+
    setOperationAction(ISD::CONCAT_VECTORS, MVT::v4i32, Custom);
    setOperationAction(ISD::CONCAT_VECTORS, MVT::v4f32, Custom);
    setOperationAction(ISD::CONCAT_VECTORS, MVT::v8i32, Custom);
@@ -194,15 +202,19 @@ AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :
  
    setOperationAction(ISD::BR_CC, MVT::i1, Expand);
  
+  setOperationAction(ISD::SELECT_CC, MVT::i64, Expand);
+
    setOperationAction(ISD::FNEG, MVT::v2f32, Expand);
    setOperationAction(ISD::FNEG, MVT::v4f32, Expand);
  
    setOperationAction(ISD::UINT_TO_FP, MVT::i64, Custom);
  
    setOperationAction(ISD::MUL, MVT::i64, Expand);
+  setOperationAction(ISD::SUB, MVT::i64, Expand);
  
    setOperationAction(ISD::UDIV, MVT::i32, Expand);
    setOperationAction(ISD::UDIVREM, MVT::i32, Custom);
+  setOperationAction(ISD::UDIVREM, MVT::i64, Custom);
    setOperationAction(ISD::UREM, MVT::i32, Expand);
    setOperationAction(ISD::VSELECT, MVT::v2f32, Expand);
    setOperationAction(ISD::VSELECT, MVT::v4f32, Expand);
@@ -243,6 +255,7 @@ AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :
      MVT::SimpleValueType VT = FloatTypes[x];
      setOperationAction(ISD::FABS, VT, Expand);
      setOperationAction(ISD::FADD, VT, Expand);
+    setOperationAction(ISD::FCOS, VT, Expand);
      setOperationAction(ISD::FDIV, VT, Expand);
      setOperationAction(ISD::FPOW, VT, Expand);
      setOperationAction(ISD::FFLOOR, VT, Expand);
@@ -250,11 +263,13 @@ AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :
      setOperationAction(ISD::FMUL, VT, Expand);
      setOperationAction(ISD::FRINT, VT, Expand);
      setOperationAction(ISD::FSQRT, VT, Expand);
+    setOperationAction(ISD::FSIN, VT, Expand);
      setOperationAction(ISD::FSUB, VT, Expand);
      setOperationAction(ISD::SELECT, VT, Expand);
    }
  
    setTargetDAGCombine(ISD::MUL);
+  setTargetDAGCombine(ISD::SELECT_CC);
  }
  
  //===----------------------------------------------------------------------===//
@@ -408,7 +423,96 @@ void AMDGPUTargetLowering::ReplaceNodeResults(SDNode *N,
      // ReplaceNodeResults to sext_in_reg to an illegal type, so we'll just do
      // nothing here and let the illegal result integer be handled normally.
      return;
+  case ISD::UDIV: {
+    SDValue Op = SDValue(N, 0);
+    SDLoc DL(Op);
+    EVT VT = Op.getValueType();
+    SDValue UDIVREM = DAG.getNode(ISD::UDIVREM, DL, DAG.getVTList(VT, VT),
+      N->getOperand(0), N->getOperand(1));
+    Results.push_back(UDIVREM);
+    break;
+  }
+  case ISD::UREM: {
+    SDValue Op = SDValue(N, 0);
+    SDLoc DL(Op);
+    EVT VT = Op.getValueType();
+    SDValue UDIVREM = DAG.getNode(ISD::UDIVREM, DL, DAG.getVTList(VT, VT),
+      N->getOperand(0), N->getOperand(1));
+    Results.push_back(UDIVREM.getValue(1));
+    break;
+  }
+  case ISD::UDIVREM: {
+    SDValue Op = SDValue(N, 0);
+    SDLoc DL(Op);
+    EVT VT = Op.getValueType();
+    EVT HalfVT = VT.getHalfSizedIntegerVT(*DAG.getContext());
+
+    SDValue one = DAG.getConstant(1, HalfVT);
+    SDValue zero = DAG.getConstant(0, HalfVT);
+
+    //HiLo split
+    SDValue LHS = N->getOperand(0);
+    SDValue LHS_Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, LHS, zero);
+    SDValue LHS_Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, LHS, one);
+
+    SDValue RHS = N->getOperand(1);
+    SDValue RHS_Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, RHS, zero);
+    SDValue RHS_Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, RHS, one);
+
+    // Get Speculative values
+    SDValue DIV_Part = DAG.getNode(ISD::UDIV, DL, HalfVT, LHS_Hi, RHS_Lo);
+    SDValue REM_Part = DAG.getNode(ISD::UREM, DL, HalfVT, LHS_Hi, RHS_Lo);
+
+    SDValue REM_Hi = zero;
+    SDValue REM_Lo = DAG.getSelectCC(DL, RHS_Hi, zero, REM_Part, LHS_Hi, ISD::SETEQ);
+
+    SDValue DIV_Hi = DAG.getSelectCC(DL, RHS_Hi, zero, DIV_Part, zero, ISD::SETEQ);
+    SDValue DIV_Lo = zero;
+
+    const unsigned halfBitWidth = HalfVT.getSizeInBits();
+
+    for (unsigned i = 0; i < halfBitWidth; ++i) {
+      SDValue POS = DAG.getConstant(halfBitWidth - i - 1, HalfVT);
+      // Get Value of high bit
+      SDValue HBit;
+      if (halfBitWidth == 32 && Subtarget->hasBFE()) {
+        HBit = DAG.getNode(AMDGPUISD::BFE_U32, DL, HalfVT, LHS_Lo, POS, one);
+      } else {
+        HBit = DAG.getNode(ISD::SRL, DL, HalfVT, LHS_Lo, POS);
+        HBit = DAG.getNode(ISD::AND, DL, HalfVT, HBit, one);
+      }
+
+      SDValue Carry = DAG.getNode(ISD::SRL, DL, HalfVT, REM_Lo,
+        DAG.getConstant(halfBitWidth - 1, HalfVT));
+      REM_Hi = DAG.getNode(ISD::SHL, DL, HalfVT, REM_Hi, one);
+      REM_Hi = DAG.getNode(ISD::OR, DL, HalfVT, REM_Hi, Carry);
+
+      REM_Lo = DAG.getNode(ISD::SHL, DL, HalfVT, REM_Lo, one);
+      REM_Lo = DAG.getNode(ISD::OR, DL, HalfVT, REM_Lo, HBit);
+
+
+      SDValue REM = DAG.getNode(ISD::BUILD_PAIR, DL, VT, REM_Lo, REM_Hi);
+
+      SDValue BIT = DAG.getConstant(1 << (halfBitWidth - i - 1), HalfVT);
+      SDValue realBIT = DAG.getSelectCC(DL, REM, RHS, BIT, zero, ISD::SETGE);
  
+      DIV_Lo = DAG.getNode(ISD::OR, DL, HalfVT, DIV_Lo, realBIT);
+
+      // Update REM
+
+      SDValue REM_sub = DAG.getNode(ISD::SUB, DL, VT, REM, RHS);
+
+      REM = DAG.getSelectCC(DL, REM, RHS, REM_sub, REM, ISD::SETGE);
+      REM_Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, REM, zero);
+      REM_Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, REM, one);
+    }
+
+    SDValue REM = DAG.getNode(ISD::BUILD_PAIR, DL, VT, REM_Lo, REM_Hi);
+    SDValue DIV = DAG.getNode(ISD::BUILD_PAIR, DL, VT, DIV_Lo, DIV_Hi);
+    Results.push_back(DIV);
+    Results.push_back(REM);
+    break;
+  }
    default:
      return;
    }
@@ -444,8 +548,7 @@ SDValue AMDGPUTargetLowering::LowerConstantInitializer(const Constant* Init,
        Chains.push_back(LowerConstantInitializer(Init->getAggregateElement(i),
                         GV, Ptr, Chain, DAG));
      }
-    return DAG.getNode(ISD::TokenFactor, DL, MVT::Other,
-                       Chains.data(), Chains.size());
+    return DAG.getNode(ISD::TokenFactor, DL, MVT::Other, Chains);
    } else {
      Init->dump();
      llvm_unreachable("Unhandled constant initializer");
@@ -508,7 +611,7 @@ SDValue AMDGPUTargetLowering::LowerGlobalAddress(AMDGPUMachineFunction* MFI,
        for (unsigned i = 1; i < (*I)->getNumOperands(); ++i) {
          Ops.push_back((*I)->getOperand(i));
        }
-      DAG.UpdateNodeOperands(*I, Ops.data(), Ops.size());
+      DAG.UpdateNodeOperands(*I, Ops);
      }
      return DAG.getZExtOrTrunc(InitPtr, SDLoc(Op),
          getPointerTy(AMDGPUAS::CONSTANT_ADDRESS));
@@ -525,8 +628,7 @@ SDValue AMDGPUTargetLowering::LowerCONCAT_VECTORS(SDValue Op,
    DAG.ExtractVectorElements(A, Args);
    DAG.ExtractVectorElements(B, Args);
  
-  return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(),
-                     Args.data(), Args.size());
+  return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(), Args);
  }
  
  SDValue AMDGPUTargetLowering::LowerEXTRACT_SUBVECTOR(SDValue Op,
@@ -538,8 +640,7 @@ SDValue AMDGPUTargetLowering::LowerEXTRACT_SUBVECTOR(SDValue Op,
    DAG.ExtractVectorElements(Op.getOperand(0), Args, Start,
                              VT.getVectorNumElements());
  
-  return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(),
-                     Args.data(), Args.size());
+  return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(), Args);
  }
  
  SDValue AMDGPUTargetLowering::LowerFrameIndex(SDValue Op,
@@ -650,16 +751,16 @@ SDValue AMDGPUTargetLowering::LowerIntrinsicLRP(SDValue Op,
  }
  
  /// \brief Generate Min/Max node
-SDValue AMDGPUTargetLowering::LowerMinMax(SDValue Op,
+SDValue AMDGPUTargetLowering::CombineMinMax(SDNode *N,
      SelectionDAG &DAG) const {
-  SDLoc DL(Op);
-  EVT VT = Op.getValueType();
+  SDLoc DL(N);
+  EVT VT = N->getValueType(0);
  
-  SDValue LHS = Op.getOperand(0);
-  SDValue RHS = Op.getOperand(1);
-  SDValue True = Op.getOperand(2);
-  SDValue False = Op.getOperand(3);
-  SDValue CC = Op.getOperand(4);
+  SDValue LHS = N->getOperand(0);
+  SDValue RHS = N->getOperand(1);
+  SDValue True = N->getOperand(2);
+  SDValue False = N->getOperand(3);
+  SDValue CC = N->getOperand(4);
  
    if (VT != MVT::f32 ||
        !((LHS == True && RHS == False) || (LHS == False && RHS == True))) {
@@ -706,7 +807,7 @@ SDValue AMDGPUTargetLowering::LowerMinMax(SDValue Op,
    case ISD::SETCC_INVALID:
      llvm_unreachable("Invalid setcc condcode!");
    }
-  return Op;
+  return SDValue();
  }
  
  SDValue AMDGPUTargetLowering::SplitVectorLoad(const SDValue &Op,
@@ -728,8 +829,7 @@ SDValue AMDGPUTargetLowering::SplitVectorLoad(const SDValue &Op,
                          MemEltVT, Load->isVolatile(), Load->isNonTemporal(),
                          Load->getAlignment()));
    }
-  return DAG.getNode(ISD::BUILD_VECTOR, SL, Op.getValueType(),
-                     Loads.data(), Loads.size());
+  return DAG.getNode(ISD::BUILD_VECTOR, SL, Op.getValueType(), Loads);
  }
  
  SDValue AMDGPUTargetLowering::MergeVectorStore(const SDValue &Op,
@@ -813,7 +913,7 @@ SDValue AMDGPUTargetLowering::SplitVectorStore(SDValue Op,
                           MemEltVT, Store->isVolatile(), Store->isNonTemporal(),
                           Store->getAlignment()));
    }
-  return DAG.getNode(ISD::TokenFactor, SL, MVT::Other, Chains.data(), NumElts);
+  return DAG.getNode(ISD::TokenFactor, SL, MVT::Other, Chains);
  }
  
  SDValue AMDGPUTargetLowering::LowerLOAD(SDValue Op, SelectionDAG &DAG) const {
@@ -956,8 +1056,6 @@ SDValue AMDGPUTargetLowering::LowerUDIVREM(SDValue Op,
    SDValue Num = Op.getOperand(0);
    SDValue Den = Op.getOperand(1);
  
-  SmallVector<SDValue, 8> Results;
-
    // RCP =  URECIP(Den) = 2^32 / Den + e
    // e is rounding error.
    SDValue RCP = DAG.getNode(AMDGPUISD::URECIP, DL, VT, Den);
@@ -1051,7 +1149,7 @@ SDValue AMDGPUTargetLowering::LowerUDIVREM(SDValue Op,
      Div,
      Rem
    };
-  return DAG.getMergeValues(Ops, 2, DL);
+  return DAG.getMergeValues(Ops, DL);
  }
  
  SDValue AMDGPUTargetLowering::LowerUINT_TO_FP(SDValue Op,
@@ -1107,7 +1205,7 @@ SDValue AMDGPUTargetLowering::LowerSIGN_EXTEND_INREG(SDValue Op,
    for (unsigned I = 0; I < NElts; ++I)
      Args[I] = DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, ScalarVT, Args[I], VTOp);
  
-  return DAG.getNode(ISD::BUILD_VECTOR, DL, VT, Args.data(), Args.size());
+  return DAG.getNode(ISD::BUILD_VECTOR, DL, VT, Args);
  }
  
  //===----------------------------------------------------------------------===//
@@ -1188,6 +1286,9 @@ SDValue AMDGPUTargetLowering::PerformDAGCombine(SDNode *N,
        simplifyI24(N1, DCI);
        return SDValue();
      }
+    case ISD::SELECT_CC: {
+      return CombineMinMax(N, DAG);
+    }
    }
    return SDValue();
  }