Reapply r235977 "[DebugInfo] Add debug locations to constant SD nodes"

[oota-llvm.git] / lib / Target / NVPTX / NVPTXISelLowering.cpp
diff --git a/lib/Target/NVPTX/NVPTXISelLowering.cpp b/lib/Target/NVPTX/NVPTXISelLowering.cpp

index 258c57b17c59f7d9553159953e31714e692ebe31..d498f3c5f279e0795e45f8c79115c3a23afee390 100644 (file)
--- a/lib/Target/NVPTX/NVPTXISelLowering.cpp
+++ b/lib/Target/NVPTX/NVPTXISelLowering.cpp
@@ -48,6 +48,12 @@ static cl::opt<bool> sched4reg(
      "nvptx-sched4reg",
      cl::desc("NVPTX Specific: schedule for register pressue"), cl::init(false));
  
+static cl::opt<unsigned>
+FMAContractLevelOpt("nvptx-fma-level", cl::ZeroOrMore, cl::Hidden,
+                    cl::desc("NVPTX Specific: FMA contraction (0: don't do it"
+                             " 1: do it  2: do it aggressively"),
+                    cl::init(2));
+
  static bool IsPTXVectorType(MVT VT) {
    switch (VT.SimpleTy) {
    default:
@@ -100,9 +106,9 @@ static void ComputePTXValueVTs(const TargetLowering &TLI, Type *Ty,
  }
  
  // NVPTXTargetLowering Constructor.
-NVPTXTargetLowering::NVPTXTargetLowering(NVPTXTargetMachine &TM)
-    : TargetLowering(TM, new NVPTXTargetObjectFile()), nvTM(&TM),
-      nvptxSubtarget(TM.getSubtarget<NVPTXSubtarget>()) {
+NVPTXTargetLowering::NVPTXTargetLowering(const NVPTXTargetMachine &TM,
+                                         const NVPTXSubtarget &STI)
+    : TargetLowering(TM), nvTM(&TM), STI(STI) {
  
    // always lower memset, memcpy, and memmove intrinsics to load/store
    // instructions, rather
@@ -161,14 +167,14 @@ NVPTXTargetLowering::NVPTXTargetLowering(NVPTXTargetMachine &TM)
    setOperationAction(ISD::SRA_PARTS, MVT::i64  , Custom);
    setOperationAction(ISD::SRL_PARTS, MVT::i64  , Custom);
  
-  if (nvptxSubtarget.hasROT64()) {
+  if (STI.hasROT64()) {
      setOperationAction(ISD::ROTL, MVT::i64, Legal);
      setOperationAction(ISD::ROTR, MVT::i64, Legal);
    } else {
      setOperationAction(ISD::ROTL, MVT::i64, Expand);
      setOperationAction(ISD::ROTR, MVT::i64, Expand);
    }
-  if (nvptxSubtarget.hasROT32()) {
+  if (STI.hasROT32()) {
      setOperationAction(ISD::ROTL, MVT::i32, Legal);
      setOperationAction(ISD::ROTR, MVT::i32, Legal);
    } else {
@@ -197,20 +203,23 @@ NVPTXTargetLowering::NVPTXTargetLowering(NVPTXTargetMachine &TM)
    setOperationAction(ISD::INTRINSIC_W_CHAIN, MVT::Other, Custom);
  
    // Turn FP extload into load/fextend
-  setLoadExtAction(ISD::EXTLOAD, MVT::f32, Expand);
+  setLoadExtAction(ISD::EXTLOAD, MVT::f32, MVT::f16, Expand);
+  setLoadExtAction(ISD::EXTLOAD, MVT::f64, MVT::f16, Expand);
+  setLoadExtAction(ISD::EXTLOAD, MVT::f64, MVT::f32, Expand);
    // Turn FP truncstore into trunc + store.
+  setTruncStoreAction(MVT::f32, MVT::f16, Expand);
+  setTruncStoreAction(MVT::f64, MVT::f16, Expand);
    setTruncStoreAction(MVT::f64, MVT::f32, Expand);
  
    // PTX does not support load / store predicate registers
    setOperationAction(ISD::LOAD, MVT::i1, Custom);
    setOperationAction(ISD::STORE, MVT::i1, Custom);
  
-  setLoadExtAction(ISD::SEXTLOAD, MVT::i1, Promote);
-  setLoadExtAction(ISD::ZEXTLOAD, MVT::i1, Promote);
-  setTruncStoreAction(MVT::i64, MVT::i1, Expand);
-  setTruncStoreAction(MVT::i32, MVT::i1, Expand);
-  setTruncStoreAction(MVT::i16, MVT::i1, Expand);
-  setTruncStoreAction(MVT::i8, MVT::i1, Expand);
+  for (MVT VT : MVT::integer_valuetypes()) {
+    setLoadExtAction(ISD::SEXTLOAD, VT, MVT::i1, Promote);
+    setLoadExtAction(ISD::ZEXTLOAD, VT, MVT::i1, Promote);
+    setTruncStoreAction(VT, MVT::i1, Expand);
+  }
  
    // This is legal in NVPTX
    setOperationAction(ISD::ConstantFP, MVT::f64, Legal);
@@ -223,9 +232,7 @@ NVPTXTargetLowering::NVPTXTargetLowering(NVPTXTargetMachine &TM)
    setOperationAction(ISD::ADDE, MVT::i64, Expand);
  
    // Register custom handling for vector loads/stores
-  for (int i = MVT::FIRST_VECTOR_VALUETYPE; i <= MVT::LAST_VECTOR_VALUETYPE;
-       ++i) {
-    MVT VT = (MVT::SimpleValueType) i;
+  for (MVT VT : MVT::vector_valuetypes()) {
      if (IsPTXVectorType(VT)) {
        setOperationAction(ISD::LOAD, VT, Custom);
        setOperationAction(ISD::STORE, VT, Custom);
@@ -252,6 +259,9 @@ NVPTXTargetLowering::NVPTXTargetLowering(NVPTXTargetMachine &TM)
    setOperationAction(ISD::CTPOP, MVT::i32, Legal);
    setOperationAction(ISD::CTPOP, MVT::i64, Legal);
  
+  // PTX does not directly support SELP of i1, so promote to i32 first
+  setOperationAction(ISD::SELECT, MVT::i1, Custom);
+
    // We have some custom DAG combine patterns for these nodes
    setTargetDAGCombine(ISD::ADD);
    setTargetDAGCombine(ISD::AND);
@@ -261,7 +271,7 @@ NVPTXTargetLowering::NVPTXTargetLowering(NVPTXTargetMachine &TM)
  
    // Now deduce the information based on the above mentioned
    // actions
-  computeRegisterProperties();
+  computeRegisterProperties(STI.getRegisterInfo());
  }
  
  const char *NVPTXTargetLowering::getTargetNodeName(unsigned Opcode) const {
@@ -869,7 +879,7 @@ NVPTXTargetLowering::getPrototype(Type *retTy, const ArgListTy &Args,
                                    unsigned retAlignment,
                                    const ImmutableCallSite *CS) const {
  
-  bool isABI = (nvptxSubtarget.getSmVersion() >= 20);
+  bool isABI = (STI.getSmVersion() >= 20);
    assert(isABI && "Non-ABI compilation is not supported");
    if (!isABI)
      return "";
@@ -896,16 +906,14 @@ NVPTXTargetLowering::getPrototype(Type *retTy, const ArgListTy &Args,
        O << ".param .b" << size << " _";
      } else if (isa<PointerType>(retTy)) {
        O << ".param .b" << getPointerTy().getSizeInBits() << " _";
+    } else if ((retTy->getTypeID() == Type::StructTyID) ||
+               isa<VectorType>(retTy)) {
+      O << ".param .align "
+        << retAlignment
+        << " .b8 _["
+        << getDataLayout()->getTypeAllocSize(retTy) << "]";
      } else {
-      if((retTy->getTypeID() == Type::StructTyID) ||
-         isa<VectorType>(retTy)) {
-        O << ".param .align "
-          << retAlignment
-          << " .b8 _["
-          << getDataLayout()->getTypeAllocSize(retTy) << "]";
-      } else {
-        assert(false && "Unknown return type");
-      }
+      llvm_unreachable("Unknown return type");
      }
      O << ") ";
    }
@@ -922,7 +930,7 @@ NVPTXTargetLowering::getPrototype(Type *retTy, const ArgListTy &Args,
      }
      first = false;
  
-    if (Outs[OIdx].Flags.isByVal() == false) {
+    if (!Outs[OIdx].Flags.isByVal()) {
        if (Ty->isAggregateType() || Ty->isVectorTy()) {
          unsigned align = 0;
          const CallInst *CallI = cast<CallInst>(CS->getInstruction());
@@ -1036,7 +1044,7 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
    Type *retTy = CLI.RetTy;
    ImmutableCallSite *CS = CLI.CS;
  
-  bool isABI = (nvptxSubtarget.getSmVersion() >= 20);
+  bool isABI = (STI.getSmVersion() >= 20);
    assert(isABI && "Non-ABI compilation is not supported");
    if (!isABI)
      return Chain;
@@ -1045,9 +1053,9 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
    const Function *F = MF.getFunction();
  
    SDValue tempChain = Chain;
-  Chain =
-      DAG.getCALLSEQ_START(Chain, DAG.getIntPtrConstant(uniqueCallSite, true),
-                           dl);
+  Chain = DAG.getCALLSEQ_START(Chain,
+                               DAG.getIntPtrConstant(uniqueCallSite, dl, true),
+                               dl);
    SDValue InFlag = Chain.getValue(1);
  
    unsigned paramCount = 0;
@@ -1067,7 +1075,7 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
      EVT VT = Outs[OIdx].VT;
      Type *Ty = Args[i].Ty;
  
-    if (Outs[OIdx].Flags.isByVal() == false) {
+    if (!Outs[OIdx].Flags.isByVal()) {
        if (Ty->isAggregateType()) {
          // aggregate
          SmallVector<EVT, 16> vtparts;
@@ -1078,9 +1086,11 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
          // declare .param .align <align> .b8 .param<n>[<size>];
          unsigned sz = TD->getTypeAllocSize(Ty);
          SDVTList DeclareParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-        SDValue DeclareParamOps[] = { Chain, DAG.getConstant(align, MVT::i32),
-                                      DAG.getConstant(paramCount, MVT::i32),
-                                      DAG.getConstant(sz, MVT::i32), InFlag };
+        SDValue DeclareParamOps[] = { Chain, DAG.getConstant(align, dl,
+                                                             MVT::i32),
+                                      DAG.getConstant(paramCount, dl, MVT::i32),
+                                      DAG.getConstant(sz, dl, MVT::i32),
+                                      InFlag };
          Chain = DAG.getNode(NVPTXISD::DeclareParam, dl, DeclareParamVTs,
                              DeclareParamOps);
          InFlag = Chain.getValue(1);
@@ -1095,8 +1105,8 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
            }
            SDVTList CopyParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
            SDValue CopyParamOps[] = { Chain,
-                                     DAG.getConstant(paramCount, MVT::i32),
-                                     DAG.getConstant(Offsets[j], MVT::i32),
+                                     DAG.getConstant(paramCount, dl, MVT::i32),
+                                     DAG.getConstant(Offsets[j], dl, MVT::i32),
                                       StVal, InFlag };
            Chain = DAG.getMemIntrinsicNode(NVPTXISD::StoreParam, dl,
                                            CopyParamVTs, CopyParamOps,
@@ -1116,9 +1126,11 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
          // declare .param .align <align> .b8 .param<n>[<size>];
          unsigned sz = TD->getTypeAllocSize(Ty);
          SDVTList DeclareParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-        SDValue DeclareParamOps[] = { Chain, DAG.getConstant(align, MVT::i32),
-                                      DAG.getConstant(paramCount, MVT::i32),
-                                      DAG.getConstant(sz, MVT::i32), InFlag };
+        SDValue DeclareParamOps[] = { Chain,
+                                      DAG.getConstant(align, dl, MVT::i32),
+                                      DAG.getConstant(paramCount, dl, MVT::i32),
+                                      DAG.getConstant(sz, dl, MVT::i32),
+                                      InFlag };
          Chain = DAG.getNode(NVPTXISD::DeclareParam, dl, DeclareParamVTs,
                              DeclareParamOps);
          InFlag = Chain.getValue(1);
@@ -1139,8 +1151,8 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
  
            SDVTList CopyParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
            SDValue CopyParamOps[] = { Chain,
-                                     DAG.getConstant(paramCount, MVT::i32),
-                                     DAG.getConstant(0, MVT::i32), Elt,
+                                     DAG.getConstant(paramCount, dl, MVT::i32),
+                                     DAG.getConstant(0, dl, MVT::i32), Elt,
                                       InFlag };
            Chain = DAG.getMemIntrinsicNode(NVPTXISD::StoreParam, dl,
                                            CopyParamVTs, CopyParamOps,
@@ -1156,9 +1168,9 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
  
            SDVTList CopyParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
            SDValue CopyParamOps[] = { Chain,
-                                     DAG.getConstant(paramCount, MVT::i32),
-                                     DAG.getConstant(0, MVT::i32), Elt0, Elt1,
-                                     InFlag };
+                                     DAG.getConstant(paramCount, dl, MVT::i32),
+                                     DAG.getConstant(0, dl, MVT::i32), Elt0,
+                                     Elt1, InFlag };
            Chain = DAG.getMemIntrinsicNode(NVPTXISD::StoreParamV2, dl,
                                            CopyParamVTs, CopyParamOps,
                                            MemVT, MachinePointerInfo());
@@ -1188,8 +1200,8 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
              SDValue StoreVal;
              SmallVector<SDValue, 8> Ops;
              Ops.push_back(Chain);
-            Ops.push_back(DAG.getConstant(paramCount, MVT::i32));
-            Ops.push_back(DAG.getConstant(curOffset, MVT::i32));
+            Ops.push_back(DAG.getConstant(paramCount, dl, MVT::i32));
+            Ops.push_back(DAG.getConstant(curOffset, dl, MVT::i32));
  
              unsigned Opc = NVPTXISD::StoreParamV2;
  
@@ -1256,9 +1268,9 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
        }
        SDVTList DeclareParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
        SDValue DeclareParamOps[] = { Chain,
-                                    DAG.getConstant(paramCount, MVT::i32),
-                                    DAG.getConstant(sz, MVT::i32),
-                                    DAG.getConstant(0, MVT::i32), InFlag };
+                                    DAG.getConstant(paramCount, dl, MVT::i32),
+                                    DAG.getConstant(sz, dl, MVT::i32),
+                                    DAG.getConstant(0, dl, MVT::i32), InFlag };
        Chain = DAG.getNode(NVPTXISD::DeclareScalarParam, dl, DeclareParamVTs,
                            DeclareParamOps);
        InFlag = Chain.getValue(1);
@@ -1271,8 +1283,10 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
          OutV = DAG.getNode(opc, dl, MVT::i16, OutV);
        }
        SDVTList CopyParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-      SDValue CopyParamOps[] = { Chain, DAG.getConstant(paramCount, MVT::i32),
-                                 DAG.getConstant(0, MVT::i32), OutV, InFlag };
+      SDValue CopyParamOps[] = { Chain,
+                                 DAG.getConstant(paramCount, dl, MVT::i32),
+                                 DAG.getConstant(0, dl, MVT::i32), OutV,
+                                 InFlag };
  
        unsigned opcode = NVPTXISD::StoreParam;
        if (Outs[OIdx].Flags.isZExt())
@@ -1301,9 +1315,9 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
      // so we don't need to worry about natural alignment or not.
      // See TargetLowering::LowerCallTo().
      SDValue DeclareParamOps[] = {
-      Chain, DAG.getConstant(Outs[OIdx].Flags.getByValAlign(), MVT::i32),
-      DAG.getConstant(paramCount, MVT::i32), DAG.getConstant(sz, MVT::i32),
-      InFlag
+      Chain, DAG.getConstant(Outs[OIdx].Flags.getByValAlign(), dl, MVT::i32),
+      DAG.getConstant(paramCount, dl, MVT::i32),
+      DAG.getConstant(sz, dl, MVT::i32), InFlag
      };
      Chain = DAG.getNode(NVPTXISD::DeclareParam, dl, DeclareParamVTs,
                          DeclareParamOps);
@@ -1314,7 +1328,7 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
        unsigned PartAlign = GreatestCommonDivisor64(ArgAlign, curOffset);
        SDValue srcAddr =
            DAG.getNode(ISD::ADD, dl, getPointerTy(), OutVals[OIdx],
-                      DAG.getConstant(curOffset, getPointerTy()));
+                      DAG.getConstant(curOffset, dl, getPointerTy()));
        SDValue theVal = DAG.getLoad(elemtype, dl, tempChain, srcAddr,
                                     MachinePointerInfo(), false, false, false,
                                     PartAlign);
@@ -1322,9 +1336,10 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
          theVal = DAG.getNode(ISD::ANY_EXTEND, dl, MVT::i16, theVal);
        }
        SDVTList CopyParamVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-      SDValue CopyParamOps[] = { Chain, DAG.getConstant(paramCount, MVT::i32),
-                                 DAG.getConstant(curOffset, MVT::i32), theVal,
-                                 InFlag };
+      SDValue CopyParamOps[] = { Chain,
+                                 DAG.getConstant(paramCount, dl, MVT::i32),
+                                 DAG.getConstant(curOffset, dl, MVT::i32),
+                                 theVal, InFlag };
        Chain = DAG.getMemIntrinsicNode(NVPTXISD::StoreParam, dl, CopyParamVTs,
                                        CopyParamOps, elemtype,
                                        MachinePointerInfo());
@@ -1346,14 +1361,19 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
      //  .param .align 16 .b8 retval0[<size-in-bytes>], or
      //  .param .b<size-in-bits> retval0
      unsigned resultsz = TD->getTypeAllocSizeInBits(retTy);
-    if (retTy->isSingleValueType()) {
+    // Emit ".param .b<size-in-bits> retval0" instead of byte arrays only for
+    // these three types to match the logic in
+    // NVPTXAsmPrinter::printReturnValStr and NVPTXTargetLowering::getPrototype.
+    // Plus, this behavior is consistent with nvcc's.
+    if (retTy->isFloatingPointTy() || retTy->isIntegerTy() ||
+        retTy->isPointerTy()) {
        // Scalar needs to be at least 32bit wide
        if (resultsz < 32)
          resultsz = 32;
        SDVTList DeclareRetVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-      SDValue DeclareRetOps[] = { Chain, DAG.getConstant(1, MVT::i32),
-                                  DAG.getConstant(resultsz, MVT::i32),
-                                  DAG.getConstant(0, MVT::i32), InFlag };
+      SDValue DeclareRetOps[] = { Chain, DAG.getConstant(1, dl, MVT::i32),
+                                  DAG.getConstant(resultsz, dl, MVT::i32),
+                                  DAG.getConstant(0, dl, MVT::i32), InFlag };
        Chain = DAG.getNode(NVPTXISD::DeclareRet, dl, DeclareRetVTs,
                            DeclareRetOps);
        InFlag = Chain.getValue(1);
@@ -1361,9 +1381,9 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
        retAlignment = getArgumentAlignment(Callee, CS, retTy, 0);
        SDVTList DeclareRetVTs = DAG.getVTList(MVT::Other, MVT::Glue);
        SDValue DeclareRetOps[] = { Chain,
-                                  DAG.getConstant(retAlignment, MVT::i32),
-                                  DAG.getConstant(resultsz / 8, MVT::i32),
-                                  DAG.getConstant(0, MVT::i32), InFlag };
+                                  DAG.getConstant(retAlignment, dl, MVT::i32),
+                                  DAG.getConstant(resultsz / 8, dl, MVT::i32),
+                                  DAG.getConstant(0, dl, MVT::i32), InFlag };
        Chain = DAG.getNode(NVPTXISD::DeclareRetParam, dl, DeclareRetVTs,
                            DeclareRetOps);
        InFlag = Chain.getValue(1);
@@ -1391,7 +1411,7 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
    // Op to just print "call"
    SDVTList PrintCallVTs = DAG.getVTList(MVT::Other, MVT::Glue);
    SDValue PrintCallOps[] = {
-    Chain, DAG.getConstant((Ins.size() == 0) ? 0 : 1, MVT::i32), InFlag
+    Chain, DAG.getConstant((Ins.size() == 0) ? 0 : 1, dl, MVT::i32), InFlag
    };
    Chain = DAG.getNode(Func ? (NVPTXISD::PrintCallUni) : (NVPTXISD::PrintCall),
                        dl, PrintCallVTs, PrintCallOps);
@@ -1417,20 +1437,22 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
      else
        opcode = NVPTXISD::CallArg;
      SDVTList CallArgVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-    SDValue CallArgOps[] = { Chain, DAG.getConstant(1, MVT::i32),
-                             DAG.getConstant(i, MVT::i32), InFlag };
+    SDValue CallArgOps[] = { Chain, DAG.getConstant(1, dl, MVT::i32),
+                             DAG.getConstant(i, dl, MVT::i32), InFlag };
      Chain = DAG.getNode(opcode, dl, CallArgVTs, CallArgOps);
      InFlag = Chain.getValue(1);
    }
    SDVTList CallArgEndVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-  SDValue CallArgEndOps[] = { Chain, DAG.getConstant(Func ? 1 : 0, MVT::i32),
+  SDValue CallArgEndOps[] = { Chain,
+                              DAG.getConstant(Func ? 1 : 0, dl, MVT::i32),
                                InFlag };
    Chain = DAG.getNode(NVPTXISD::CallArgEnd, dl, CallArgEndVTs, CallArgEndOps);
    InFlag = Chain.getValue(1);
  
    if (!Func) {
      SDVTList PrototypeVTs = DAG.getVTList(MVT::Other, MVT::Glue);
-    SDValue PrototypeOps[] = { Chain, DAG.getConstant(uniqueCallSite, MVT::i32),
+    SDValue PrototypeOps[] = { Chain,
+                               DAG.getConstant(uniqueCallSite, dl, MVT::i32),
                                 InFlag };
      Chain = DAG.getNode(NVPTXISD::Prototype, dl, PrototypeVTs, PrototypeOps);
      InFlag = Chain.getValue(1);
@@ -1442,11 +1464,11 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
        EVT ObjectVT = getValueType(retTy);
        unsigned NumElts = ObjectVT.getVectorNumElements();
        EVT EltVT = ObjectVT.getVectorElementType();
-      assert(nvTM->getTargetLowering()->getNumRegisters(F->getContext(),
-                                                        ObjectVT) == NumElts &&
+      assert(STI.getTargetLowering()->getNumRegisters(F->getContext(),
+                                                      ObjectVT) == NumElts &&
               "Vector was not scalarized");
        unsigned sz = EltVT.getSizeInBits();
-      bool needTruncate = sz < 8 ? true : false;
+      bool needTruncate = sz < 8;
  
        if (NumElts == 1) {
          // Just a simple load
@@ -1461,11 +1483,8 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
            LoadRetVTs.push_back(EltVT);
          LoadRetVTs.push_back(MVT::Other);
          LoadRetVTs.push_back(MVT::Glue);
-        SmallVector<SDValue, 4> LoadRetOps;
-        LoadRetOps.push_back(Chain);
-        LoadRetOps.push_back(DAG.getConstant(1, MVT::i32));
-        LoadRetOps.push_back(DAG.getConstant(0, MVT::i32));
-        LoadRetOps.push_back(InFlag);
+        SDValue LoadRetOps[] = {Chain, DAG.getConstant(1, dl, MVT::i32),
+                                DAG.getConstant(0, dl, MVT::i32), InFlag};
          SDValue retval = DAG.getMemIntrinsicNode(
              NVPTXISD::LoadParam, dl,
              DAG.getVTList(LoadRetVTs), LoadRetOps, EltVT, MachinePointerInfo());
@@ -1491,11 +1510,8 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
          }
          LoadRetVTs.push_back(MVT::Other);
          LoadRetVTs.push_back(MVT::Glue);
-        SmallVector<SDValue, 4> LoadRetOps;
-        LoadRetOps.push_back(Chain);
-        LoadRetOps.push_back(DAG.getConstant(1, MVT::i32));
-        LoadRetOps.push_back(DAG.getConstant(0, MVT::i32));
-        LoadRetOps.push_back(InFlag);
+        SDValue LoadRetOps[] = {Chain, DAG.getConstant(1, dl, MVT::i32),
+                                DAG.getConstant(0, dl, MVT::i32), InFlag};
          SDValue retval = DAG.getMemIntrinsicNode(
              NVPTXISD::LoadParamV2, dl,
              DAG.getVTList(LoadRetVTs), LoadRetOps, EltVT, MachinePointerInfo());
@@ -1537,11 +1553,8 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
            }
            LoadRetVTs.push_back(MVT::Other);
            LoadRetVTs.push_back(MVT::Glue);
-          SmallVector<SDValue, 4> LoadRetOps;
-          LoadRetOps.push_back(Chain);
-          LoadRetOps.push_back(DAG.getConstant(1, MVT::i32));
-          LoadRetOps.push_back(DAG.getConstant(Ofst, MVT::i32));
-          LoadRetOps.push_back(InFlag);
+          SDValue LoadRetOps[] = {Chain, DAG.getConstant(1, dl, MVT::i32),
+                                  DAG.getConstant(Ofst, dl, MVT::i32), InFlag};
            SDValue retval = DAG.getMemIntrinsicNode(
                Opc, dl, DAG.getVTList(LoadRetVTs),
                LoadRetOps, EltVT, MachinePointerInfo());
@@ -1573,7 +1586,7 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
        for (unsigned i = 0, e = Ins.size(); i != e; ++i) {
          unsigned sz = VTs[i].getSizeInBits();
          unsigned AlignI = GreatestCommonDivisor64(RetAlign, Offsets[i]);
-        bool needTruncate = sz < 8 ? true : false;
+        bool needTruncate = sz < 8;
          if (VTs[i].isInteger() && (sz < 8))
            sz = 8;
  
@@ -1595,11 +1608,9 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
          LoadRetVTs.push_back(MVT::Other);
          LoadRetVTs.push_back(MVT::Glue);
  
-        SmallVector<SDValue, 4> LoadRetOps;
-        LoadRetOps.push_back(Chain);
-        LoadRetOps.push_back(DAG.getConstant(1, MVT::i32));
-        LoadRetOps.push_back(DAG.getConstant(Offsets[i], MVT::i32));
-        LoadRetOps.push_back(InFlag);
+        SDValue LoadRetOps[] = {Chain, DAG.getConstant(1, dl, MVT::i32),
+                                DAG.getConstant(Offsets[i], dl, MVT::i32),
+                                InFlag};
          SDValue retval = DAG.getMemIntrinsicNode(
              NVPTXISD::LoadParam, dl,
              DAG.getVTList(LoadRetVTs), LoadRetOps,
@@ -1614,8 +1625,10 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
      }
    }
  
-  Chain = DAG.getCALLSEQ_END(Chain, DAG.getIntPtrConstant(uniqueCallSite, true),
-                             DAG.getIntPtrConstant(uniqueCallSite + 1, true),
+  Chain = DAG.getCALLSEQ_END(Chain,
+                             DAG.getIntPtrConstant(uniqueCallSite, dl, true),
+                             DAG.getIntPtrConstant(uniqueCallSite + 1, dl,
+                                                   true),
                               InFlag, dl);
    uniqueCallSite++;
  
@@ -1641,7 +1654,7 @@ NVPTXTargetLowering::LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG) const {
      unsigned NumSubElem = VVT.getVectorNumElements();
      for (unsigned j = 0; j < NumSubElem; ++j) {
        Ops.push_back(DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, EltVT, SubOp,
-                                DAG.getIntPtrConstant(j)));
+                                DAG.getIntPtrConstant(j, dl)));
      }
    }
    return DAG.getNode(ISD::BUILD_VECTOR, dl, Node->getValueType(0), Ops);
@@ -1665,7 +1678,7 @@ SDValue NVPTXTargetLowering::LowerShiftRightParts(SDValue Op,
    SDValue ShAmt  = Op.getOperand(2);
    unsigned Opc = (Op.getOpcode() == ISD::SRA_PARTS) ? ISD::SRA : ISD::SRL;
  
-  if (VTBits == 32 && nvptxSubtarget.getSmVersion() >= 35) {
+  if (VTBits == 32 && STI.getSmVersion() >= 35) {
  
      // For 32bit and sm35, we can use the funnel shift 'shf' instruction.
      // {dHi, dLo} = {aHi, aLo} >> Amt
@@ -1690,16 +1703,18 @@ SDValue NVPTXTargetLowering::LowerShiftRightParts(SDValue Op,
      //      dHi = aHi >> Amt
  
      SDValue RevShAmt = DAG.getNode(ISD::SUB, dl, MVT::i32,
-                                   DAG.getConstant(VTBits, MVT::i32), ShAmt);
+                                   DAG.getConstant(VTBits, dl, MVT::i32),
+                                   ShAmt);
      SDValue Tmp1 = DAG.getNode(ISD::SRL, dl, VT, ShOpLo, ShAmt);
      SDValue ExtraShAmt = DAG.getNode(ISD::SUB, dl, MVT::i32, ShAmt,
-                                     DAG.getConstant(VTBits, MVT::i32));
+                                     DAG.getConstant(VTBits, dl, MVT::i32));
      SDValue Tmp2 = DAG.getNode(ISD::SHL, dl, VT, ShOpHi, RevShAmt);
      SDValue FalseVal = DAG.getNode(ISD::OR, dl, VT, Tmp1, Tmp2);
      SDValue TrueVal = DAG.getNode(Opc, dl, VT, ShOpHi, ExtraShAmt);
  
      SDValue Cmp = DAG.getSetCC(dl, MVT::i1, ShAmt,
-                               DAG.getConstant(VTBits, MVT::i32), ISD::SETGE);
+                               DAG.getConstant(VTBits, dl, MVT::i32),
+                               ISD::SETGE);
      SDValue Hi = DAG.getNode(Opc, dl, VT, ShOpHi, ShAmt);
      SDValue Lo = DAG.getNode(ISD::SELECT, dl, VT, Cmp, TrueVal, FalseVal);
  
@@ -1725,7 +1740,7 @@ SDValue NVPTXTargetLowering::LowerShiftLeftParts(SDValue Op,
    SDValue ShOpHi = Op.getOperand(1);
    SDValue ShAmt  = Op.getOperand(2);
  
-  if (VTBits == 32 && nvptxSubtarget.getSmVersion() >= 35) {
+  if (VTBits == 32 && STI.getSmVersion() >= 35) {
  
      // For 32bit and sm35, we can use the funnel shift 'shf' instruction.
      // {dHi, dLo} = {aHi, aLo} << Amt
@@ -1750,16 +1765,18 @@ SDValue NVPTXTargetLowering::LowerShiftLeftParts(SDValue Op,
      //      dHi = (aHi << Amt) | (aLo >> (size-Amt))
  
      SDValue RevShAmt = DAG.getNode(ISD::SUB, dl, MVT::i32,
-                                   DAG.getConstant(VTBits, MVT::i32), ShAmt);
+                                   DAG.getConstant(VTBits, dl, MVT::i32),
+                                   ShAmt);
      SDValue Tmp1 = DAG.getNode(ISD::SHL, dl, VT, ShOpHi, ShAmt);
      SDValue ExtraShAmt = DAG.getNode(ISD::SUB, dl, MVT::i32, ShAmt,
-                                     DAG.getConstant(VTBits, MVT::i32));
+                                     DAG.getConstant(VTBits, dl, MVT::i32));
      SDValue Tmp2 = DAG.getNode(ISD::SRL, dl, VT, ShOpLo, RevShAmt);
      SDValue FalseVal = DAG.getNode(ISD::OR, dl, VT, Tmp1, Tmp2);
      SDValue TrueVal = DAG.getNode(ISD::SHL, dl, VT, ShOpLo, ExtraShAmt);
  
      SDValue Cmp = DAG.getSetCC(dl, MVT::i1, ShAmt,
-                               DAG.getConstant(VTBits, MVT::i32), ISD::SETGE);
+                               DAG.getConstant(VTBits, dl, MVT::i32),
+                               ISD::SETGE);
      SDValue Lo = DAG.getNode(ISD::SHL, dl, VT, ShOpLo, ShAmt);
      SDValue Hi = DAG.getNode(ISD::SELECT, dl, VT, Cmp, TrueVal, FalseVal);
  
@@ -1793,11 +1810,29 @@ NVPTXTargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
    case ISD::SRA_PARTS:
    case ISD::SRL_PARTS:
      return LowerShiftRightParts(Op, DAG);
+  case ISD::SELECT:
+    return LowerSelect(Op, DAG);
    default:
      llvm_unreachable("Custom lowering not defined for operation");
    }
  }
  
+SDValue NVPTXTargetLowering::LowerSelect(SDValue Op, SelectionDAG &DAG) const {
+  SDValue Op0 = Op->getOperand(0);
+  SDValue Op1 = Op->getOperand(1);
+  SDValue Op2 = Op->getOperand(2);
+  SDLoc DL(Op.getNode());
+
+  assert(Op.getValueType() == MVT::i1 && "Custom lowering enabled only for i1");
+
+  Op1 = DAG.getNode(ISD::ANY_EXTEND, DL, MVT::i32, Op1);
+  Op2 = DAG.getNode(ISD::ANY_EXTEND, DL, MVT::i32, Op2);
+  SDValue Select = DAG.getNode(ISD::SELECT, DL, MVT::i32, Op0, Op1, Op2);
+  SDValue Trunc = DAG.getNode(ISD::TRUNCATE, DL, MVT::i1, Select);
+
+  return Trunc;
+}
+
  SDValue NVPTXTargetLowering::LowerLOAD(SDValue Op, SelectionDAG &DAG) const {
    if (Op.getValueType() == MVT::i1)
      return LowerLOADi1(Op, DAG);
@@ -1914,16 +1949,14 @@ NVPTXTargetLowering::LowerSTOREVector(SDValue Op, SelectionDAG &DAG) const {
      // Then the split values
      for (unsigned i = 0; i < NumElts; ++i) {
        SDValue ExtVal = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, EltVT, Val,
-                                   DAG.getIntPtrConstant(i));
+                                   DAG.getIntPtrConstant(i, DL));
        if (NeedExt)
          ExtVal = DAG.getNode(ISD::ANY_EXTEND, DL, MVT::i16, ExtVal);
        Ops.push_back(ExtVal);
      }
  
      // Then any remaining arguments
-    for (unsigned i = 2, e = N->getNumOperands(); i != e; ++i) {
-      Ops.push_back(N->getOperand(i));
-    }
+    Ops.append(N->op_begin() + 2, N->op_end());
  
      SDValue NewSt = DAG.getMemIntrinsicNode(
          Opcode, DL, DAG.getVTList(MVT::Other), Ops,
@@ -2019,13 +2052,13 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
  
    const Function *F = MF.getFunction();
    const AttributeSet &PAL = F->getAttributes();
-  const TargetLowering *TLI = DAG.getTarget().getTargetLowering();
+  const TargetLowering *TLI = STI.getTargetLowering();
  
    SDValue Root = DAG.getRoot();
    std::vector<SDValue> OutChains;
  
    bool isKernel = llvm::isKernelFunction(*F);
-  bool isABI = (nvptxSubtarget.getSmVersion() >= 20);
+  bool isABI = (STI.getSmVersion() >= 20);
    assert(isABI && "Non-ABI compilation is not supported");
    if (!isABI)
      return Chain;
@@ -2060,7 +2093,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
              (theArgs[i]->getParent() ? theArgs[i]->getParent()->getParent()
                                       : nullptr))) {
        assert(isKernel && "Only kernels can have image/sampler params");
-      InVals.push_back(DAG.getConstant(i + 1, MVT::i32));
+      InVals.push_back(DAG.getConstant(i + 1, dl, MVT::i32));
        continue;
      }
  
@@ -2099,7 +2132,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
      // to newly created nodes. The SDNodes for params have to
      // appear in the same order as their order of appearance
      // in the original function. "idx+1" holds that order.
-    if (PAL.hasAttribute(i + 1, Attribute::ByVal) == false) {
+    if (!PAL.hasAttribute(i + 1, Attribute::ByVal)) {
        if (Ty->isAggregateType()) {
          SmallVector<EVT, 16> vtparts;
          SmallVector<uint64_t, 16> offsets;
@@ -2122,7 +2155,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
                                 llvm::ADDRESS_SPACE_PARAM));
            SDValue srcAddr =
                DAG.getNode(ISD::ADD, dl, getPointerTy(), Arg,
-                          DAG.getConstant(offsets[parti], getPointerTy()));
+                          DAG.getConstant(offsets[parti], dl, getPointerTy()));
            unsigned partAlign =
                aggregateIsPacked ? 1
                                  : TD->getABITypeAlignment(
@@ -2133,7 +2166,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
                                       ISD::SEXTLOAD : ISD::ZEXTLOAD;
              p = DAG.getExtLoad(ExtOp, dl, Ins[InsIdx].VT, Root, srcAddr,
                                 MachinePointerInfo(srcValue), partVT, false,
-                               false, partAlign);
+                               false, false, partAlign);
            } else {
              p = DAG.getLoad(partVT, dl, Root, srcAddr,
                              MachinePointerInfo(srcValue), false, false, false,
@@ -2154,7 +2187,6 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
          unsigned NumElts = ObjectVT.getVectorNumElements();
          assert(TLI->getNumRegisters(F->getContext(), ObjectVT) == NumElts &&
                 "Vector was not scalarized");
-        unsigned Ofst = 0;
          EVT EltVT = ObjectVT.getVectorElementType();
  
          // V1 load
@@ -2163,10 +2195,8 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
            // We only have one element, so just directly load it
            Value *SrcValue = Constant::getNullValue(PointerType::get(
                EltVT.getTypeForEVT(F->getContext()), llvm::ADDRESS_SPACE_PARAM));
-          SDValue SrcAddr = DAG.getNode(ISD::ADD, dl, getPointerTy(), Arg,
-                                        DAG.getConstant(Ofst, getPointerTy()));
            SDValue P = DAG.getLoad(
-              EltVT, dl, Root, SrcAddr, MachinePointerInfo(SrcValue), false,
+              EltVT, dl, Root, Arg, MachinePointerInfo(SrcValue), false,
                false, true,
                TD->getABITypeAlignment(EltVT.getTypeForEVT(F->getContext())));
            if (P.getNode())
@@ -2175,7 +2205,6 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
            if (Ins[InsIdx].VT.getSizeInBits() > EltVT.getSizeInBits())
              P = DAG.getNode(ISD::ANY_EXTEND, dl, Ins[InsIdx].VT, P);
            InVals.push_back(P);
-          Ofst += TD->getTypeAllocSize(EltVT.getTypeForEVT(F->getContext()));
            ++InsIdx;
          } else if (NumElts == 2) {
            // V2 load
@@ -2183,19 +2212,17 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
            EVT VecVT = EVT::getVectorVT(F->getContext(), EltVT, 2);
            Value *SrcValue = Constant::getNullValue(PointerType::get(
                VecVT.getTypeForEVT(F->getContext()), llvm::ADDRESS_SPACE_PARAM));
-          SDValue SrcAddr = DAG.getNode(ISD::ADD, dl, getPointerTy(), Arg,
-                                        DAG.getConstant(Ofst, getPointerTy()));
            SDValue P = DAG.getLoad(
-              VecVT, dl, Root, SrcAddr, MachinePointerInfo(SrcValue), false,
+              VecVT, dl, Root, Arg, MachinePointerInfo(SrcValue), false,
                false, true,
                TD->getABITypeAlignment(VecVT.getTypeForEVT(F->getContext())));
            if (P.getNode())
              P.getNode()->setIROrder(idx + 1);
  
            SDValue Elt0 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, EltVT, P,
-                                     DAG.getIntPtrConstant(0));
+                                     DAG.getIntPtrConstant(0, dl));
            SDValue Elt1 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, EltVT, P,
-                                     DAG.getIntPtrConstant(1));
+                                     DAG.getIntPtrConstant(1, dl));
  
            if (Ins[InsIdx].VT.getSizeInBits() > EltVT.getSizeInBits()) {
              Elt0 = DAG.getNode(ISD::ANY_EXTEND, dl, Ins[InsIdx].VT, Elt0);
@@ -2204,7 +2231,6 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
  
            InVals.push_back(Elt0);
            InVals.push_back(Elt1);
-          Ofst += TD->getTypeAllocSize(VecVT.getTypeForEVT(F->getContext()));
            InsIdx += 2;
          } else {
            // V4 loads
@@ -2222,13 +2248,14 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
              VecSize = 2;
            }
            EVT VecVT = EVT::getVectorVT(F->getContext(), EltVT, VecSize);
+          unsigned Ofst = 0;
            for (unsigned i = 0; i < NumElts; i += VecSize) {
              Value *SrcValue = Constant::getNullValue(
                  PointerType::get(VecVT.getTypeForEVT(F->getContext()),
                                   llvm::ADDRESS_SPACE_PARAM));
              SDValue SrcAddr =
                  DAG.getNode(ISD::ADD, dl, getPointerTy(), Arg,
-                            DAG.getConstant(Ofst, getPointerTy()));
+                            DAG.getConstant(Ofst, dl, getPointerTy()));
              SDValue P = DAG.getLoad(
                  VecVT, dl, Root, SrcAddr, MachinePointerInfo(SrcValue), false,
                  false, true,
@@ -2240,7 +2267,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
                if (i + j >= NumElts)
                  break;
                SDValue Elt = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, EltVT, P,
-                                        DAG.getIntPtrConstant(j));
+                                        DAG.getIntPtrConstant(j, dl));
                if (Ins[InsIdx].VT.getSizeInBits() > EltVT.getSizeInBits())
                  Elt = DAG.getNode(ISD::ANY_EXTEND, dl, Ins[InsIdx].VT, Elt);
                InVals.push_back(Elt);
@@ -2266,6 +2293,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
                                         ISD::SEXTLOAD : ISD::ZEXTLOAD;
          p = DAG.getExtLoad(ExtOp, dl, Ins[InsIdx].VT, Root, Arg,
                             MachinePointerInfo(srcValue), ObjectVT, false, false,
+                           false,
          TD->getABITypeAlignment(ObjectVT.getTypeForEVT(F->getContext())));
        } else {
          p = DAG.getLoad(Ins[InsIdx].VT, dl, Root, Arg,
@@ -2297,7 +2325,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
      else {
        SDValue p2 = DAG.getNode(
            ISD::INTRINSIC_WO_CHAIN, dl, ObjectVT,
-          DAG.getConstant(Intrinsic::nvvm_ptr_local_to_gen, MVT::i32), p);
+          DAG.getConstant(Intrinsic::nvvm_ptr_local_to_gen, dl, MVT::i32), p);
        InVals.push_back(p2);
      }
    }
@@ -2328,7 +2356,7 @@ NVPTXTargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
    Type *RetTy = F->getReturnType();
    const DataLayout *TD = getDataLayout();
  
-  bool isABI = (nvptxSubtarget.getSmVersion() >= 20);
+  bool isABI = (STI.getSmVersion() >= 20);
    assert(isABI && "Non-ABI compilation is not supported");
    if (!isABI)
      return Chain;
@@ -2351,7 +2379,7 @@ NVPTXTargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
        // We only have one element, so just directly store it
        if (NeedExtend)
          StoreVal = DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::i16, StoreVal);
-      SDValue Ops[] = { Chain, DAG.getConstant(0, MVT::i32), StoreVal };
+      SDValue Ops[] = { Chain, DAG.getConstant(0, dl, MVT::i32), StoreVal };
        Chain = DAG.getMemIntrinsicNode(NVPTXISD::StoreRetval, dl,
                                        DAG.getVTList(MVT::Other), Ops,
                                        EltVT, MachinePointerInfo());
@@ -2366,7 +2394,7 @@ NVPTXTargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
          StoreVal1 = DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::i16, StoreVal1);
        }
  
-      SDValue Ops[] = { Chain, DAG.getConstant(0, MVT::i32), StoreVal0,
+      SDValue Ops[] = { Chain, DAG.getConstant(0, dl, MVT::i32), StoreVal0,
                          StoreVal1 };
        Chain = DAG.getMemIntrinsicNode(NVPTXISD::StoreRetvalV2, dl,
                                        DAG.getVTList(MVT::Other), Ops,
@@ -2398,7 +2426,7 @@ NVPTXTargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
          SDValue StoreVal;
          SmallVector<SDValue, 8> Ops;
          Ops.push_back(Chain);
-        Ops.push_back(DAG.getConstant(Offset, MVT::i32));
+        Ops.push_back(DAG.getConstant(Offset, dl, MVT::i32));
          unsigned Opc = NVPTXISD::StoreRetvalV2;
          EVT ExtendedVT = (NeedExtend) ? MVT::i16 : OutVals[0].getValueType();
  
@@ -2463,7 +2491,7 @@ NVPTXTargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
          if (TheValType.isVector())
            TmpVal = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl,
                                 TheValType.getVectorElementType(), TmpVal,
-                               DAG.getIntPtrConstant(j));
+                               DAG.getIntPtrConstant(j, dl));
          EVT TheStoreType = ValVTs[i];
          if (RetTy->isIntegerTy() &&
              TD->getTypeAllocSizeInBits(RetTy) < 32) {
@@ -2477,7 +2505,7 @@ NVPTXTargetLowering::LowerReturn(SDValue Chain, CallingConv::ID CallConv,
  
          SDValue Ops[] = {
            Chain,
-          DAG.getConstant(Offsets[i], MVT::i32),
+          DAG.getConstant(Offsets[i], dl, MVT::i32),
            TmpVal };
          Chain = DAG.getMemIntrinsicNode(NVPTXISD::StoreRetval, dl,
                                          DAG.getVTList(MVT::Other), Ops,
@@ -3260,16 +3288,7 @@ bool NVPTXTargetLowering::getTgtMemIntrinsic(
      Info.vol = 0;
      Info.readMem = true;
      Info.writeMem = false;
-
-    // alignment is available as metadata.
-    // Grab it and set the alignment.
-    assert(I.hasMetadataOtherThanDebugLoc() && "Must have alignment metadata");
-    MDNode *AlignMD = I.getMetadata("align");
-    assert(AlignMD && "Must have a non-null MDNode");
-    assert(AlignMD->getNumOperands() == 1 && "Must have a single operand");
-    Value *Align = AlignMD->getOperand(0);
-    int64_t Alignment = cast<ConstantInt>(Align)->getZExtValue();
-    Info.align = Alignment;
+    Info.align = cast<ConstantInt>(I.getArgOperand(1))->getZExtValue();
  
      return true;
    }
@@ -3289,16 +3308,7 @@ bool NVPTXTargetLowering::getTgtMemIntrinsic(
      Info.vol = 0;
      Info.readMem = true;
      Info.writeMem = false;
-
-    // alignment is available as metadata.
-    // Grab it and set the alignment.
-    assert(I.hasMetadataOtherThanDebugLoc() && "Must have alignment metadata");
-    MDNode *AlignMD = I.getMetadata("align");
-    assert(AlignMD && "Must have a non-null MDNode");
-    assert(AlignMD->getNumOperands() == 1 && "Must have a single operand");
-    Value *Align = AlignMD->getOperand(0);
-    int64_t Alignment = cast<ConstantInt>(Align)->getZExtValue();
-    Info.align = Alignment;
+    Info.align = cast<ConstantInt>(I.getArgOperand(1))->getZExtValue();
  
      return true;
    }
@@ -3766,7 +3776,8 @@ NVPTXTargetLowering::getConstraintType(const std::string &Constraint) const {
  }
  
  std::pair<unsigned, const TargetRegisterClass *>
-NVPTXTargetLowering::getRegForInlineAsmConstraint(const std::string &Constraint,
+NVPTXTargetLowering::getRegForInlineAsmConstraint(const TargetRegisterInfo *TRI,
+                                                  const std::string &Constraint,
                                                    MVT VT) const {
    if (Constraint.size() == 1) {
      switch (Constraint[0]) {
@@ -3787,7 +3798,7 @@ NVPTXTargetLowering::getRegForInlineAsmConstraint(const std::string &Constraint,
        return std::make_pair(0U, &NVPTX::Float64RegsRegClass);
      }
    }
-  return TargetLowering::getRegForInlineAsmConstraint(Constraint, VT);
+  return TargetLowering::getRegForInlineAsmConstraint(TRI, Constraint, VT);
  }
  
  /// getFunctionAlignment - Return the Log2 alignment of this function.
@@ -3799,7 +3810,31 @@ unsigned NVPTXTargetLowering::getFunctionAlignment(const Function *) const {
  //                         NVPTX DAG Combining
  //===----------------------------------------------------------------------===//
  
-extern unsigned FMAContractLevel;
+bool NVPTXTargetLowering::allowFMA(MachineFunction &MF,
+                                   CodeGenOpt::Level OptLevel) const {
+  const Function *F = MF.getFunction();
+  const TargetOptions &TO = MF.getTarget().Options;
+
+  // Always honor command-line argument
+  if (FMAContractLevelOpt.getNumOccurrences() > 0) {
+    return FMAContractLevelOpt > 0;
+  } else if (OptLevel == 0) {
+    // Do not contract if we're not optimizing the code
+    return false;
+  } else if (TO.AllowFPOpFusion == FPOpFusion::Fast || TO.UnsafeFPMath) {
+    // Honor TargetOptions flags that explicitly say fusion is okay
+    return true;
+  } else if (F->hasFnAttribute("unsafe-fp-math")) {
+    // Check for unsafe-fp-math=true coming from Clang
+    Attribute Attr = F->getFnAttribute("unsafe-fp-math");
+    StringRef Val = Attr.getValueAsString();
+    if (Val == "true")
+      return true;
+  }
+
+  // We did not have a clear indication that fusion is allowed, so assume not
+  return false;
+}
  
  /// PerformADDCombineWithOperands - Try DAG combinations for an ADD with
  /// operands N0 and N1.  This is a helper for PerformADDCombine that is
@@ -3833,7 +3868,9 @@ static SDValue PerformADDCombineWithOperands(SDNode *N, SDValue N0, SDValue N1,
    }
    else if (N0.getOpcode() == ISD::FMUL) {
      if (VT == MVT::f32 || VT == MVT::f64) {
-      if (FMAContractLevel == 0)
+      const auto *TLI = static_cast<const NVPTXTargetLowering *>(
+          &DAG.getTargetLoweringInfo());
+      if (!TLI->allowFMA(DAG.getMachineFunction(), OptLevel))
          return SDValue();
  
        // For floating point:
@@ -3872,7 +3909,7 @@ static SDValue PerformADDCombineWithOperands(SDNode *N, SDValue N0, SDValue N1,
          const SDNode *left = N0.getOperand(0).getNode();
          const SDNode *right = N0.getOperand(1).getNode();
  
-        if (dyn_cast<ConstantSDNode>(left) || dyn_cast<ConstantSDNode>(right))
+        if (isa<ConstantSDNode>(left) || isa<ConstantSDNode>(right))
            opIsLive = true;
  
          if (!opIsLive)
@@ -4018,13 +4055,13 @@ static bool IsMulWideOperandDemotable(SDValue Op,
    if (Op.getOpcode() == ISD::SIGN_EXTEND ||
        Op.getOpcode() == ISD::SIGN_EXTEND_INREG) {
      EVT OrigVT = Op.getOperand(0).getValueType();
-    if (OrigVT.getSizeInBits() == OptSize) {
+    if (OrigVT.getSizeInBits() <= OptSize) {
        S = Signed;
        return true;
      }
    } else if (Op.getOpcode() == ISD::ZERO_EXTEND) {
      EVT OrigVT = Op.getOperand(0).getValueType();
-    if (OrigVT.getSizeInBits() == OptSize) {
+    if (OrigVT.getSizeInBits() <= OptSize) {
        S = Unsigned;
        return true;
      }
@@ -4090,6 +4127,7 @@ static SDValue TryMULWIDECombine(SDNode *N,
      return SDValue();
    }
  
+  SDLoc DL(N);
    unsigned OptSize = MulType.getSizeInBits() >> 1;
    SDValue LHS = N->getOperand(0);
    SDValue RHS = N->getOperand(1);
@@ -4112,7 +4150,7 @@ static SDValue TryMULWIDECombine(SDNode *N,
      unsigned BitWidth = MulType.getSizeInBits();
      if (ShiftAmt.sge(0) && ShiftAmt.slt(BitWidth)) {
        APInt MulVal = APInt(BitWidth, 1) << ShiftAmt;
-      RHS = DCI.DAG.getConstant(MulVal, MulType);
+      RHS = DCI.DAG.getConstant(MulVal, DL, MulType);
      } else {
        return SDValue();
      }
@@ -4134,9 +4172,9 @@ static SDValue TryMULWIDECombine(SDNode *N,
    // Truncate the operands to the correct size. Note that these are just for
    // type consistency and will (likely) be eliminated in later phases.
    SDValue TruncLHS =
-    DCI.DAG.getNode(ISD::TRUNCATE, SDLoc(N), DemotedVT, LHS);
+    DCI.DAG.getNode(ISD::TRUNCATE, DL, DemotedVT, LHS);
    SDValue TruncRHS =
-    DCI.DAG.getNode(ISD::TRUNCATE, SDLoc(N), DemotedVT, RHS);
+    DCI.DAG.getNode(ISD::TRUNCATE, DL, DemotedVT, RHS);
  
    unsigned Opc;
    if (Signed) {
@@ -4145,7 +4183,7 @@ static SDValue TryMULWIDECombine(SDNode *N,
      Opc = NVPTXISD::MUL_WIDE_UNSIGNED;
    }
  
-  return DCI.DAG.getNode(Opc, SDLoc(N), MulType, TruncLHS, TruncRHS);
+  return DCI.DAG.getNode(Opc, DL, MulType, TruncLHS, TruncRHS);
  }
  
  /// PerformMULCombine - Runs PTX-specific DAG combine patterns on MUL nodes.
@@ -4178,13 +4216,12 @@ static SDValue PerformSHLCombine(SDNode *N,
  
  SDValue NVPTXTargetLowering::PerformDAGCombine(SDNode *N,
                                                 DAGCombinerInfo &DCI) const {
-  // FIXME: Get this from the DAG somehow
-  CodeGenOpt::Level OptLevel = CodeGenOpt::Aggressive;
+  CodeGenOpt::Level OptLevel = getTargetMachine().getOptLevel();
    switch (N->getOpcode()) {
      default: break;
      case ISD::ADD:
      case ISD::FADD:
-      return PerformADDCombine(N, DCI, nvptxSubtarget, OptLevel);
+      return PerformADDCombine(N, DCI, STI, OptLevel);
      case ISD::MUL:
        return PerformMULCombine(N, DCI, OptLevel);
      case ISD::SHL:
@@ -4269,15 +4306,12 @@ static void ReplaceLoadVector(SDNode *N, SelectionDAG &DAG,
    }
    }
  
-  SmallVector<SDValue, 8> OtherOps;
-
    // Copy regular operands
-  for (unsigned i = 0, e = N->getNumOperands(); i != e; ++i)
-    OtherOps.push_back(N->getOperand(i));
+  SmallVector<SDValue, 8> OtherOps(N->op_begin(), N->op_end());
  
    // The select routine does not have access to the LoadSDNode instance, so
    // pass along the extension information
-  OtherOps.push_back(DAG.getIntPtrConstant(LD->getExtensionType()));
+  OtherOps.push_back(DAG.getIntPtrConstant(LD->getExtensionType(), DL));
  
    SDValue NewLD = DAG.getMemIntrinsicNode(Opcode, DL, LdResVTs, OtherOps,
                                            LD->getMemoryVT(),
@@ -4386,8 +4420,7 @@ static void ReplaceINTRINSIC_W_CHAIN(SDNode *N, SelectionDAG &DAG,
        OtherOps.push_back(Chain); // Chain
                                   // Skip operand 1 (intrinsic ID)
        // Others
-      for (unsigned i = 2, e = N->getNumOperands(); i != e; ++i)
-        OtherOps.push_back(N->getOperand(i));
+      OtherOps.append(N->op_begin() + 2, N->op_end());
  
        MemIntrinsicSDNode *MemSD = cast<MemIntrinsicSDNode>(N);
  
@@ -4418,9 +4451,7 @@ static void ReplaceINTRINSIC_W_CHAIN(SDNode *N, SelectionDAG &DAG,
               "Custom handling of non-i8 ldu/ldg?");
  
        // Just copy all operands as-is
-      SmallVector<SDValue, 4> Ops;
-      for (unsigned i = 0, e = N->getNumOperands(); i != e; ++i)
-        Ops.push_back(N->getOperand(i));
+      SmallVector<SDValue, 4> Ops(N->op_begin(), N->op_end());
  
        // Force output to i16
        SDVTList LdResVTs = DAG.getVTList(MVT::i16, MVT::Other);
@@ -4478,5 +4509,11 @@ NVPTXTargetObjectFile::~NVPTXTargetObjectFile() {
    delete DwarfLocSection;
    delete DwarfARangesSection;
    delete DwarfRangesSection;
-  delete DwarfMacroInfoSection;
+}
+
+const MCSection *
+NVPTXTargetObjectFile::SelectSectionForGlobal(const GlobalValue *GV,
+                                              SectionKind Kind, Mangler &Mang,
+                                              const TargetMachine &TM) const {
+  return getDataSection();
  }