[NVPTX] aligned byte-buffers for vector return types

[oota-llvm.git] / lib / Target / NVPTX / NVPTXISelLowering.cpp
diff --git a/lib/Target/NVPTX/NVPTXISelLowering.cpp b/lib/Target/NVPTX/NVPTXISelLowering.cpp

index 55951e64a3894e063a432f00b19e3f1fa736b976..866017e49db5c6cebdf48c96d4f26f68cfd0b897 100644 (file)
--- a/lib/Target/NVPTX/NVPTXISelLowering.cpp
+++ b/lib/Target/NVPTX/NVPTXISelLowering.cpp
@@ -1355,7 +1355,12 @@ SDValue NVPTXTargetLowering::LowerCall(TargetLowering::CallLoweringInfo &CLI,
      //  .param .align 16 .b8 retval0[<size-in-bytes>], or
      //  .param .b<size-in-bits> retval0
      unsigned resultsz = TD->getTypeAllocSizeInBits(retTy);
-    if (retTy->isSingleValueType()) {
+    // Emit ".param .b<size-in-bits> retval0" instead of byte arrays only for
+    // these three types to match the logic in
+    // NVPTXAsmPrinter::printReturnValStr and NVPTXTargetLowering::getPrototype.
+    // Plus, this behavior is consistent with nvcc's.
+    if (retTy->isFloatingPointTy() || retTy->isIntegerTy() ||
+        retTy->isPointerTy()) {
        // Scalar needs to be at least 32bit wide
        if (resultsz < 32)
          resultsz = 32;
@@ -2163,7 +2168,6 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
          unsigned NumElts = ObjectVT.getVectorNumElements();
          assert(TLI->getNumRegisters(F->getContext(), ObjectVT) == NumElts &&
                 "Vector was not scalarized");
-        unsigned Ofst = 0;
          EVT EltVT = ObjectVT.getVectorElementType();
  
          // V1 load
@@ -2172,10 +2176,8 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
            // We only have one element, so just directly load it
            Value *SrcValue = Constant::getNullValue(PointerType::get(
                EltVT.getTypeForEVT(F->getContext()), llvm::ADDRESS_SPACE_PARAM));
-          SDValue SrcAddr = DAG.getNode(ISD::ADD, dl, getPointerTy(), Arg,
-                                        DAG.getConstant(Ofst, getPointerTy()));
            SDValue P = DAG.getLoad(
-              EltVT, dl, Root, SrcAddr, MachinePointerInfo(SrcValue), false,
+              EltVT, dl, Root, Arg, MachinePointerInfo(SrcValue), false,
                false, true,
                TD->getABITypeAlignment(EltVT.getTypeForEVT(F->getContext())));
            if (P.getNode())
@@ -2184,7 +2186,6 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
            if (Ins[InsIdx].VT.getSizeInBits() > EltVT.getSizeInBits())
              P = DAG.getNode(ISD::ANY_EXTEND, dl, Ins[InsIdx].VT, P);
            InVals.push_back(P);
-          Ofst += TD->getTypeAllocSize(EltVT.getTypeForEVT(F->getContext()));
            ++InsIdx;
          } else if (NumElts == 2) {
            // V2 load
@@ -2192,10 +2193,8 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
            EVT VecVT = EVT::getVectorVT(F->getContext(), EltVT, 2);
            Value *SrcValue = Constant::getNullValue(PointerType::get(
                VecVT.getTypeForEVT(F->getContext()), llvm::ADDRESS_SPACE_PARAM));
-          SDValue SrcAddr = DAG.getNode(ISD::ADD, dl, getPointerTy(), Arg,
-                                        DAG.getConstant(Ofst, getPointerTy()));
            SDValue P = DAG.getLoad(
-              VecVT, dl, Root, SrcAddr, MachinePointerInfo(SrcValue), false,
+              VecVT, dl, Root, Arg, MachinePointerInfo(SrcValue), false,
                false, true,
                TD->getABITypeAlignment(VecVT.getTypeForEVT(F->getContext())));
            if (P.getNode())
@@ -2213,7 +2212,6 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
  
            InVals.push_back(Elt0);
            InVals.push_back(Elt1);
-          Ofst += TD->getTypeAllocSize(VecVT.getTypeForEVT(F->getContext()));
            InsIdx += 2;
          } else {
            // V4 loads
@@ -2231,6 +2229,7 @@ SDValue NVPTXTargetLowering::LowerFormalArguments(
              VecSize = 2;
            }
            EVT VecVT = EVT::getVectorVT(F->getContext(), EltVT, VecSize);
+          unsigned Ofst = 0;
            for (unsigned i = 0; i < NumElts; i += VecSize) {
              Value *SrcValue = Constant::getNullValue(
                  PointerType::get(VecVT.getTypeForEVT(F->getContext()),
@@ -3270,16 +3269,7 @@ bool NVPTXTargetLowering::getTgtMemIntrinsic(
      Info.vol = 0;
      Info.readMem = true;
      Info.writeMem = false;
-
-    // alignment is available as metadata.
-    // Grab it and set the alignment.
-    assert(I.hasMetadataOtherThanDebugLoc() && "Must have alignment metadata");
-    MDNode *AlignMD = I.getMetadata("align");
-    assert(AlignMD && "Must have a non-null MDNode");
-    assert(AlignMD->getNumOperands() == 1 && "Must have a single operand");
-    Value *Align = AlignMD->getOperand(0);
-    int64_t Alignment = cast<ConstantInt>(Align)->getZExtValue();
-    Info.align = Alignment;
+    Info.align = cast<ConstantInt>(I.getArgOperand(1))->getZExtValue();
  
      return true;
    }
@@ -3299,16 +3289,7 @@ bool NVPTXTargetLowering::getTgtMemIntrinsic(
      Info.vol = 0;
      Info.readMem = true;
      Info.writeMem = false;
-
-    // alignment is available as metadata.
-    // Grab it and set the alignment.
-    assert(I.hasMetadataOtherThanDebugLoc() && "Must have alignment metadata");
-    MDNode *AlignMD = I.getMetadata("align");
-    assert(AlignMD && "Must have a non-null MDNode");
-    assert(AlignMD->getNumOperands() == 1 && "Must have a single operand");
-    Value *Align = AlignMD->getOperand(0);
-    int64_t Alignment = cast<ConstantInt>(Align)->getZExtValue();
-    Info.align = Alignment;
+    Info.align = cast<ConstantInt>(I.getArgOperand(1))->getZExtValue();
  
      return true;
    }