R600/SI: Add subtarget feature to enable VGPR spilling for all shader types

author Tom Stellard <thomas.stellard@amd.com>

Tue, 20 Jan 2015 19:33:04 +0000 (19:33 +0000)

committer Tom Stellard <thomas.stellard@amd.com>

Tue, 20 Jan 2015 19:33:04 +0000 (19:33 +0000)
author Tom Stellard <thomas.stellard@amd.com>
Tue, 20 Jan 2015 19:33:04 +0000 (19:33 +0000)
committer Tom Stellard <thomas.stellard@amd.com>
Tue, 20 Jan 2015 19:33:04 +0000 (19:33 +0000)
diff --git a/lib/Target/R600/AMDGPU.td b/lib/Target/R600/AMDGPU.td

index 8a5ca613dc8006f75745262b489680a9dd178eec..1df4448abf05e6d023a06bbbb62f9edaa2f855c9 100644 (file)
--- a/lib/Target/R600/AMDGPU.td
+++ b/lib/Target/R600/AMDGPU.td
@@ -92,6 +92,11 @@ def FeatureFlatAddressSpace : SubtargetFeature<"flat-address-space",
          "true",
          "Support flat address space">;
  
+def FeatureVGPRSpilling : SubtargetFeature<"vgpr-spilling",
+        "EnableVGPRSpilling",
+        "true",
+        "Enable spilling of VGPRs to scratch memory">;
+
  class SubtargetFeatureFetchLimit <string Value> :
                            SubtargetFeature <"fetch"#Value,
          "TexVTXClauseSize",
diff --git a/lib/Target/R600/AMDGPUAsmPrinter.cpp b/lib/Target/R600/AMDGPUAsmPrinter.cpp

index 8e25f8c214087661a1db3cbcee4efbb70f76bbb8..cae116f4168e4d29bfb86f591e7d6af35b2967e5 100644 (file)
--- a/lib/Target/R600/AMDGPUAsmPrinter.cpp
+++ b/lib/Target/R600/AMDGPUAsmPrinter.cpp
@@ -423,6 +423,7 @@ static unsigned getRsrcReg(unsigned ShaderType) {
  
  void AMDGPUAsmPrinter::EmitProgramInfoSI(const MachineFunction &MF,
                                           const SIProgramInfo &KernelInfo) {
+  const AMDGPUSubtarget &STM = TM.getSubtarget<AMDGPUSubtarget>();
    const SIMachineFunctionInfo *MFI = MF.getInfo<SIMachineFunctionInfo>();
    unsigned RsrcReg = getRsrcReg(MFI->getShaderType());
  
@@ -443,6 +444,10 @@ void AMDGPUAsmPrinter::EmitProgramInfoSI(const MachineFunction &MF,
      OutStreamer.EmitIntValue(RsrcReg, 4);
      OutStreamer.EmitIntValue(S_00B028_VGPRS(KernelInfo.VGPRBlocks) |
                               S_00B028_SGPRS(KernelInfo.SGPRBlocks), 4);
+    if (STM.isVGPRSpillingEnabled(MFI)) {
+      OutStreamer.EmitIntValue(R_0286E8_SPI_TMPRING_SIZE, 4);
+      OutStreamer.EmitIntValue(S_0286E8_WAVESIZE(KernelInfo.ScratchBlocks), 4);
+    }
    }
  
    if (MFI->getShaderType() == ShaderType::PIXEL) {
diff --git a/lib/Target/R600/AMDGPUSubtarget.cpp b/lib/Target/R600/AMDGPUSubtarget.cpp

index 597e558e663475d5052dd5ad0c9aa61d1fdce114..9f22adcc7f6a375bc3b4f1bab11cc70cd1280dfe 100644 (file)
--- a/lib/Target/R600/AMDGPUSubtarget.cpp
+++ b/lib/Target/R600/AMDGPUSubtarget.cpp
@@ -18,6 +18,7 @@
  #include "R600MachineScheduler.h"
  #include "SIISelLowering.h"
  #include "SIInstrInfo.h"
+#include "SIMachineFunctionInfo.h"
  #include "llvm/ADT/SmallString.h"
  
  using namespace llvm;
@@ -78,6 +79,7 @@ AMDGPUSubtarget::AMDGPUSubtarget(StringRef TT, StringRef GPU, StringRef FS,
        FlatAddressSpace(false), EnableIRStructurizer(true),
        EnablePromoteAlloca(false), EnableIfCvt(true),
        EnableLoadStoreOpt(false), WavefrontSize(0), CFALUBug(false), LocalMemorySize(0),
+      EnableVGPRSpilling(false),
        DL(computeDataLayout(initializeSubtargetDependencies(GPU, FS))),
        FrameLowering(TargetFrameLowering::StackGrowsUp,
                      64 * 16, // Maximum stack alignment (long16)
@@ -113,3 +115,8 @@ unsigned AMDGPUSubtarget::getAmdKernelCodeChipID() const {
    case SEA_ISLANDS: return 12;
    }
  }
+
+bool AMDGPUSubtarget::isVGPRSpillingEnabled(
+                                       const SIMachineFunctionInfo *MFI) const {
+  return MFI->getShaderType() == ShaderType::COMPUTE || EnableVGPRSpilling;
+}
diff --git a/lib/Target/R600/AMDGPUSubtarget.h b/lib/Target/R600/AMDGPUSubtarget.h

index 90179d79d25d051420c47b6e5d76a9d4dd41c0a8..cc048a4db878d2de870a9f441ccd4eecc7c1a442 100644 (file)
--- a/lib/Target/R600/AMDGPUSubtarget.h
+++ b/lib/Target/R600/AMDGPUSubtarget.h
@@ -30,6 +30,8 @@
  
  namespace llvm {
  
+class SIMachineFunctionInfo;
+
  class AMDGPUSubtarget : public AMDGPUGenSubtargetInfo {
  
  public:
@@ -63,6 +65,7 @@ private:
    unsigned WavefrontSize;
    bool CFALUBug;
    int LocalMemorySize;
+  bool EnableVGPRSpilling;
  
    const DataLayout DL;
    AMDGPUFrameLowering FrameLowering;
@@ -224,6 +227,7 @@ public:
    bool isAmdHsaOS() const {
      return TargetTriple.getOS() == Triple::AMDHSA;
    }
+  bool isVGPRSpillingEnabled(const SIMachineFunctionInfo *MFI) const;
  };
  
  } // End namespace llvm
diff --git a/lib/Target/R600/SIDefines.h b/lib/Target/R600/SIDefines.h

index 1c74dda5362c7b08d44871e890fea20cb0779e8f..7601794beab8a42eca1b87b9973ed069465bc47d 100644 (file)
--- a/lib/Target/R600/SIDefines.h
+++ b/lib/Target/R600/SIDefines.h
@@ -163,5 +163,8 @@ namespace SIOutMods {
  #define R_00B860_COMPUTE_TMPRING_SIZE                                   0x00B860
  #define   S_00B860_WAVESIZE(x)                                        (((x) & 0x1FFF) << 12)
  
+#define R_0286E8_SPI_TMPRING_SIZE                                       0x0286E8
+#define   S_0286E8_WAVESIZE(x)                                        (((x) & 0x1FFF) << 12)
+
  
  #endif
diff --git a/lib/Target/R600/SIISelLowering.cpp b/lib/Target/R600/SIISelLowering.cpp

index 0a3fa2f930d7e725ea8f5862d6d1cb3e415f9dbd..6b2ea0682a43efe5d70e4e0a7959711fa906a3be 100644 (file)
--- a/lib/Target/R600/SIISelLowering.cpp
+++ b/lib/Target/R600/SIISelLowering.cpp
@@ -588,6 +588,12 @@ SDValue SITargetLowering::LowerFormalArguments(
  
      InVals.push_back(Val);
    }
+
+  if (Info->getShaderType() != ShaderType::COMPUTE) {
+    unsigned ScratchIdx = CCInfo.getFirstUnallocated(
+        AMDGPU::SGPR_32RegClass.begin(), AMDGPU::SGPR_32RegClass.getNumRegs());
+    Info->ScratchOffsetReg = AMDGPU::SGPR_32RegClass.getRegister(ScratchIdx);
+  }
    return Chain;
  }
  
diff --git a/lib/Target/R600/SIInstrInfo.cpp b/lib/Target/R600/SIInstrInfo.cpp

index ccf90ddfae040620c6249b38d1609a2505b9d3a5..80b560eb65ae902abced263729b53ff7cfdc0bc6 100644 (file)
--- a/lib/Target/R600/SIInstrInfo.cpp
+++ b/lib/Target/R600/SIInstrInfo.cpp
@@ -430,15 +430,6 @@ unsigned SIInstrInfo::getMovOpcode(const TargetRegisterClass *DstRC) const {
    return AMDGPU::COPY;
  }
  
-static bool shouldTryToSpillVGPRs(MachineFunction *MF) {
-
-  SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();
-
-  // FIXME: Implement spilling for other shader types.
-  return MFI->getShaderType() == ShaderType::COMPUTE;
-
-}
-
  void SIInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
                                        MachineBasicBlock::iterator MI,
                                        unsigned SrcReg, bool isKill,
@@ -462,7 +453,7 @@ void SIInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
        case 256: Opcode = AMDGPU::SI_SPILL_S256_SAVE; break;
        case 512: Opcode = AMDGPU::SI_SPILL_S512_SAVE; break;
      }
-  } else if(shouldTryToSpillVGPRs(MF) && RI.hasVGPRs(RC)) {
+  } else if(RI.hasVGPRs(RC) && ST.isVGPRSpillingEnabled(MFI)) {
      MFI->setHasSpilledVGPRs();
  
      switch(RC->getSize() * 8) {
@@ -499,6 +490,7 @@ void SIInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
                                         const TargetRegisterClass *RC,
                                         const TargetRegisterInfo *TRI) const {
    MachineFunction *MF = MBB.getParent();
+  const SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();
    MachineFrameInfo *FrameInfo = MF->getFrameInfo();
    DebugLoc DL = MBB.findDebugLoc(MI);
    int Opcode = -1;
@@ -511,7 +503,7 @@ void SIInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
        case 256: Opcode = AMDGPU::SI_SPILL_S256_RESTORE; break;
        case 512: Opcode = AMDGPU::SI_SPILL_S512_RESTORE; break;
      }
-  } else if(shouldTryToSpillVGPRs(MF) && RI.hasVGPRs(RC)) {
+  } else if(RI.hasVGPRs(RC) && ST.isVGPRSpillingEnabled(MFI)) {
      switch(RC->getSize() * 8) {
        case 32: Opcode = AMDGPU::SI_SPILL_V32_RESTORE; break;
        case 64: Opcode = AMDGPU::SI_SPILL_V64_RESTORE; break;
diff --git a/lib/Target/R600/SIMachineFunctionInfo.h b/lib/Target/R600/SIMachineFunctionInfo.h

index 71852717d7e68e2f0cebb9e9314508cd0ddfffd5..667da4c8af615292558fe4547cf62874c0a184c1 100644 (file)
--- a/lib/Target/R600/SIMachineFunctionInfo.h
+++ b/lib/Target/R600/SIMachineFunctionInfo.h
@@ -50,6 +50,7 @@ public:
    unsigned NumUserSGPRs;
    std::map<unsigned, unsigned> LaneVGPRs;
    unsigned LDSWaveSpillSize;
+  unsigned ScratchOffsetReg;
    bool hasCalculatedTID() const { return TIDReg != AMDGPU::NoRegister; };
    unsigned getTIDReg() const { return TIDReg; };
    void setTIDReg(unsigned Reg) { TIDReg = Reg; }
diff --git a/lib/Target/R600/SIRegisterInfo.cpp b/lib/Target/R600/SIRegisterInfo.cpp

index 166df66a27a14d6c1d19c1f3dab53fed762fa829..380c98b48d78ec23ca2c2d3d13903dde854079dd 100644 (file)
--- a/lib/Target/R600/SIRegisterInfo.cpp
+++ b/lib/Target/R600/SIRegisterInfo.cpp
@@ -424,6 +424,8 @@ unsigned SIRegisterInfo::getPreloadedValue(const MachineFunction &MF,
    case SIRegisterInfo::TGID_Z:
      return AMDGPU::SReg_32RegClass.getRegister(MFI->NumUserSGPRs + 2);
    case SIRegisterInfo::SCRATCH_WAVE_OFFSET:
+    if (MFI->getShaderType() != ShaderType::COMPUTE)
+      return MFI->ScratchOffsetReg;
      return AMDGPU::SReg_32RegClass.getRegister(MFI->NumUserSGPRs + 4);
    case SIRegisterInfo::SCRATCH_PTR:
      return AMDGPU::SGPR2_SGPR3;
author	Tom Stellard <thomas.stellard@amd.com>
	Tue, 20 Jan 2015 19:33:04 +0000 (19:33 +0000)
committer	Tom Stellard <thomas.stellard@amd.com>
	Tue, 20 Jan 2015 19:33:04 +0000 (19:33 +0000)
lib/Target/R600/AMDGPU.td		patch \| blob \| history
lib/Target/R600/AMDGPUAsmPrinter.cpp		patch \| blob \| history
lib/Target/R600/AMDGPUSubtarget.cpp		patch \| blob \| history
lib/Target/R600/AMDGPUSubtarget.h		patch \| blob \| history
lib/Target/R600/SIDefines.h		patch \| blob \| history
lib/Target/R600/SIISelLowering.cpp		patch \| blob \| history
lib/Target/R600/SIInstrInfo.cpp		patch \| blob \| history
lib/Target/R600/SIMachineFunctionInfo.h		patch \| blob \| history
lib/Target/R600/SIRegisterInfo.cpp		patch \| blob \| history