R600/SI: Fix crash with VSELECT

author Tom Stellard <thomas.stellard@amd.com>

Thu, 18 Jul 2013 21:43:53 +0000 (21:43 +0000)

committer Tom Stellard <thomas.stellard@amd.com>

Thu, 18 Jul 2013 21:43:53 +0000 (21:43 +0000)
author Tom Stellard <thomas.stellard@amd.com>
Thu, 18 Jul 2013 21:43:53 +0000 (21:43 +0000)
committer Tom Stellard <thomas.stellard@amd.com>
Thu, 18 Jul 2013 21:43:53 +0000 (21:43 +0000)
diff --git a/lib/Target/R600/SIISelLowering.cpp b/lib/Target/R600/SIISelLowering.cpp

index 6cae978e99c9cb3d014127296b817be86af5971f..316567cef4656345fd2d04dd67305c9a27144cef 100644 (file)
--- a/lib/Target/R600/SIISelLowering.cpp
+++ b/lib/Target/R600/SIISelLowering.cpp
@@ -34,6 +34,9 @@ SITargetLowering::SITargetLowering(TargetMachine &TM) :
    addRegisterClass(MVT::i1, &AMDGPU::SReg_64RegClass);
    addRegisterClass(MVT::i64, &AMDGPU::SReg_64RegClass);
  
+  addRegisterClass(MVT::v2i1, &AMDGPU::VReg_64RegClass);
+  addRegisterClass(MVT::v4i1, &AMDGPU::VReg_128RegClass);
+
    addRegisterClass(MVT::v16i8, &AMDGPU::SReg_128RegClass);
    addRegisterClass(MVT::v32i8, &AMDGPU::SReg_256RegClass);
    addRegisterClass(MVT::v64i8, &AMDGPU::SReg_512RegClass);
@@ -72,6 +75,9 @@ SITargetLowering::SITargetLowering(TargetMachine &TM) :
  
    setOperationAction(ISD::SELECT_CC, MVT::Other, Expand);
  
+  setOperationAction(ISD::SETCC, MVT::v2i1, Expand);
+  setOperationAction(ISD::SETCC, MVT::v4i1, Expand);
+
    setOperationAction(ISD::SIGN_EXTEND, MVT::i64, Custom);
  
    setOperationAction(ISD::INTRINSIC_WO_CHAIN, MVT::Other, Custom);
@@ -318,7 +324,10 @@ MachineBasicBlock * SITargetLowering::EmitInstrWithCustomInserter(
  }
  
  EVT SITargetLowering::getSetCCResultType(LLVMContext &, EVT VT) const {
-  return MVT::i1;
+  if (!VT.isVector()) {
+    return MVT::i1;
+  }
+  return MVT::getVectorVT(MVT::i1, VT.getVectorNumElements());
  }
  
  MVT SITargetLowering::getScalarShiftAmountTy(EVT VT) const {
diff --git a/lib/Target/R600/SIInstructions.td b/lib/Target/R600/SIInstructions.td

index c7d97c9d32367e98479ec27b4f1349ca57f73247..789a5187e4980c16b5208ec1e242b7b46c37834a 100644 (file)
--- a/lib/Target/R600/SIInstructions.td
+++ b/lib/Target/R600/SIInstructions.td
@@ -1487,6 +1487,9 @@ def : BitConvert <f64, i64, VReg_64>;
  def : BitConvert <v2f32, v2i32, VReg_64>;
  def : BitConvert <v2i32, v2f32, VReg_64>;
  
+def : BitConvert <v4f32, v4i32, VReg_128>;
+def : BitConvert <v4i32, v4f32, VReg_128>;
+
  /********** =================== **********/
  /********** Src & Dst modifiers **********/
  /********** =================== **********/
diff --git a/test/CodeGen/R600/vselect.ll b/test/CodeGen/R600/vselect.ll

index 79d896bbcc7279381e24684508fc39400ae7168f..72a90849a78daafc6e6e1e6668d84bc8bd1ae8ca 100644 (file)
--- a/test/CodeGen/R600/vselect.ll
+++ b/test/CodeGen/R600/vselect.ll
@@ -1,9 +1,14 @@
  ;RUN: llc < %s -march=r600 -mcpu=redwood | FileCheck --check-prefix=EG-CHECK %s
+;RUN: llc < %s -march=r600 -mcpu=SI | FileCheck --check-prefix=SI-CHECK %s
  
  ;EG-CHECK: @test_select_v2i32
  ;EG-CHECK: CNDE_INT {{\*? *}}T{{[0-9]+\.[XYZW], PV\.[XYZW], T[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
  ;EG-CHECK: CNDE_INT {{\*? *}}T{{[0-9]+\.[XYZW], PV\.[XYZW], T[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
  
+;SI-CHECK: @test_select_v2i32
+;SI-CHECK: V_CNDMASK_B32_e64
+;SI-CHECK: V_CNDMASK_B32_e64
+
  define void @test_select_v2i32(<2 x i32> addrspace(1)* %out, <2 x i32> addrspace(1)* %in0, <2 x i32> addrspace(1)* %in1) {
  entry:
    %0 = load <2 x i32> addrspace(1)* %in0
@@ -18,6 +23,10 @@ entry:
  ;EG-CHECK: CNDE_INT {{\*? *}}T{{[0-9]+\.[XYZW], PV\.[XYZW], T[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
  ;EG-CHECK: CNDE_INT {{\*? *}}T{{[0-9]+\.[XYZW], PV\.[XYZW], T[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
  
+;SI-CHECK: @test_select_v2f32
+;SI-CHECK: V_CNDMASK_B32_e64
+;SI-CHECK: V_CNDMASK_B32_e64
+
  define void @test_select_v2f32(<2 x float> addrspace(1)* %out, <2 x float> addrspace(1)* %in0, <2 x float> addrspace(1)* %in1) {
  entry:
    %0 = load <2 x float> addrspace(1)* %in0
@@ -34,6 +43,12 @@ entry:
  ;EG-CHECK: CNDE_INT {{\*? *}}T{{[0-9]+\.[XYZW], PV\.[XYZW], T[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
  ;EG-CHECK: CNDE_INT {{\*? *}}T{{[0-9]+\.[XYZW], PV\.[XYZW], T[0-9]+\.[XYZW], T[0-9]+\.[XYZW]}}
  
+;SI-CHECK: @test_select_v4i32
+;SI-CHECK: V_CNDMASK_B32_e64
+;SI-CHECK: V_CNDMASK_B32_e64
+;SI-CHECK: V_CNDMASK_B32_e64
+;SI-CHECK: V_CNDMASK_B32_e64
+
  define void @test_select_v4i32(<4 x i32> addrspace(1)* %out, <4 x i32> addrspace(1)* %in0, <4 x i32> addrspace(1)* %in1) {
  entry:
    %0 = load <4 x i32> addrspace(1)* %in0
author	Tom Stellard <thomas.stellard@amd.com>
	Thu, 18 Jul 2013 21:43:53 +0000 (21:43 +0000)
committer	Tom Stellard <thomas.stellard@amd.com>
	Thu, 18 Jul 2013 21:43:53 +0000 (21:43 +0000)
lib/Target/R600/SIISelLowering.cpp		patch \| blob \| history
lib/Target/R600/SIInstructions.td		patch \| blob \| history
test/CodeGen/R600/vselect.ll		patch \| blob \| history