R600/SI: Fix another case of illegal VGPR->SGPR copy
authorTom Stellard <thomas.stellard@amd.com>
Mon, 18 Nov 2013 18:50:15 +0000 (18:50 +0000)
committerTom Stellard <thomas.stellard@amd.com>
Mon, 18 Nov 2013 18:50:15 +0000 (18:50 +0000)
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@195025 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/R600/SIFixSGPRCopies.cpp
test/CodeGen/R600/sgpr-copy.ll

index 6116b4e3c538e6bdb51c79eea9c91a625679a133..b49fda9689c5c7a1db3291f0576e851bde5783db 100644 (file)
@@ -181,14 +181,13 @@ bool SIFixSGPRCopies::isVGPRToSGPRCopy(const MachineInstr &Copy,
   unsigned SrcReg = Copy.getOperand(1).getReg();
   unsigned SrcSubReg = Copy.getOperand(1).getSubReg();
   const TargetRegisterClass *DstRC = MRI.getRegClass(DstReg);
+  const TargetRegisterClass *SrcRC;
 
   if (!TargetRegisterInfo::isVirtualRegister(SrcReg) ||
       DstRC == &AMDGPU::M0RegRegClass)
     return false;
 
-  const TargetRegisterClass *SrcRC = TRI->getSubRegClass(
-      MRI.getRegClass(SrcReg), SrcSubReg);
-
+  SrcRC = inferRegClassFromDef(TRI, MRI, SrcReg, SrcSubReg);
   return TRI->isSGPRClass(DstRC) &&
          !TRI->getCommonSubClass(DstRC, SrcRC);
 }
index 67cedd371dbc3d25d118e2a399bcd12422587b0e..5ec1a08942367f151f87900030d31a7c4604a80c 100644 (file)
@@ -268,3 +268,29 @@ endif:
 }
 
 !2 = metadata !{metadata !"const", null, i32 1}
+
+; CHECK-LABEL: @copy1
+; CHECK: BUFFER_LOAD_DWORD
+; CHECK: V_ADD
+; CHECK: S_ENDPGM
+define void @copy1(float addrspace(1)* %out, float addrspace(1)* %in0) {
+entry:
+  %0 = load float addrspace(1)* %in0
+  %1 = fcmp oeq float %0, 0.0
+  br i1 %1, label %if0, label %endif
+
+if0:
+  %2 = bitcast float %0 to i32
+  %3 = fcmp olt float %0, 0.0
+  br i1 %3, label %if1, label %endif
+
+if1:
+  %4 = add i32 %2, 1
+  br label %endif
+
+endif:
+  %5 = phi i32 [ 0, %entry ], [ %2, %if0 ], [ %4, %if1 ]
+  %6 = bitcast i32 %5 to float
+  store float %6, float addrspace(1)* %out
+  ret void
+}