Fixed a bug in SelectionDAG.cpp.
authorElena Demikhovsky <elena.demikhovsky@intel.com>
Sun, 1 Jan 2012 16:22:47 +0000 (16:22 +0000)
committerElena Demikhovsky <elena.demikhovsky@intel.com>
Sun, 1 Jan 2012 16:22:47 +0000 (16:22 +0000)
The failure seen on win32, when i64 type is illegal.
It happens on stage of conversion VECTOR_SHUFFLE to BUILD_VECTOR.

The failure message is:
llc: SelectionDAG.cpp:784: void VerifyNodeCommon(llvm::SDNode*): Assertion `(I->getValueType() == EltVT || (EltVT.isInteger() && I->getValueType().isInteger() && EltVT.bitsLE(I->getValueType()))) && "Wrong operand type!"' failed.

I added a special test that checks vector shuffle on win32.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@147399 91177308-0d34-0410-b5e6-96231b3b80d8

lib/CodeGen/SelectionDAG/LegalizeDAG.cpp
test/CodeGen/X86/avx-shuffle-x86_32.ll [new file with mode: 0755]

index 75f576111264ffad0bca50201b240fbaef8f931e..a6851abba7821112a0c1b7ce148be41af4b8a754 100644 (file)
@@ -2795,15 +2795,48 @@ void SelectionDAGLegalize::ExpandNode(SDNode *Node) {
                                               Node->getOperand(2), dl));
     break;
   case ISD::VECTOR_SHUFFLE: {
-    SmallVector<int, 8> Mask;
+    SmallVector<int, 32> Mask(32U, -1);
     cast<ShuffleVectorSDNode>(Node)->getMask(Mask);
 
     EVT VT = Node->getValueType(0);
     EVT EltVT = VT.getVectorElementType();
-    if (!TLI.isTypeLegal(EltVT))
+    SDValue Op0 = Node->getOperand(0);
+    SDValue Op1 = Node->getOperand(1);
+    if (!TLI.isTypeLegal(EltVT)) {
+
       EltVT = TLI.getTypeToTransformTo(*DAG.getContext(), EltVT);
+      
+      // Convert shuffle node
+      // If original node was v4i64 and the new EltVT is i32,
+      // cast operands to v8i32 and re-build the mask
+      unsigned OldNumElems = VT.getVectorNumElements();
+      // Calculate new VT
+      VT = EVT::getVectorVT(*DAG.getContext(), EltVT, VT.getSizeInBits()/EltVT.getSizeInBits());
+      
+      // cast operands to new VT
+      Op0 = DAG.getNode(ISD::BITCAST, dl, VT, Op0);
+      Op1 = DAG.getNode(ISD::BITCAST, dl, VT, Op1);
+           
+      // Convert the shuffle mask
+           unsigned int factor = VT.getVectorNumElements()/OldNumElems;
+      // assume that EltVT gets smaller
+      assert(factor > 0);
+      SmallVector<int, 32> NewMask(32U, -1);
+
+      for (unsigned i = 0; i < OldNumElems; ++i) {
+        if (Mask[i] < 0) {
+          for (unsigned fi = 0; fi < factor; ++fi)
+              NewMask[i*factor+fi] = Mask[i];
+        }
+        else {
+          for (unsigned fi = 0; fi < factor; ++fi)
+              NewMask[i*factor+fi] = Mask[i]*factor+fi;
+        }
+        Mask = NewMask;
+      }
+    }    
     unsigned NumElems = VT.getVectorNumElements();
-    SmallVector<SDValue, 8> Ops;
+    SmallVector<SDValue, 16> Ops;
     for (unsigned i = 0; i != NumElems; ++i) {
       if (Mask[i] < 0) {
         Ops.push_back(DAG.getUNDEF(EltVT));
@@ -2812,13 +2845,14 @@ void SelectionDAGLegalize::ExpandNode(SDNode *Node) {
       unsigned Idx = Mask[i];
       if (Idx < NumElems)
         Ops.push_back(DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, EltVT,
-                                  Node->getOperand(0),
+                                  Op0,
                                   DAG.getIntPtrConstant(Idx)));
       else
         Ops.push_back(DAG.getNode(ISD::EXTRACT_VECTOR_ELT, dl, EltVT,
-                                  Node->getOperand(1),
+                                  Op1,
                                   DAG.getIntPtrConstant(Idx - NumElems)));
     }
+    
     Tmp1 = DAG.getNode(ISD::BUILD_VECTOR, dl, VT, &Ops[0], Ops.size());
     Results.push_back(Tmp1);
     break;
diff --git a/test/CodeGen/X86/avx-shuffle-x86_32.ll b/test/CodeGen/X86/avx-shuffle-x86_32.ll
new file mode 100755 (executable)
index 0000000..210287f
--- /dev/null
@@ -0,0 +1,8 @@
+; RUN: llc < %s -mtriple=i686-pc-win32 -mcpu=corei7-avx -mattr=+avx | FileCheck %s\r
+\r
+define <4 x i64> @test1(<4 x i64> %a) nounwind {\r
+ %b = shufflevector <4 x i64> %a, <4 x i64> undef, <4 x i32> <i32 1, i32 3, i32 5, i32 7>\r
+ ret <4 x i64>%b\r
+ ; CHECK test1:\r
+ ; CHECK: vinsertf128\r
+ }\r