[X86] Fixes bug in build_vector v4x32 lowering

author Michael Kuperstein <michael.m.kuperstein@intel.com>

Sun, 23 Nov 2014 13:09:06 +0000 (13:09 +0000)

committer Michael Kuperstein <michael.m.kuperstein@intel.com>

Sun, 23 Nov 2014 13:09:06 +0000 (13:09 +0000)
author Michael Kuperstein <michael.m.kuperstein@intel.com>
Sun, 23 Nov 2014 13:09:06 +0000 (13:09 +0000)
committer Michael Kuperstein <michael.m.kuperstein@intel.com>
Sun, 23 Nov 2014 13:09:06 +0000 (13:09 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index 90e88171dccbaff8c445af96c0fecd6471f7988a..0347a5174449cc61271d03bb8cd17f1243b4a045 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -5771,7 +5771,8 @@ static SDValue LowerBuildVectorv4x32(SDValue Op, SelectionDAG &DAG,
    // We only know how to deal with build_vector nodes where elements are either
    // zeroable or extract_vector_elt with constant index.
    SDValue FirstNonZero;
    // We only know how to deal with build_vector nodes where elements are either
    // zeroable or extract_vector_elt with constant index.
    SDValue FirstNonZero;
-  for (int i=0; i < 4; ++i) {
+  unsigned FirstNonZeroIdx;
+  for (unsigned i=0; i < 4; ++i) {
      if (Zeroable[i])
        continue;
      SDValue Elt = Op->getOperand(i);
      if (Zeroable[i])
        continue;
      SDValue Elt = Op->getOperand(i);
@@ -5782,8 +5783,10 @@ static SDValue LowerBuildVectorv4x32(SDValue Op, SelectionDAG &DAG,
      MVT VT = Elt.getOperand(0).getSimpleValueType();
      if (!VT.is128BitVector())
        return SDValue();
      MVT VT = Elt.getOperand(0).getSimpleValueType();
      if (!VT.is128BitVector())
        return SDValue();
-    if (!FirstNonZero.getNode())
+    if (!FirstNonZero.getNode()) {
        FirstNonZero = Elt;
        FirstNonZero = Elt;
+      FirstNonZeroIdx = i;
+    }
    }
  
    assert(FirstNonZero.getNode() && "Unexpected build vector of all zeros!");
    }
  
    assert(FirstNonZero.getNode() && "Unexpected build vector of all zeros!");
@@ -5822,7 +5825,7 @@ static SDValue LowerBuildVectorv4x32(SDValue Op, SelectionDAG &DAG,
      return SDValue();
  
    SDValue V2 = Elt.getOperand(0);
      return SDValue();
  
    SDValue V2 = Elt.getOperand(0);
-  if (Elt == FirstNonZero)
+  if (Elt == FirstNonZero && EltIdx == FirstNonZeroIdx)
      V1 = SDValue();
  
    bool CanFold = true;
      V1 = SDValue();
  
    bool CanFold = true;
diff --git a/test/CodeGen/X86/sse41.ll b/test/CodeGen/X86/sse41.ll

index 2bdfafe8374745ed069d612db164eb9cceebef6b..71c1c9ed33c2371189990ec242bae260faec5a7c 100644 (file)
--- a/test/CodeGen/X86/sse41.ll
+++ b/test/CodeGen/X86/sse41.ll
@@ -1145,6 +1145,23 @@ entry:
    ret <4 x float> %vecinit3
  }
  
    ret <4 x float> %vecinit3
  }
  
+define <4 x float> @insertps_10(<4 x float> %A)
+{
+; X32-LABEL: insertps_10:
+; X32:       ## BB#0:
+; X32-NEXT:    insertps {{.*#+}} xmm0 = xmm0[0],zero,xmm0[0],zero
+; X32-NEXT:    retl
+;
+; X64-LABEL: insertps_10:
+; X64:       ## BB#0:
+; X64-NEXT:    insertps {{.*#+}} xmm0 = xmm0[0],zero,xmm0[0],zero
+; X64-NEXT:    retq
+  %vecext = extractelement <4 x float> %A, i32 0
+  %vecbuild1 = insertelement <4 x float> <float 0.000000e+00, float 0.000000e+00, float 0.000000e+00, float 0.000000e+00>, float %vecext, i32 0
+  %vecbuild2 = insertelement <4 x float> %vecbuild1, float %vecext, i32 2
+  ret <4 x float> %vecbuild2
+}
+
  define <4 x float> @build_vector_to_shuffle_1(<4 x float> %A) {
  ; X32-LABEL: build_vector_to_shuffle_1:
  ; X32:       ## BB#0:
  define <4 x float> @build_vector_to_shuffle_1(<4 x float> %A) {
  ; X32-LABEL: build_vector_to_shuffle_1:
  ; X32:       ## BB#0:
author	Michael Kuperstein <michael.m.kuperstein@intel.com>
	Sun, 23 Nov 2014 13:09:06 +0000 (13:09 +0000)
committer	Michael Kuperstein <michael.m.kuperstein@intel.com>
	Sun, 23 Nov 2014 13:09:06 +0000 (13:09 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
test/CodeGen/X86/sse41.ll		patch \| blob \| history