X86: Custom lower zext v16i8 to v16i16.

author Benjamin Kramer <benny.kra@googlemail.com>

Wed, 23 Oct 2013 19:19:04 +0000 (19:19 +0000)

committer Benjamin Kramer <benny.kra@googlemail.com>

Wed, 23 Oct 2013 19:19:04 +0000 (19:19 +0000)
author Benjamin Kramer <benny.kra@googlemail.com>
Wed, 23 Oct 2013 19:19:04 +0000 (19:19 +0000)
committer Benjamin Kramer <benny.kra@googlemail.com>
Wed, 23 Oct 2013 19:19:04 +0000 (19:19 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index 7dddb49beeef3d7dde785f0f19a7250725f55ae6..5f29f4f8ce3cc15bf4726592fb2e36cf4303adda 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -1160,6 +1160,7 @@ void X86TargetLowering::resetOperationActions() {
      setOperationAction(ISD::SINT_TO_FP,         MVT::v8i32, Legal);
      setOperationAction(ISD::FP_ROUND,           MVT::v4f32, Legal);
  
+    setOperationAction(ISD::ZERO_EXTEND,        MVT::v16i16, Custom);
      setOperationAction(ISD::ZERO_EXTEND,        MVT::v8i32, Custom);
      setOperationAction(ISD::UINT_TO_FP,         MVT::v8i8,  Custom);
      setOperationAction(ISD::UINT_TO_FP,         MVT::v8i16, Custom);
@@ -8864,7 +8865,8 @@ static SDValue LowerAVXExtend(SDValue Op, SelectionDAG &DAG,
    //   Concat upper and lower parts.
    //
  
-  if (((VT != MVT::v8i32) || (InVT != MVT::v8i16)) &&
+  if (((VT != MVT::v16i16) || (InVT != MVT::v16i8)) &&
+      ((VT != MVT::v8i32) || (InVT != MVT::v8i16)) &&
        ((VT != MVT::v4i64) || (InVT != MVT::v4i32)))
      return SDValue();
  
@@ -8944,24 +8946,9 @@ static SDValue LowerZERO_EXTEND(SDValue Op, const X86Subtarget *Subtarget,
        return Res;
    }
  
-  if (!VT.is256BitVector() || !SVT.is128BitVector() ||
-      VT.getVectorNumElements() != SVT.getVectorNumElements())
-    return SDValue();
-
-  assert(Subtarget->hasFp256() && "256-bit vector is observed without AVX!");
-
-  // AVX2 has better support of integer extending.
-  if (Subtarget->hasInt256())
-    return DAG.getNode(X86ISD::VZEXT, DL, VT, In);
-
-  SDValue Lo = DAG.getNode(X86ISD::VZEXT, DL, MVT::v4i32, In);
-  static const int Mask[] = {4, 5, 6, 7, -1, -1, -1, -1};
-  SDValue Hi = DAG.getNode(X86ISD::VZEXT, DL, MVT::v4i32,
-                           DAG.getVectorShuffle(MVT::v8i16, DL, In,
-                                                DAG.getUNDEF(MVT::v8i16),
-                                                &Mask[0]));
-
-  return DAG.getNode(ISD::CONCAT_VECTORS, DL, MVT::v8i32, Lo, Hi);
+  assert(!VT.is256BitVector() || !SVT.is128BitVector() ||
+         VT.getVectorNumElements() != SVT.getVectorNumElements());
+  return SDValue();
  }
  
  SDValue X86TargetLowering::LowerTRUNCATE(SDValue Op, SelectionDAG &DAG) const {
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index bf091919549099d8b97bc65e365f39f59d4f3ae4..004710b67ccb41ba3722ff9f50517ea30409d738 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -5596,6 +5596,8 @@ let Predicates = [HasAVX2] in {
                (VPMOVZXDQYrr VR128:$src)>;
      def : Pat<(v8i32 (X86vzmovly (v8i16 VR128:$src))),
                (VPMOVZXWDYrr VR128:$src)>;
+    def : Pat<(v16i16 (X86vzmovly (v16i8 VR128:$src))),
+              (VPMOVZXBWYrr VR128:$src)>;
    }
  
    def : Pat<(v4i64 (X86vsmovl (v4i32 VR128:$src))), (VPMOVSXDQYrr VR128:$src)>;
diff --git a/test/CodeGen/X86/avx-zext.ll b/test/CodeGen/X86/avx-zext.ll

index e2b6c552da9f7187ca6c2abca6173e285364c8a6..75117463bc39f2260ddb20449bfb941578e487f6 100644 (file)
--- a/test/CodeGen/X86/avx-zext.ll
+++ b/test/CodeGen/X86/avx-zext.ll
@@ -27,3 +27,15 @@ define <8 x i32> @zext_8i8_to_8i32(<8 x i8> %z) {
    %t = zext <8 x i8> %z to <8 x i32>
    ret <8 x i32> %t
  }
+
+; PR17654
+define <16 x i16> @zext_16i8_to_16i16(<16 x i8> %z) {
+; CHECK-LABEL: zext_16i8_to_16i16:
+; CHECK: vpxor
+; CHECK: vpunpckhbw
+; CHECK: vpunpcklbw
+; CHECK: vinsertf128
+; CHECK: ret
+  %t = zext <16 x i8> %z to <16 x i16>
+  ret <16 x i16> %t
+}
diff --git a/test/CodeGen/X86/avx2-conversions.ll b/test/CodeGen/X86/avx2-conversions.ll

index 3ce08dcc737043bf40b811ab6dc05d8d5060c164..0143f18fe24dc84aa69a0e100626146228936c70 100644 (file)
--- a/test/CodeGen/X86/avx2-conversions.ll
+++ b/test/CodeGen/X86/avx2-conversions.ll
@@ -63,6 +63,15 @@ define <8 x i32> @zext_8i8_8i32(<8 x i8> %A) nounwind {
    ret <8 x i32>%B
  }
  
+; CHECK-LABEL: zext_16i8_16i16:
+; CHECK: vpmovzxbw
+; CHECK-NOT: vinsert
+; CHECK: ret
+define <16 x i16> @zext_16i8_16i16(<16 x i8> %z) {
+  %t = zext <16 x i8> %z to <16 x i16>
+  ret <16 x i16> %t
+}
+
  ; CHECK: load_sext_test1
  ; CHECK: vpmovsxdq (%r{{[^,]*}}), %ymm{{.*}}
  ; CHECK: ret
author	Benjamin Kramer <benny.kra@googlemail.com>
	Wed, 23 Oct 2013 19:19:04 +0000 (19:19 +0000)
committer	Benjamin Kramer <benny.kra@googlemail.com>
	Wed, 23 Oct 2013 19:19:04 +0000 (19:19 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
lib/Target/X86/X86InstrSSE.td		patch \| blob \| history
test/CodeGen/X86/avx-zext.ll		patch \| blob \| history
test/CodeGen/X86/avx2-conversions.ll		patch \| blob \| history