[x86] Fix a regression introduced with r213897 for 32-bit targets where
authorChandler Carruth <chandlerc@gmail.com>
Wed, 27 Aug 2014 11:39:47 +0000 (11:39 +0000)
committerChandler Carruth <chandlerc@gmail.com>
Wed, 27 Aug 2014 11:39:47 +0000 (11:39 +0000)
we stopped efficiently lowering sextload using the SSE41 instructions
for that operation.

This is a consequence of a bad predicate I used thinking of the memory
access needs. The code actually handles the cases where the predicate
doesn't apply, and handles them much better. =] Simple fix and a test
case added. Fixes PR20767.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@216538 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/X86/X86ISelLowering.cpp
test/CodeGen/X86/vec_sext.ll

index f63beab44fddb62b77ebc574518213bf9e5d093a..8abbc1d4e1c0813b1c8fbe3767f4bdbc792300c9 100644 (file)
@@ -1016,10 +1016,8 @@ void X86TargetLowering::resetOperationActions() {
     // scalars) and extend in-register to a legal 128-bit vector type. For sext
     // loads these must work with a single scalar load.
     setLoadExtAction(ISD::SEXTLOAD, MVT::v4i8, Custom);
-    if (Subtarget->is64Bit()) {
-      setLoadExtAction(ISD::SEXTLOAD, MVT::v4i16, Custom);
-      setLoadExtAction(ISD::SEXTLOAD, MVT::v8i8, Custom);
-    }
+    setLoadExtAction(ISD::SEXTLOAD, MVT::v4i16, Custom);
+    setLoadExtAction(ISD::SEXTLOAD, MVT::v8i8, Custom);
     setLoadExtAction(ISD::EXTLOAD, MVT::v2i8, Custom);
     setLoadExtAction(ISD::EXTLOAD, MVT::v2i16, Custom);
     setLoadExtAction(ISD::EXTLOAD, MVT::v2i32, Custom);
index 776ddec2e63bdcd33bca8e76cb56c5b9e29f8a6a..0fd66a309390ce23ef1d82df07c026d13a8b6841 100644 (file)
@@ -1,5 +1,5 @@
-; RUN: llc < %s -march=x86-64
-; PR 9267
+; RUN: llc < %s -march=x86-64 -mattr=+avx | FileCheck %s
+; RUN: llc < %s -march=x86 -mattr=+avx | FileCheck %s
 
 define<4 x i32> @func_16_32() {
   %F = load <4 x i16>* undef
@@ -67,3 +67,14 @@ define<4 x i64> @const_16_64() {
   ret <4 x i64> %G
 }
 
+define <4 x i32> @sextload(<4 x i16>* %ptr) {
+; From PR20767 - make sure that we correctly use SSE4.1 to do sign extension
+; loads for both 32-bit and 64-bit x86 targets.
+; CHECK-LABEL: sextload:
+; CHECK:         vpmovsxwd {{.*}}, %xmm0
+; CHECK-NEXT:    ret
+entry:
+  %l = load<4 x i16>* %ptr
+  %m = sext<4 x i16> %l to <4 x i32>
+  ret <4 x i32> %m
+}