[x86] Teach the new vector shuffle lowering to be even more aggressive

author Chandler Carruth <chandlerc@gmail.com>

Wed, 1 Oct 2014 03:19:43 +0000 (03:19 +0000)

committer Chandler Carruth <chandlerc@gmail.com>

Wed, 1 Oct 2014 03:19:43 +0000 (03:19 +0000)
author Chandler Carruth <chandlerc@gmail.com>
Wed, 1 Oct 2014 03:19:43 +0000 (03:19 +0000)
committer Chandler Carruth <chandlerc@gmail.com>
Wed, 1 Oct 2014 03:19:43 +0000 (03:19 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index 947cd01308bf199ec908924d051afc0f46b7d73d..a87cc804a445a05e36332accdf5e457901da1f5e 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -7850,27 +7850,21 @@ static SDValue lowerVectorShuffleAsBroadcast(MVT VT, SDLoc DL, SDValue V,
                                              "a sorted mask where the broadcast "
                                              "comes from V1.");
  
-  // Check if this is a broadcast of a scalar load -- those are more widely
-  // supported than broadcasting in-register values.
+  // Check if this is a broadcast of a scalar. We special case lowering for
+  // scalars so that we can more effectively fold with loads.
    if (V.getOpcode() == ISD::BUILD_VECTOR ||
          (V.getOpcode() == ISD::SCALAR_TO_VECTOR && BroadcastIdx == 0)) {
-    SDValue BroadcastV = V.getOperand(BroadcastIdx);
-    if (ISD::isNON_EXTLoad(BroadcastV.getNode())) {
-      // We can directly broadcast from memory.
-      return DAG.getNode(X86ISD::VBROADCAST, DL, VT, BroadcastV);
-    }
-  }
-
-  // We can't broadcast from a register w/o AVX2.
-  if (!Subtarget->hasAVX2())
-    return SDValue();
+    V = V.getOperand(BroadcastIdx);
  
-  // Check if this is a broadcast of a BUILD_VECTOR which we can always handle,
-  // or is a broadcast of the zero element.
-  if (V.getOpcode() == ISD::BUILD_VECTOR)
-    V = DAG.getNode(ISD::SCALAR_TO_VECTOR, DL, VT, V.getOperand(BroadcastIdx));
-  else if (BroadcastIdx != 0)
+    // If the scalar isn't a load we can't broadcast from it in AVX1, only with
+    // AVX2.
+    if (!Subtarget->hasAVX2() && !ISD::isNON_EXTLoad(V.getNode()))
+      return SDValue();
+  } else if (BroadcastIdx != 0 || !Subtarget->hasAVX2()) {
+    // We can't broadcast from a vector register w/o AVX2, and we can only
+    // broadcast from the zero-element of a vector register.
      return SDValue();
+  }
  
    return DAG.getNode(X86ISD::VBROADCAST, DL, VT, V);
  }
diff --git a/test/CodeGen/X86/2012-07-15-broadcastfold.ll b/test/CodeGen/X86/2012-07-15-broadcastfold.ll

index 1c39c747cdc8d07c113476aae659f9ed88113d5c..519c7cac736f368b71cb1cf3cff1be37271f6a9b 100644 (file)
--- a/test/CodeGen/X86/2012-07-15-broadcastfold.ll
+++ b/test/CodeGen/X86/2012-07-15-broadcastfold.ll
@@ -1,4 +1,5 @@
  ; RUN: llc < %s -march=x86 -mcpu=corei7 -mattr=+avx2 | FileCheck %s
+; RUN: llc < %s -march=x86 -mcpu=corei7 -mattr=+avx2 -x86-experimental-vector-shuffle-lowering | FileCheck %s
  
  declare x86_fastcallcc i64 @barrier()
author	Chandler Carruth <chandlerc@gmail.com>
	Wed, 1 Oct 2014 03:19:43 +0000 (03:19 +0000)
committer	Chandler Carruth <chandlerc@gmail.com>
	Wed, 1 Oct 2014 03:19:43 +0000 (03:19 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
test/CodeGen/X86/2012-07-15-broadcastfold.ll		patch \| blob \| history