Allow lowering for palignr instructions for mmx sized vectors. Add

author Eric Christopher <echristo@apple.com>

Thu, 15 Apr 2010 01:40:20 +0000 (01:40 +0000)

committer Eric Christopher <echristo@apple.com>

Thu, 15 Apr 2010 01:40:20 +0000 (01:40 +0000)
author Eric Christopher <echristo@apple.com>
Thu, 15 Apr 2010 01:40:20 +0000 (01:40 +0000)
committer Eric Christopher <echristo@apple.com>
Thu, 15 Apr 2010 01:40:20 +0000 (01:40 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index 6e6d2f5ad0bb82de5d0c9821d1f5fa91b9eab346..b33fd82fc11e7e8ac9ff4ecb86158c4265d63145 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -7949,9 +7949,9 @@ bool X86TargetLowering::isNarrowingProfitable(EVT VT1, EVT VT2) const {
  bool
  X86TargetLowering::isShuffleMaskLegal(const SmallVectorImpl<int> &M,
                                        EVT VT) const {
-  // Only do shuffles on 128-bit vector types for now.
+  // Very little shuffling can be done for 64-bit vectors right now.
    if (VT.getSizeInBits() == 64)
-    return false;
+    return isPALIGNRMask(M, VT, Subtarget->hasSSSE3());
  
    // FIXME: pshufb, blends, shifts.
    return (VT.getVectorNumElements() == 2 ||
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index 48e4e0b8fd0c1da4f4df2acb3ba2d5d0ed1b1d0d..ffe2a884b9041a22c4227135f7f098c1c361344e 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -2915,6 +2915,7 @@ defm PSIGND      : SS3I_binop_rm_int_32<0x0A, "psignd",
                                          int_x86_ssse3_psign_d,
                                          int_x86_ssse3_psign_d_128>;
  
+// palignr patterns.
  let Constraints = "$src1 = $dst" in {
    def PALIGNR64rr  : SS3AI<0x0F, MRMSrcReg, (outs VR64:$dst),
                             (ins VR64:$src1, VR64:$src2, i8imm:$src3),
@@ -2935,7 +2936,6 @@ let Constraints = "$src1 = $dst" in {
                             []>, OpSize;
  }
  
-// palignr patterns.
  def : Pat<(int_x86_ssse3_palign_r VR64:$src1, VR64:$src2, (i8 imm:$src3)),
            (PALIGNR64rr VR64:$src1, VR64:$src2, (BYTE_imm imm:$src3))>,
            Requires<[HasSSSE3]>;
@@ -2944,6 +2944,26 @@ def : Pat<(int_x86_ssse3_palign_r VR64:$src1,
                                        (i8 imm:$src3)),
            (PALIGNR64rm VR64:$src1, addr:$src2, (BYTE_imm imm:$src3))>,
            Requires<[HasSSSE3]>;
+def : Pat<(v1i64 (palign:$src3 VR64:$src1, VR64:$src2)),
+          (PALIGNR64rr VR64:$src2, VR64:$src1,
+                       (SHUFFLE_get_palign_imm VR64:$src3))>,
+          Requires<[HasSSSE3]>;
+def : Pat<(v2i32 (palign:$src3 VR64:$src1, VR64:$src2)),
+          (PALIGNR64rr VR64:$src2, VR64:$src1,
+                       (SHUFFLE_get_palign_imm VR64:$src3))>,
+          Requires<[HasSSSE3]>;
+def : Pat<(v2f32 (palign:$src3 VR64:$src1, VR64:$src2)),
+          (PALIGNR64rr VR64:$src2, VR64:$src1,
+                       (SHUFFLE_get_palign_imm VR64:$src3))>,
+          Requires<[HasSSSE3]>;
+def : Pat<(v4i16 (palign:$src3 VR64:$src1, VR64:$src2)),
+          (PALIGNR64rr VR64:$src2, VR64:$src1,
+                       (SHUFFLE_get_palign_imm VR64:$src3))>,
+          Requires<[HasSSSE3]>;
+def : Pat<(v8i8 (palign:$src3 VR64:$src1, VR64:$src2)),
+          (PALIGNR64rr VR64:$src2, VR64:$src1,
+                       (SHUFFLE_get_palign_imm VR64:$src3))>,
+          Requires<[HasSSSE3]>;
  
  def : Pat<(int_x86_ssse3_palign_r_128 VR128:$src1, VR128:$src2, (i8 imm:$src3)),
            (PALIGNR128rr VR128:$src1, VR128:$src2, (BYTE_imm imm:$src3))>,
author	Eric Christopher <echristo@apple.com>
	Thu, 15 Apr 2010 01:40:20 +0000 (01:40 +0000)
committer	Eric Christopher <echristo@apple.com>
	Thu, 15 Apr 2010 01:40:20 +0000 (01:40 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
lib/Target/X86/X86InstrSSE.td		patch \| blob \| history