[AVX] Support VSINSERTF128 with more patterns and appropriate

author David Greene <greened@obbligato.org>

Fri, 4 Feb 2011 16:08:29 +0000 (16:08 +0000)

committer David Greene <greened@obbligato.org>

Fri, 4 Feb 2011 16:08:29 +0000 (16:08 +0000)
author David Greene <greened@obbligato.org>
Fri, 4 Feb 2011 16:08:29 +0000 (16:08 +0000)
committer David Greene <greened@obbligato.org>
Fri, 4 Feb 2011 16:08:29 +0000 (16:08 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index 048b88dfadf025ef95901e1936298c8c217ab4fd..f85f7b1db37dffc42841b0541dd7356cefd75773 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -3281,6 +3281,25 @@ bool X86::isVEXTRACTF128Index(SDNode *N) {
    return Result;
  }
  
+/// isVINSERTF128Index - Return true if the specified INSERT_SUBVECTOR
+/// operand specifies a subvector insert that is suitable for input to
+/// VINSERTF128.
+bool X86::isVINSERTF128Index(SDNode *N) {
+  if (!isa<ConstantSDNode>(N->getOperand(2).getNode()))
+    return false;
+
+  // The index should be aligned on a 128-bit boundary.
+  uint64_t Index =
+    cast<ConstantSDNode>(N->getOperand(2).getNode())->getZExtValue();
+
+  unsigned VL = N->getValueType(0).getVectorNumElements();
+  unsigned VBits = N->getValueType(0).getSizeInBits();
+  unsigned ElSize = VBits / VL;
+  bool Result = (Index * ElSize) % 128 == 0;
+
+  return Result;
+}
+
  /// getShuffleSHUFImmediate - Return the appropriate immediate to shuffle
  /// the specified VECTOR_SHUFFLE mask with PSHUF* and SHUFP* instructions.
  unsigned X86::getShuffleSHUFImmediate(SDNode *N) {
@@ -3367,6 +3386,24 @@ unsigned X86::getExtractVEXTRACTF128Immediate(SDNode *N) {
    return Index / NumElemsPerChunk;
  }
  
+/// getInsertVINSERTF128Immediate - Return the appropriate immediate
+/// to insert at the specified INSERT_SUBVECTOR index with VINSERTF128
+/// instructions.
+unsigned X86::getInsertVINSERTF128Immediate(SDNode *N) {
+  if (!isa<ConstantSDNode>(N->getOperand(2).getNode()))
+    llvm_unreachable("Illegal insert subvector for VINSERTF128");
+
+  uint64_t Index =
+    cast<ConstantSDNode>(N->getOperand(2).getNode())->getZExtValue();  
+
+  EVT VecVT = N->getValueType(0);
+  EVT ElVT = VecVT.getVectorElementType();
+
+  unsigned NumElemsPerChunk = 128 / ElVT.getSizeInBits();
+
+  return Index / NumElemsPerChunk;
+}
+
  /// isZeroNode - Returns true if Elt is a constant zero or a floating point
  /// constant +0.0.
  bool X86::isZeroNode(SDValue Elt) {
diff --git a/lib/Target/X86/X86ISelLowering.h b/lib/Target/X86/X86ISelLowering.h

index 29c2706218e241ef0edb9116161cbae33d2caf28..419da3742cf81097cf66b4a3566a8bf63c166697 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.h
+++ b/lib/Target/X86/X86ISelLowering.h
@@ -413,6 +413,11 @@ namespace llvm {
      /// suitable for input to VEXTRACTF128.
      bool isVEXTRACTF128Index(SDNode *N);
  
+    /// isVINSERTF128Index - Return true if the specified
+    /// INSERT_SUBVECTOR operand specifies a subvector insert that is
+    /// suitable for input to VINSERTF128.
+    bool isVINSERTF128Index(SDNode *N);
+
      /// getShuffleSHUFImmediate - Return the appropriate immediate to shuffle
      /// the specified isShuffleMask VECTOR_SHUFFLE mask with PSHUF* and SHUFP*
      /// instructions.
@@ -435,6 +440,11 @@ namespace llvm {
      /// with VEXTRACTF128 instructions.
      unsigned getExtractVEXTRACTF128Immediate(SDNode *N);
  
+    /// getInsertVINSERTF128Immediate - Return the appropriate
+    /// immediate to insert at the specified INSERT_SUBVECTOR index
+    /// with VINSERTF128 instructions.
+    unsigned getInsertVINSERTF128Immediate(SDNode *N);
+
      /// isZeroNode - Returns true if Elt is a constant zero or a floating point
      /// constant +0.0.
      bool isZeroNode(SDValue Elt);
diff --git a/lib/Target/X86/X86InstrFragmentsSIMD.td b/lib/Target/X86/X86InstrFragmentsSIMD.td

index 177730d2531ecc3bd0697fadf1172dad091a7e95..5016c0f171ae4cf52d234b69fbeee54951387531 100644 (file)
--- a/lib/Target/X86/X86InstrFragmentsSIMD.td
+++ b/lib/Target/X86/X86InstrFragmentsSIMD.td
@@ -348,6 +348,12 @@ def EXTRACT_get_vextractf128_imm : SDNodeXForm<extract_subvector, [{
    return getI8Imm(X86::getExtractVEXTRACTF128Immediate(N));
  }]>;
  
+// INSERT_get_vinsertf128_imm xform function: convert insert_subvector index to 
+// VINSERTF128 imm.
+def INSERT_get_vinsertf128_imm : SDNodeXForm<insert_subvector, [{
+  return getI8Imm(X86::getInsertVINSERTF128Immediate(N));
+}]>;
+
  def splat_lo : PatFrag<(ops node:$lhs, node:$rhs),
                         (vector_shuffle node:$lhs, node:$rhs), [{
    ShuffleVectorSDNode *SVOp = cast<ShuffleVectorSDNode>(N);
@@ -444,3 +450,10 @@ def vextractf128_extract : PatFrag<(ops node:$bigvec, node:$index),
                                                        node:$index), [{
    return X86::isVEXTRACTF128Index(N);
  }], EXTRACT_get_vextractf128_imm>;
+
+def vinsertf128_insert : PatFrag<(ops node:$bigvec, node:$smallvec,
+                                      node:$index),
+                                 (insert_subvector node:$bigvec, node:$smallvec,
+                                                   node:$index), [{
+  return X86::isVINSERTF128Index(N);
+}], INSERT_get_vinsertf128_imm>;
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index 68f21563e160f59f2968f7cb39f4a9daee7610e1..5d32fb8f68ee80844bc704987743f381e5b658a8 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -5436,6 +5436,23 @@ def : Pat<(int_x86_avx_vinsertf128_ps_256 VR256:$src1, VR128:$src2, imm:$src3),
  def : Pat<(int_x86_avx_vinsertf128_si_256 VR256:$src1, VR128:$src2, imm:$src3),
            (VINSERTF128rr VR256:$src1, VR128:$src2, imm:$src3)>;
  
+def : Pat<(vinsertf128_insert:$ins (v8f32 VR256:$src1), (v4f32 VR128:$src2),
+                                   (i32 imm)),
+          (VINSERTF128rr VR256:$src1, VR128:$src2,
+                         (INSERT_get_vinsertf128_imm VR256:$ins))>;
+def : Pat<(vinsertf128_insert:$ins (v4f64 VR256:$src1), (v2f64 VR128:$src2),
+                                   (i32 imm)),
+          (VINSERTF128rr VR256:$src1, VR128:$src2,
+                         (INSERT_get_vinsertf128_imm VR256:$ins))>;
+def : Pat<(vinsertf128_insert:$ins (v8i32 VR256:$src1), (v4i32 VR128:$src2),
+                                   (i32 imm)),
+          (VINSERTF128rr VR256:$src1, VR128:$src2,
+                         (INSERT_get_vinsertf128_imm VR256:$ins))>;
+def : Pat<(vinsertf128_insert:$ins (v4i64 VR256:$src1), (v2i64 VR128:$src2),
+                                   (i32 imm)),
+          (VINSERTF128rr VR256:$src1, VR128:$src2,
+                         (INSERT_get_vinsertf128_imm VR256:$ins))>;
+
  def : Pat<(int_x86_avx_vextractf128_pd_256 VR256:$src1, imm:$src2),
            (VEXTRACTF128rr VR256:$src1, imm:$src2)>;
  def : Pat<(int_x86_avx_vextractf128_ps_256 VR256:$src1, imm:$src2),
author	David Greene <greened@obbligato.org>
	Fri, 4 Feb 2011 16:08:29 +0000 (16:08 +0000)
committer	David Greene <greened@obbligato.org>
	Fri, 4 Feb 2011 16:08:29 +0000 (16:08 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
lib/Target/X86/X86ISelLowering.h		patch \| blob \| history
lib/Target/X86/X86InstrFragmentsSIMD.td		patch \| blob \| history
lib/Target/X86/X86InstrSSE.td		patch \| blob \| history