[avx] Add patterns for VINSERTF128rm.

author Chad Rosier <mcrosier@apple.com>

Thu, 15 Mar 2012 00:45:30 +0000 (00:45 +0000)

committer Chad Rosier <mcrosier@apple.com>

Thu, 15 Mar 2012 00:45:30 +0000 (00:45 +0000)
author Chad Rosier <mcrosier@apple.com>
Thu, 15 Mar 2012 00:45:30 +0000 (00:45 +0000)
committer Chad Rosier <mcrosier@apple.com>
Thu, 15 Mar 2012 00:45:30 +0000 (00:45 +0000)
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index 7ad2e6d56cf475af6c30b687c9c896a846614326..882d647327bc940e7b568533cc6d5986ef285fdc 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -7758,6 +7758,19 @@ def : Pat<(vinsertf128_insert:$ins (v16i16 VR256:$src1), (v8i16 VR128:$src2),
                                     (i32 imm)),
            (VINSERTF128rr VR256:$src1, VR128:$src2,
                           (INSERT_get_vinsertf128_imm VR256:$ins))>;
+
+def : Pat<(vinsertf128_insert:$ins (v8f32 VR256:$src1), (alignedloadv4f32 addr:$src2),
+                                   (i32 imm)),
+          (VINSERTF128rm VR256:$src1, addr:$src2,
+                         (INSERT_get_vinsertf128_imm VR256:$ins))>;
+def : Pat<(vinsertf128_insert:$ins (v4f64 VR256:$src1), (alignedloadv2f64 addr:$src2),
+                                   (i32 imm)),
+          (VINSERTF128rm VR256:$src1, addr:$src2,
+                         (INSERT_get_vinsertf128_imm VR256:$ins))>;
+def : Pat<(vinsertf128_insert:$ins (v4i64 VR256:$src1), (alignedloadv2i64 addr:$src2),
+                                   (i32 imm)),
+          (VINSERTF128rm VR256:$src1, addr:$src2,
+                         (INSERT_get_vinsertf128_imm VR256:$ins))>;
  }
  
  //===----------------------------------------------------------------------===//
diff --git a/test/CodeGen/X86/avx-vinsertf128.ll b/test/CodeGen/X86/avx-vinsertf128.ll

index def2212db93bd1b2bfc68b2c192250210ae7b1f6..9934a33041355466104e0232d12d3b2d433a34bf 100644 (file)
--- a/test/CodeGen/X86/avx-vinsertf128.ll
+++ b/test/CodeGen/X86/avx-vinsertf128.ll
@@ -104,3 +104,15 @@ ret <8 x i32> %res
  }
  declare <8 x i32> @llvm.x86.avx.vinsertf128.si.256(<8 x i32>, <4 x i32>, i8) nounwind readnone
  
+; rdar://10643481
+; CHECK: vinsertf128_combine
+define <8 x float> @vinsertf128_combine(float* nocapture %f) nounwind uwtable readonly ssp {
+; CHECK-NOT: vmovaps
+; CHECK: vinsertf128
+entry:
+  %add.ptr = getelementptr inbounds float* %f, i64 4
+  %0 = bitcast float* %add.ptr to <4 x float>*
+  %1 = load <4 x float>* %0, align 16
+  %2 = tail call <8 x float> @llvm.x86.avx.vinsertf128.ps.256(<8 x float> undef, <4 x float> %1, i8 1)
+  ret <8 x float> %2
+}
author	Chad Rosier <mcrosier@apple.com>
	Thu, 15 Mar 2012 00:45:30 +0000 (00:45 +0000)
committer	Chad Rosier <mcrosier@apple.com>
	Thu, 15 Mar 2012 00:45:30 +0000 (00:45 +0000)
lib/Target/X86/X86InstrSSE.td		patch \| blob \| history
test/CodeGen/X86/avx-vinsertf128.ll		patch \| blob \| history