Re-implement the main strength-reduction portion of LoopStrengthReduction.
[oota-llvm.git] / test / CodeGen / X86 / vec_shuffle-16.ll
1 ; RUN: llc < %s -march=x86 -mattr=+sse,-sse2 -mtriple=i386-apple-darwin -o %t
2 ; RUN: grep shufps %t | count 4
3 ; RUN: grep movaps %t | count 2
4 ; RUN: llc < %s -march=x86 -mattr=+sse2 -mtriple=i386-apple-darwin -o %t
5 ; RUN: grep pshufd %t | count 4
6 ; RUN: not grep shufps %t
7 ; RUN: not grep mov %t
8
9 define <4 x float> @t1(<4 x float> %a, <4 x float> %b) nounwind  {
10         %tmp1 = shufflevector <4 x float> %b, <4 x float> undef, <4 x i32> zeroinitializer
11         ret <4 x float> %tmp1
12 }
13
14 define <4 x float> @t2(<4 x float> %A, <4 x float> %B) nounwind {
15         %tmp = shufflevector <4 x float> %A, <4 x float> %B, <4 x i32> < i32 3, i32 3, i32 3, i32 3 >
16         ret <4 x float> %tmp
17 }
18
19 define <4 x float> @t3(<4 x float> %A, <4 x float> %B) nounwind {
20         %tmp = shufflevector <4 x float> %A, <4 x float> %B, <4 x i32> < i32 4, i32 4, i32 4, i32 4 >
21         ret <4 x float> %tmp
22 }
23
24 define <4 x float> @t4(<4 x float> %A, <4 x float> %B) nounwind {
25         %tmp = shufflevector <4 x float> %A, <4 x float> %B, <4 x i32> < i32 1, i32 3, i32 2, i32 0 >
26         ret <4 x float> %tmp
27 }