Implement "punpckldq %xmm0, $xmm0" as "pshufd $0x50, %xmm0, %xmm" unless optimizing...
[oota-llvm.git] / test / CodeGen / X86 / vec_shuffle-23.ll
1 ; RUN: llvm-as < %s | llc -march=x86 -mattr=+sse2                | not grep punpck
2 ; RUN: llvm-as < %s | llc -march=x86 -mattr=+sse2                |     grep pshufd
3 ; RUN: llvm-as < %s | llc -march=x86 -mattr=+sse2 -optimize-size |     grep punpck
4
5 define i32 @t() nounwind {
6 entry:
7         %a = alloca <4 x i32>           ; <<4 x i32>*> [#uses=2]
8         %b = alloca <4 x i32>           ; <<4 x i32>*> [#uses=5]
9         volatile store <4 x i32> < i32 0, i32 1, i32 2, i32 3 >, <4 x i32>* %a
10         %tmp = load <4 x i32>* %a               ; <<4 x i32>> [#uses=1]
11         store <4 x i32> %tmp, <4 x i32>* %b
12         %tmp1 = load <4 x i32>* %b              ; <<4 x i32>> [#uses=1]
13         %tmp2 = load <4 x i32>* %b              ; <<4 x i32>> [#uses=1]
14         %punpckldq = shufflevector <4 x i32> %tmp1, <4 x i32> %tmp2, <4 x i32> < i32 0, i32 4, i32 1, i32 5 >           ; <<4 x i32>> [#uses=1]
15         store <4 x i32> %punpckldq, <4 x i32>* %b
16         %tmp3 = load <4 x i32>* %b              ; <<4 x i32>> [#uses=1]
17         %result = extractelement <4 x i32> %tmp3, i32 0         ; <i32> [#uses=1]
18         ret i32 %result
19 }