Use shuffles to implement insert_vector_elt for i32, i64, f32, and f64.
[oota-llvm.git] / test / CodeGen / X86 / vec_insert-2.ll
1 ; RUN: llvm-as < %s | llc -march=x86 -mattr=+sse2 | grep pinsrw | count 1
2 ; RUN: llvm-as < %s | llc -march=x86 -mattr=+sse2 | grep movhpd | count 1
3 ; RUN: llvm-as < %s | llc -march=x86-64 -mattr=+sse2 | grep unpcklpd | count 1
4
5 define <4 x float> @t1(float %s, <4 x float> %tmp) {
6         %tmp1 = insertelement <4 x float> %tmp, float %s, i32 3
7         ret <4 x float> %tmp1
8 }
9
10 define <4 x i32> @t2(i32 %s, <4 x i32> %tmp) {
11         %tmp1 = insertelement <4 x i32> %tmp, i32 %s, i32 3
12         ret <4 x i32> %tmp1
13 }
14
15 define <2 x double> @t3(double %s, <2 x double> %tmp) {
16         %tmp1 = insertelement <2 x double> %tmp, double %s, i32 1
17         ret <2 x double> %tmp1
18 }
19
20 define <8 x i16> @t4(i16 %s, <8 x i16> %tmp) {
21         %tmp1 = insertelement <8 x i16> %tmp, i16 %s, i32 5
22         ret <8 x i16> %tmp1
23 }