add test to show suboptimal load merging behavior
[oota-llvm.git] / test / CodeGen / X86 / vec_set-7.ll
1 ; RUN: llc < %s -march=x86 -mattr=+sse2 | grep movsd | count 1
2
3 define <2 x i64> @test(<2 x i64>* %p) nounwind {
4         %tmp = bitcast <2 x i64>* %p to double*         
5         %tmp.upgrd.1 = load double, double* %tmp        
6         %tmp.upgrd.2 = insertelement <2 x double> undef, double %tmp.upgrd.1, i32 0
7         %tmp5 = insertelement <2 x double> %tmp.upgrd.2, double 0.0, i32 1
8         %tmp.upgrd.3 = bitcast <2 x double> %tmp5 to <2 x i64>
9         ret <2 x i64> %tmp.upgrd.3
10 }
11