Use opt -S instead of piping bitcode output through llvm-dis.
[oota-llvm.git] / test / Transforms / ScalarRepl / vector_memcpy.ll
1 ; RUN: opt %s -scalarrepl -S > %t
2 ; RUN: grep {ret <16 x float> %A} %t
3 ; RUN: grep {ret <16 x float> zeroinitializer} %t
4
5 define <16 x float> @foo(<16 x float> %A) nounwind {
6         %tmp = alloca <16 x float>, align 16
7         %tmp2 = alloca <16 x float>, align 16
8         store <16 x float> %A, <16 x float>* %tmp
9         %s = bitcast <16 x float>* %tmp to i8*
10         %s2 = bitcast <16 x float>* %tmp2 to i8*
11         call void @llvm.memcpy.i64(i8* %s2, i8* %s, i64 64, i32 16)
12         
13         %R = load <16 x float>* %tmp2
14         ret <16 x float> %R
15 }
16
17 define <16 x float> @foo2(<16 x float> %A) nounwind {
18         %tmp2 = alloca <16 x float>, align 16
19
20         %s2 = bitcast <16 x float>* %tmp2 to i8*
21         call void @llvm.memset.i64(i8* %s2, i8 0, i64 64, i32 16)
22         
23         %R = load <16 x float>* %tmp2
24         ret <16 x float> %R
25 }
26
27
28 declare void @llvm.memcpy.i64(i8* nocapture, i8* nocapture, i64, i32) nounwind
29 declare void @llvm.memset.i64(i8* nocapture, i8, i64, i32) nounwind