[AVX512] add PSLLD and PSLLQ Intrinsic
[oota-llvm.git] / test / CodeGen / X86 / 2007-11-30-LoadFolding-Bug.ll
1 ; RUN: llc < %s -march=x86 -mattr=+sse2 | FileCheck %s
2 ; Increment in loop bb.i28.i adjusted to 2, to prevent loop reversal from
3 ; kicking in.
4
5 declare fastcc void @rdft(i32, i32, double*, i32*, double*)
6
7 define fastcc void @mp_sqrt(i32 %n, i32 %radix, i32* %in, i32* %out, i32* %tmp1, i32* %tmp2, i32 %nfft, double* %tmp1fft, double* %tmp2fft, i32* %ip, double* %w) nounwind {
8 entry:
9         br label %bb.i5
10
11 bb.i5:          ; preds = %bb.i5, %entry
12         %nfft_init.0.i = phi i32 [ 1, %entry ], [ %tmp7.i3, %bb.i5 ]            ; <i32> [#uses=1]
13         %foo = phi i1 [1, %entry], [0, %bb.i5]
14         %tmp7.i3 = shl i32 %nfft_init.0.i, 1            ; <i32> [#uses=2]
15         br i1 %foo, label %bb.i5, label %mp_unexp_mp2d.exit.i
16
17 mp_unexp_mp2d.exit.i:           ; preds = %bb.i5
18         br i1 %foo, label %cond_next.i, label %cond_true.i
19
20 cond_true.i:            ; preds = %mp_unexp_mp2d.exit.i
21         ret void
22
23 cond_next.i:            ; preds = %mp_unexp_mp2d.exit.i
24         %tmp22.i = sdiv i32 0, 2                ; <i32> [#uses=2]
25         br i1 %foo, label %cond_true29.i, label %cond_next36.i
26
27 cond_true29.i:          ; preds = %cond_next.i
28         ret void
29
30 cond_next36.i:          ; preds = %cond_next.i
31         store i32 %tmp22.i, i32* null, align 4
32         %tmp8.i14.i = select i1 %foo, i32 1, i32 0              ; <i32> [#uses=1]
33         br label %bb.i28.i
34
35 bb.i28.i:               ; preds = %bb.i28.i, %cond_next36.i
36 ; CHECK: %bb.i28.i
37 ; CHECK: addl $2
38 ; CHECK: addl $-2
39         %j.0.reg2mem.0.i16.i = phi i32 [ 0, %cond_next36.i ], [ %indvar.next39.i, %bb.i28.i ]           ; <i32> [#uses=2]
40         %din_addr.1.reg2mem.0.i17.i = phi double [ 0.000000e+00, %cond_next36.i ], [ %tmp16.i25.i, %bb.i28.i ]          ; <double> [#uses=1]
41         %tmp1.i18.i = fptosi double %din_addr.1.reg2mem.0.i17.i to i32          ; <i32> [#uses=2]
42         %tmp4.i19.i = icmp slt i32 %tmp1.i18.i, %radix          ; <i1> [#uses=1]
43         %x.0.i21.i = select i1 %tmp4.i19.i, i32 %tmp1.i18.i, i32 0              ; <i32> [#uses=1]
44         %tmp41.sum.i = add i32 %j.0.reg2mem.0.i16.i, 2          ; <i32> [#uses=0]
45         %tmp1213.i23.i = sitofp i32 %x.0.i21.i to double                ; <double> [#uses=1]
46         %tmp15.i24.i = fsub double 0.000000e+00, %tmp1213.i23.i         ; <double> [#uses=1]
47         %tmp16.i25.i = fmul double 0.000000e+00, %tmp15.i24.i           ; <double> [#uses=1]
48         %indvar.next39.i = add i32 %j.0.reg2mem.0.i16.i, 2              ; <i32> [#uses=2]
49         %exitcond40.i = icmp eq i32 %indvar.next39.i, %tmp8.i14.i               ; <i1> [#uses=1]
50         br i1 %exitcond40.i, label %mp_unexp_d2mp.exit29.i, label %bb.i28.i
51
52 mp_unexp_d2mp.exit29.i:         ; preds = %bb.i28.i
53         %tmp46.i = sub i32 0, %tmp22.i          ; <i32> [#uses=1]
54         store i32 %tmp46.i, i32* null, align 4
55         br i1 %exitcond40.i, label %bb.i.i, label %mp_sqrt_init.exit
56
57 bb.i.i:         ; preds = %bb.i.i, %mp_unexp_d2mp.exit29.i
58         br label %bb.i.i
59
60 mp_sqrt_init.exit:              ; preds = %mp_unexp_d2mp.exit29.i
61         tail call fastcc void @mp_mul_csqu( i32 0, double* %tmp1fft )
62         tail call fastcc void @rdft( i32 0, i32 -1, double* null, i32* %ip, double* %w )
63         tail call fastcc void @mp_mul_d2i( i32 0, i32 %radix, i32 0, double* %tmp1fft, i32* %tmp2 )
64         br i1 %exitcond40.i, label %cond_false.i, label %cond_true36.i
65
66 cond_true36.i:          ; preds = %mp_sqrt_init.exit
67         ret void
68
69 cond_false.i:           ; preds = %mp_sqrt_init.exit
70         tail call fastcc void @mp_round( i32 0, i32 %radix, i32 0, i32* %out )
71         tail call fastcc void @mp_add( i32 0, i32 %radix, i32* %tmp1, i32* %tmp2, i32* %tmp1 )
72         tail call fastcc void @mp_sub( i32 0, i32 %radix, i32* %in, i32* %tmp2, i32* %tmp2 )
73         tail call fastcc void @mp_round( i32 0, i32 %radix, i32 0, i32* %tmp1 )
74         tail call fastcc void @mp_mul_d2i( i32 0, i32 %radix, i32 %tmp7.i3, double* %tmp2fft, i32* %tmp2 )
75         ret void
76 }
77
78 declare fastcc void @mp_add(i32, i32, i32*, i32*, i32*)
79
80 declare fastcc void @mp_sub(i32, i32, i32*, i32*, i32*)
81
82 declare fastcc void @mp_round(i32, i32, i32, i32*)
83
84 declare fastcc void @mp_mul_csqu(i32, double*)
85
86 declare fastcc void @mp_mul_d2i(i32, i32, i32, double*, i32*)