InstCombine: Turn mul.with.overflow(X, 2) into the cheaper add.with.overflow(X, X)
[oota-llvm.git] / test / Transforms / InstCombine / intrinsics.ll
1 ; RUN: opt %s -instcombine -S | FileCheck %s
2
3 %overflow.result = type {i8, i1}
4
5 declare %overflow.result @llvm.uadd.with.overflow.i8(i8, i8)
6 declare %overflow.result @llvm.umul.with.overflow.i8(i8, i8)
7 declare double @llvm.powi.f64(double, i32) nounwind readonly
8 declare i32 @llvm.cttz.i32(i32) nounwind readnone
9 declare i32 @llvm.ctlz.i32(i32) nounwind readnone
10 declare i32 @llvm.ctpop.i32(i32) nounwind readnone
11 declare i8 @llvm.ctlz.i8(i8) nounwind readnone
12
13 define i8 @uaddtest1(i8 %A, i8 %B) {
14   %x = call %overflow.result @llvm.uadd.with.overflow.i8(i8 %A, i8 %B)
15   %y = extractvalue %overflow.result %x, 0
16   ret i8 %y
17 ; CHECK: @uaddtest1
18 ; CHECK-NEXT: %y = add i8 %A, %B
19 ; CHECK-NEXT: ret i8 %y
20 }
21
22 define i8 @uaddtest2(i8 %A, i8 %B, i1* %overflowPtr) {
23   %and.A = and i8 %A, 127
24   %and.B = and i8 %B, 127
25   %x = call %overflow.result @llvm.uadd.with.overflow.i8(i8 %and.A, i8 %and.B)
26   %y = extractvalue %overflow.result %x, 0
27   %z = extractvalue %overflow.result %x, 1
28   store i1 %z, i1* %overflowPtr
29   ret i8 %y
30 ; CHECK: @uaddtest2
31 ; CHECK-NEXT: %and.A = and i8 %A, 127
32 ; CHECK-NEXT: %and.B = and i8 %B, 127
33 ; CHECK-NEXT: %x = add nuw i8 %and.A, %and.B
34 ; CHECK-NEXT: store i1 false, i1* %overflowPtr
35 ; CHECK-NEXT: ret i8 %x
36 }
37
38 define i8 @uaddtest3(i8 %A, i8 %B, i1* %overflowPtr) {
39   %or.A = or i8 %A, -128
40   %or.B = or i8 %B, -128
41   %x = call %overflow.result @llvm.uadd.with.overflow.i8(i8 %or.A, i8 %or.B)
42   %y = extractvalue %overflow.result %x, 0
43   %z = extractvalue %overflow.result %x, 1
44   store i1 %z, i1* %overflowPtr
45   ret i8 %y
46 ; CHECK: @uaddtest3
47 ; CHECK-NEXT: %or.A = or i8 %A, -128
48 ; CHECK-NEXT: %or.B = or i8 %B, -128
49 ; CHECK-NEXT: %x = add i8 %or.A, %or.B
50 ; CHECK-NEXT: store i1 true, i1* %overflowPtr
51 ; CHECK-NEXT: ret i8 %x
52 }
53
54 define i8 @uaddtest4(i8 %A, i1* %overflowPtr) {
55   %x = call %overflow.result @llvm.uadd.with.overflow.i8(i8 undef, i8 %A)
56   %y = extractvalue %overflow.result %x, 0
57   %z = extractvalue %overflow.result %x, 1
58   store i1 %z, i1* %overflowPtr
59   ret i8 %y
60 ; CHECK: @uaddtest4
61 ; CHECK-NEXT: ret i8 undef
62 }
63
64 define i8 @uaddtest5(i8 %A, i1* %overflowPtr) {
65   %x = call %overflow.result @llvm.uadd.with.overflow.i8(i8 0, i8 %A)
66   %y = extractvalue %overflow.result %x, 0
67   %z = extractvalue %overflow.result %x, 1
68   store i1 %z, i1* %overflowPtr
69   ret i8 %y
70 ; CHECK: @uaddtest5
71 ; CHECK: ret i8 %A
72 }
73
74 define i1 @uaddtest6(i8 %A, i8 %B) {
75   %x = call %overflow.result @llvm.uadd.with.overflow.i8(i8 %A, i8 -4)
76   %z = extractvalue %overflow.result %x, 1
77   ret i1 %z
78 ; CHECK: @uaddtest6
79 ; CHECK-NEXT: %z = icmp ugt i8 %A, 3
80 ; CHECK-NEXT: ret i1 %z
81 }
82
83 define i8 @uaddtest7(i8 %A, i8 %B) {
84   %x = call %overflow.result @llvm.uadd.with.overflow.i8(i8 %A, i8 %B)
85   %z = extractvalue %overflow.result %x, 0
86   ret i8 %z
87 ; CHECK: @uaddtest7
88 ; CHECK-NEXT: %z = add i8 %A, %B
89 ; CHECK-NEXT: ret i8 %z
90 }
91
92
93 define i8 @umultest1(i8 %A, i1* %overflowPtr) {
94   %x = call %overflow.result @llvm.umul.with.overflow.i8(i8 0, i8 %A)
95   %y = extractvalue %overflow.result %x, 0
96   %z = extractvalue %overflow.result %x, 1
97   store i1 %z, i1* %overflowPtr
98   ret i8 %y
99 ; CHECK: @umultest1
100 ; CHECK-NEXT: store i1 false, i1* %overflowPtr
101 ; CHECK-NEXT: ret i8 0
102 }
103
104 define i8 @umultest2(i8 %A, i1* %overflowPtr) {
105   %x = call %overflow.result @llvm.umul.with.overflow.i8(i8 1, i8 %A)
106   %y = extractvalue %overflow.result %x, 0
107   %z = extractvalue %overflow.result %x, 1
108   store i1 %z, i1* %overflowPtr
109   ret i8 %y
110 ; CHECK: @umultest2
111 ; CHECK-NEXT: store i1 false, i1* %overflowPtr
112 ; CHECK-NEXT: ret i8 %A
113 }
114
115 %ov.result.32 = type { i32, i1 }
116 declare %ov.result.32 @llvm.umul.with.overflow.i32(i32, i32) nounwind readnone
117 declare %ov.result.32 @llvm.smul.with.overflow.i32(i32, i32) nounwind readnone
118
119 define i32 @umultest3(i32 %n) nounwind {
120   %shr = lshr i32 %n, 2
121   %mul = call %ov.result.32 @llvm.umul.with.overflow.i32(i32 %shr, i32 3)
122   %ov = extractvalue %ov.result.32 %mul, 1
123   %res = extractvalue %ov.result.32 %mul, 0
124   %ret = select i1 %ov, i32 -1, i32 %res
125   ret i32 %ret
126 ; CHECK: @umultest3
127 ; CHECK-NEXT: shr
128 ; CHECK-NEXT: mul nuw
129 ; CHECK-NEXT: ret
130 }
131
132 define i32 @umultest4(i32 %n) nounwind {
133   %shr = lshr i32 %n, 1
134   %mul = call %ov.result.32 @llvm.umul.with.overflow.i32(i32 %shr, i32 4)
135   %ov = extractvalue %ov.result.32 %mul, 1
136   %res = extractvalue %ov.result.32 %mul, 0
137   %ret = select i1 %ov, i32 -1, i32 %res
138   ret i32 %ret
139 ; CHECK: @umultest4
140 ; CHECK: umul.with.overflow
141 }
142
143 define i32 @umultest5(i32 %n) nounwind {
144   %mul = call %ov.result.32 @llvm.umul.with.overflow.i32(i32 %n, i32 2)
145   %ov = extractvalue %ov.result.32 %mul, 1
146   %res = extractvalue %ov.result.32 %mul, 0
147   %ret = select i1 %ov, i32 -1, i32 %res
148   ret i32 %ret
149 ; CHECK: @umultest5
150 ; CHECK: llvm.uadd.with.overflow.i32(i32 %n, i32 %n)
151 }
152
153 define i32 @smultest1(i32 %n) nounwind {
154   %mul = call %ov.result.32 @llvm.smul.with.overflow.i32(i32 %n, i32 2)
155   %ov = extractvalue %ov.result.32 %mul, 1
156   %res = extractvalue %ov.result.32 %mul, 0
157   %ret = select i1 %ov, i32 -1, i32 %res
158   ret i32 %ret
159 ; CHECK: @smultest1
160 ; CHECK: llvm.sadd.with.overflow.i32(i32 %n, i32 %n)
161 }
162
163 define void @powi(double %V, double *%P) {
164 entry:
165   %A = tail call double @llvm.powi.f64(double %V, i32 -1) nounwind
166   volatile store double %A, double* %P
167
168   %B = tail call double @llvm.powi.f64(double %V, i32 0) nounwind
169   volatile store double %B, double* %P
170
171   %C = tail call double @llvm.powi.f64(double %V, i32 1) nounwind
172   volatile store double %C, double* %P
173   ret void
174 ; CHECK: @powi
175 ; CHECK: %A = fdiv double 1.0{{.*}}, %V
176 ; CHECK: volatile store double %A, 
177 ; CHECK: volatile store double 1.0 
178 ; CHECK: volatile store double %V
179 }
180
181 define i32 @cttz(i32 %a) {
182 entry:
183   %or = or i32 %a, 8
184   %and = and i32 %or, -8
185   %count = tail call i32 @llvm.cttz.i32(i32 %and) nounwind readnone
186   ret i32 %count
187 ; CHECK: @cttz
188 ; CHECK-NEXT: entry:
189 ; CHECK-NEXT: ret i32 3
190 }
191
192 define i8 @ctlz(i8 %a) {
193 entry:
194   %or = or i8 %a, 32
195   %and = and i8 %or, 63
196   %count = tail call i8 @llvm.ctlz.i8(i8 %and) nounwind readnone
197   ret i8 %count
198 ; CHECK: @ctlz
199 ; CHECK-NEXT: entry:
200 ; CHECK-NEXT: ret i8 2
201 }
202
203 define void @cmp.simplify(i32 %a, i32 %b, i1* %c) {
204 entry:
205   %lz = tail call i32 @llvm.ctlz.i32(i32 %a) nounwind readnone
206   %lz.cmp = icmp eq i32 %lz, 32
207   volatile store i1 %lz.cmp, i1* %c
208   %tz = tail call i32 @llvm.cttz.i32(i32 %a) nounwind readnone
209   %tz.cmp = icmp ne i32 %tz, 32
210   volatile store i1 %tz.cmp, i1* %c
211   %pop = tail call i32 @llvm.ctpop.i32(i32 %b) nounwind readnone
212   %pop.cmp = icmp eq i32 %pop, 0
213   volatile store i1 %pop.cmp, i1* %c
214   ret void
215 ; CHECK: @cmp.simplify
216 ; CHECK-NEXT: entry:
217 ; CHECK-NEXT: %lz.cmp = icmp eq i32 %a, 0
218 ; CHECK-NEXT: volatile store i1 %lz.cmp, i1* %c
219 ; CHECK-NEXT: %tz.cmp = icmp ne i32 %a, 0
220 ; CHECK-NEXT: volatile store i1 %tz.cmp, i1* %c
221 ; CHECK-NEXT: %pop.cmp = icmp eq i32 %b, 0
222 ; CHECK-NEXT: volatile store i1 %pop.cmp, i1* %c
223 }
224
225
226 define i32 @cttz_simplify1(i32 %x) nounwind readnone ssp {
227   %tmp1 = tail call i32 @llvm.ctlz.i32(i32 %x)    ; <i32> [#uses=1]
228   %shr3 = lshr i32 %tmp1, 5                       ; <i32> [#uses=1]
229   ret i32 %shr3
230   
231 ; CHECK: @cttz_simplify1
232 ; CHECK: icmp eq i32 %x, 0
233 ; CHECK-NEXT: zext i1 
234 ; CHECK-NEXT: ret i32
235 }
236
237 declare i32 @llvm.ctlz.i32(i32) nounwind readnone
238