Teach instcombine's sext elimination logic to be more aggressive.
[oota-llvm.git] / test / Transforms / InstCombine / cast.ll
1 ; Tests to make sure elimination of casts is working correctly
2 ; RUN: opt < %s -instcombine -S | FileCheck %s
3 target datalayout = "E-p:64:64:64-a0:0:8-f32:32:32-f64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:32:64-v64:64:64-v128:128:128-n8:16:32:64"
4
5 @inbuf = external global [32832 x i8]           ; <[32832 x i8]*> [#uses=1]
6
7 define i32 @test1(i32 %A) {
8         %c1 = bitcast i32 %A to i32             ; <i32> [#uses=1]
9         %c2 = bitcast i32 %c1 to i32            ; <i32> [#uses=1]
10         ret i32 %c2
11 ; CHECK: ret i32 %A
12 }
13
14 define i64 @test2(i8 %A) {
15         %c1 = zext i8 %A to i16         ; <i16> [#uses=1]
16         %c2 = zext i16 %c1 to i32               ; <i32> [#uses=1]
17         %Ret = zext i32 %c2 to i64              ; <i64> [#uses=1]
18         ret i64 %Ret
19 ; CHECK: %Ret = zext i8 %A to i64
20 ; CHECK: ret i64 %Ret
21 }
22
23 ; This function should just use bitwise AND
24 define i64 @test3(i64 %A) {
25         %c1 = trunc i64 %A to i8                ; <i8> [#uses=1]
26         %c2 = zext i8 %c1 to i64                ; <i64> [#uses=1]
27         ret i64 %c2
28 ; CHECK: %c2 = and i64 %A, 255
29 ; CHECK: ret i64 %c2
30 }
31
32 define i32 @test4(i32 %A, i32 %B) {
33         %COND = icmp slt i32 %A, %B             ; <i1> [#uses=1]
34         ; Booleans are unsigned integrals
35         %c = zext i1 %COND to i8                ; <i8> [#uses=1]
36         ; for the cast elim purpose
37         %result = zext i8 %c to i32             ; <i32> [#uses=1]
38         ret i32 %result
39 ; CHECK: %COND = icmp slt i32 %A, %B
40 ; CHECK: %result = zext i1 %COND to i32
41 ; CHECK: ret i32 %result
42 }
43
44 define i32 @test5(i1 %B) {
45         ; This cast should get folded into
46         %c = zext i1 %B to i8           ; <i8> [#uses=1]
47         ; this cast        
48         %result = zext i8 %c to i32             ; <i32> [#uses=1]
49         ret i32 %result
50 ; CHECK: %result = zext i1 %B to i32
51 ; CHECK: ret i32 %result
52 }
53
54 define i32 @test6(i64 %A) {
55         %c1 = trunc i64 %A to i32               ; <i32> [#uses=1]
56         %res = bitcast i32 %c1 to i32           ; <i32> [#uses=1]
57         ret i32 %res
58 ; CHECK:  trunc i64 %A to i32
59 ; CHECK-NEXT: ret i32
60 }
61
62 define i64 @test7(i1 %A) {
63         %c1 = zext i1 %A to i32         ; <i32> [#uses=1]
64         %res = sext i32 %c1 to i64              ; <i64> [#uses=1]
65         ret i64 %res
66 ; CHECK: %res = zext i1 %A to i64
67 ; CHECK: ret i64 %res
68 }
69
70 define i64 @test8(i8 %A) {
71         %c1 = sext i8 %A to i64         ; <i64> [#uses=1]
72         %res = bitcast i64 %c1 to i64           ; <i64> [#uses=1]
73         ret i64 %res
74 ; CHECK: = sext i8 %A to i64
75 ; CHECK-NEXT: ret i64
76 }
77
78 define i16 @test9(i16 %A) {
79         %c1 = sext i16 %A to i32                ; <i32> [#uses=1]
80         %c2 = trunc i32 %c1 to i16              ; <i16> [#uses=1]
81         ret i16 %c2
82 ; CHECK: ret i16 %A
83 }
84
85 define i16 @test10(i16 %A) {
86         %c1 = sext i16 %A to i32                ; <i32> [#uses=1]
87         %c2 = trunc i32 %c1 to i16              ; <i16> [#uses=1]
88         ret i16 %c2
89 ; CHECK: ret i16 %A
90 }
91
92 declare void @varargs(i32, ...)
93
94 define void @test11(i32* %P) {
95         %c = bitcast i32* %P to i16*            ; <i16*> [#uses=1]
96         call void (i32, ...)* @varargs( i32 5, i16* %c )
97         ret void
98 ; CHECK: call void (i32, ...)* @varargs(i32 5, i32* %P)
99 ; CHECK: ret void
100 }
101
102 define i32* @test12() {
103         %p = malloc [4 x i8]            ; <[4 x i8]*> [#uses=1]
104         %c = bitcast [4 x i8]* %p to i32*               ; <i32*> [#uses=1]
105         ret i32* %c
106 ; CHECK: %malloccall = tail call i8* @malloc(i32 4)
107 ; CHECK: ret i32* %c
108 }
109
110 define i8* @test13(i64 %A) {
111         %c = getelementptr [0 x i8]* bitcast ([32832 x i8]* @inbuf to [0 x i8]*), i64 0, i64 %A             ; <i8*> [#uses=1]
112         ret i8* %c
113 ; CHECK: %c = getelementptr [32832 x i8]* @inbuf, i64 0, i64 %A
114 ; CHECK: ret i8* %c
115 }
116
117 define i1 @test14(i8 %A) {
118         %c = bitcast i8 %A to i8                ; <i8> [#uses=1]
119         %X = icmp ult i8 %c, -128               ; <i1> [#uses=1]
120         ret i1 %X
121 ; CHECK: %X = icmp sgt i8 %A, -1
122 ; CHECK: ret i1 %X
123 }
124
125
126 ; This just won't occur when there's no difference between ubyte and sbyte
127 ;bool %test15(ubyte %A) {
128 ;        %c = cast ubyte %A to sbyte
129 ;        %X = setlt sbyte %c, 0   ; setgt %A, 127
130 ;        ret bool %X
131 ;}
132
133 define i1 @test16(i32* %P) {
134         %c = icmp ne i32* %P, null              ; <i1> [#uses=1]
135         ret i1 %c
136 ; CHECK: %c = icmp ne i32* %P, null
137 ; CHECK: ret i1 %c
138 }
139
140 define i16 @test17(i1 %tmp3) {
141         %c = zext i1 %tmp3 to i32               ; <i32> [#uses=1]
142         %t86 = trunc i32 %c to i16              ; <i16> [#uses=1]
143         ret i16 %t86
144 ; CHECK: %t86 = zext i1 %tmp3 to i16
145 ; CHECK: ret i16 %t86
146 }
147
148 define i16 @test18(i8 %tmp3) {
149         %c = sext i8 %tmp3 to i32               ; <i32> [#uses=1]
150         %t86 = trunc i32 %c to i16              ; <i16> [#uses=1]
151         ret i16 %t86
152 ; CHECK: %t86 = sext i8 %tmp3 to i16
153 ; CHECK: ret i16 %t86
154 }
155
156 define i1 @test19(i32 %X) {
157         %c = sext i32 %X to i64         ; <i64> [#uses=1]
158         %Z = icmp slt i64 %c, 12345             ; <i1> [#uses=1]
159         ret i1 %Z
160 ; CHECK: %Z = icmp slt i32 %X, 12345
161 ; CHECK: ret i1 %Z
162 }
163
164 define i1 @test20(i1 %B) {
165         %c = zext i1 %B to i32          ; <i32> [#uses=1]
166         %D = icmp slt i32 %c, -1                ; <i1> [#uses=1]
167         ;; false
168         ret i1 %D
169 ; CHECK: ret i1 false
170 }
171
172 define i32 @test21(i32 %X) {
173         %c1 = trunc i32 %X to i8                ; <i8> [#uses=1]
174         ;; sext -> zext -> and -> nop
175         %c2 = sext i8 %c1 to i32                ; <i32> [#uses=1]
176         %RV = and i32 %c2, 255          ; <i32> [#uses=1]
177         ret i32 %RV
178 ; CHECK: %c21 = and i32 %X, 255
179 ; CHECK: ret i32 %c21
180 }
181
182 define i32 @test22(i32 %X) {
183         %c1 = trunc i32 %X to i8                ; <i8> [#uses=1]
184         ;; sext -> zext -> and -> nop
185         %c2 = sext i8 %c1 to i32                ; <i32> [#uses=1]
186         %RV = shl i32 %c2, 24           ; <i32> [#uses=1]
187         ret i32 %RV
188 ; CHECK: %RV = shl i32 %X, 24
189 ; CHECK: ret i32 %RV
190 }
191
192 define i32 @test23(i32 %X) {
193         ;; Turn into an AND even though X
194         %c1 = trunc i32 %X to i16               ; <i16> [#uses=1]
195         ;; and Z are signed.
196         %c2 = zext i16 %c1 to i32               ; <i32> [#uses=1]
197         ret i32 %c2
198 ; CHECK: %c2 = and i32 %X, 65535
199 ; CHECK: ret i32 %c2
200 }
201
202 define i1 @test24(i1 %C) {
203         %X = select i1 %C, i32 14, i32 1234             ; <i32> [#uses=1]
204         ;; Fold cast into select
205         %c = icmp ne i32 %X, 0          ; <i1> [#uses=1]
206         ret i1 %c
207 ; CHECK: ret i1 true
208 }
209
210 define void @test25(i32** %P) {
211         %c = bitcast i32** %P to float**                ; <float**> [#uses=1]
212         ;; Fold cast into null
213         store float* null, float** %c
214         ret void
215 ; CHECK: store i32* null, i32** %P
216 ; CHECK: ret void
217 }
218
219 define i32 @test26(float %F) {
220         ;; no need to cast from float->double.
221         %c = fpext float %F to double           ; <double> [#uses=1]
222         %D = fptosi double %c to i32            ; <i32> [#uses=1]
223         ret i32 %D
224 ; CHECK: %D = fptosi float %F to i32
225 ; CHECK: ret i32 %D
226 }
227
228 define [4 x float]* @test27([9 x [4 x float]]* %A) {
229         %c = bitcast [9 x [4 x float]]* %A to [4 x float]*              ; <[4 x float]*> [#uses=1]
230         ret [4 x float]* %c
231 ; CHECK: %c = getelementptr inbounds [9 x [4 x float]]* %A, i64 0, i64 0
232 ; CHECK: ret [4 x float]* %c
233 }
234
235 define float* @test28([4 x float]* %A) {
236         %c = bitcast [4 x float]* %A to float*          ; <float*> [#uses=1]
237         ret float* %c
238 ; CHECK: %c = getelementptr inbounds [4 x float]* %A, i64 0, i64 0
239 ; CHECK: ret float* %c
240 }
241
242 define i32 @test29(i32 %c1, i32 %c2) {
243         %tmp1 = trunc i32 %c1 to i8             ; <i8> [#uses=1]
244         %tmp4.mask = trunc i32 %c2 to i8                ; <i8> [#uses=1]
245         %tmp = or i8 %tmp4.mask, %tmp1          ; <i8> [#uses=1]
246         %tmp10 = zext i8 %tmp to i32            ; <i32> [#uses=1]
247         ret i32 %tmp10
248 ; CHECK: %tmp2 = or i32 %c2, %c1
249 ; CHECK: %tmp10 = and i32 %tmp2, 255
250 ; CHECK: ret i32 %tmp10
251 }
252
253 define i32 @test30(i32 %c1) {
254         %c2 = trunc i32 %c1 to i8               ; <i8> [#uses=1]
255         %c3 = xor i8 %c2, 1             ; <i8> [#uses=1]
256         %c4 = zext i8 %c3 to i32                ; <i32> [#uses=1]
257         ret i32 %c4
258 ; CHECK: %c3 = and i32 %c1, 255
259 ; CHECK: %c4 = xor i32 %c3, 1
260 ; CHECK: ret i32 %c4
261 }
262
263 define i1 @test31(i64 %A) {
264         %B = trunc i64 %A to i32                ; <i32> [#uses=1]
265         %C = and i32 %B, 42             ; <i32> [#uses=1]
266         %D = icmp eq i32 %C, 10         ; <i1> [#uses=1]
267         ret i1 %D
268 ; CHECK: %C1 = and i64 %A, 42
269 ; CHECK: %D = icmp eq i64 %C1, 10
270 ; CHECK: ret i1 %D
271 }
272
273 define void @test32(double** %tmp) {
274         %tmp8 = malloc [16 x i8]                ; <[16 x i8]*> [#uses=1]
275         %tmp8.upgrd.1 = bitcast [16 x i8]* %tmp8 to double*             ; <double*> [#uses=1]
276         store double* %tmp8.upgrd.1, double** %tmp
277         ret void
278 ; CHECK: %malloccall = tail call i8* @malloc(i32 16)
279 ; CHECK: %tmp8.upgrd.1 = bitcast i8* %malloccall to double*
280 ; CHECK: store double* %tmp8.upgrd.1, double** %tmp
281 ; CHECK: ret void
282 }
283
284 define i32 @test33(i32 %c1) {
285         %x = bitcast i32 %c1 to float           ; <float> [#uses=1]
286         %y = bitcast float %x to i32            ; <i32> [#uses=1]
287         ret i32 %y
288 ; CHECK: ret i32 %c1
289 }
290
291 define i16 @test34(i16 %a) {
292         %c1 = zext i16 %a to i32                ; <i32> [#uses=1]
293         %tmp21 = lshr i32 %c1, 8                ; <i32> [#uses=1]
294         %c2 = trunc i32 %tmp21 to i16           ; <i16> [#uses=1]
295         ret i16 %c2
296 ; CHECK: %tmp21 = lshr i16 %a, 8
297 ; CHECK: ret i16 %tmp21
298 }
299
300 define i16 @test35(i16 %a) {
301         %c1 = bitcast i16 %a to i16             ; <i16> [#uses=1]
302         %tmp2 = lshr i16 %c1, 8         ; <i16> [#uses=1]
303         %c2 = bitcast i16 %tmp2 to i16          ; <i16> [#uses=1]
304         ret i16 %c2
305 ; CHECK: %tmp2 = lshr i16 %a, 8
306 ; CHECK: ret i16 %tmp2
307 }
308
309 ; icmp sgt i32 %a, -1
310 ; rdar://6480391
311 define i1 @test36(i32 %a) {
312         %b = lshr i32 %a, 31
313         %c = trunc i32 %b to i8
314         %d = icmp eq i8 %c, 0
315         ret i1 %d
316 ; CHECK: %d = icmp sgt i32 %a, -1
317 ; CHECK: ret i1 %d
318 }
319
320 ; ret i1 false
321 define i1 @test37(i32 %a) {
322         %b = lshr i32 %a, 31
323         %c = or i32 %b, 512
324         %d = trunc i32 %c to i8
325         %e = icmp eq i8 %d, 11
326         ret i1 %e
327 ; CHECK: ret i1 false
328 }
329
330 define i64 @test38(i32 %a) {
331         %1 = icmp eq i32 %a, -2
332         %2 = zext i1 %1 to i8
333         %3 = xor i8 %2, 1
334         %4 = zext i8 %3 to i64
335         ret i64 %4
336 ; CHECK: %1 = icmp ne i32 %a, -2
337 ; CHECK: %2 = zext i1 %1 to i64
338 ; CHECK: ret i64 %2
339 }
340
341 define i16 @test39(i16 %a) {
342         %tmp = zext i16 %a to i32
343         %tmp21 = lshr i32 %tmp, 8
344         %tmp5 = shl i32 %tmp, 8
345         %tmp.upgrd.32 = or i32 %tmp21, %tmp5
346         %tmp.upgrd.3 = trunc i32 %tmp.upgrd.32 to i16
347         ret i16 %tmp.upgrd.3
348 ; CHECK: @test39
349 ; CHECK: %tmp.upgrd.32 = call i16 @llvm.bswap.i16(i16 %a)
350 ; CHECK: ret i16 %tmp.upgrd.32
351 }
352
353 define i16 @test40(i16 %a) {
354         %tmp = zext i16 %a to i32
355         %tmp21 = lshr i32 %tmp, 9
356         %tmp5 = shl i32 %tmp, 8
357         %tmp.upgrd.32 = or i32 %tmp21, %tmp5
358         %tmp.upgrd.3 = trunc i32 %tmp.upgrd.32 to i16
359         ret i16 %tmp.upgrd.3
360 ; CHECK: @test40
361 ; CHECK: %tmp21 = lshr i16 %a, 9
362 ; CHECK: %tmp5 = shl i16 %a, 8
363 ; CHECK: %tmp.upgrd.32 = or i16 %tmp21, %tmp5
364 ; CHECK: ret i16 %tmp.upgrd.32
365 }
366
367 ; PR1263
368 define i32* @test41(i32* %tmp1) {
369         %tmp64 = bitcast i32* %tmp1 to { i32 }*
370         %tmp65 = getelementptr { i32 }* %tmp64, i32 0, i32 0
371         ret i32* %tmp65
372 ; CHECK: @test41
373 ; CHECK: ret i32* %tmp1
374 }
375
376 define i32 @test42(i32 %X) {
377         %Y = trunc i32 %X to i8         ; <i8> [#uses=1]
378         %Z = zext i8 %Y to i32          ; <i32> [#uses=1]
379         ret i32 %Z
380 ; CHECK: @test42
381 ; CHECK: %Z = and i32 %X, 255
382 }
383
384 ; rdar://6598839
385 define zeroext i64 @test43(i8 zeroext %on_off) nounwind readonly {
386         %A = zext i8 %on_off to i32
387         %B = add i32 %A, -1
388         %C = sext i32 %B to i64
389         ret i64 %C  ;; Should be (add (zext i8 -> i64), -1)
390 ; CHECK: @test43
391 ; CHECK-NEXT: %A = zext i8 %on_off to i64
392 ; CHECK-NEXT: %B = add i64 %A, -1
393 ; CHECK-NEXT: ret i64 %B
394 }