1 ; Test 32-bit rotates left.
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
5 ; Check the low end of the RLL range.
6 define i32 @f1(i32 %a) {
8 ; CHECK: rll %r2, %r2, 1
10 %parta = shl i32 %a, 1
11 %partb = lshr i32 %a, 31
12 %or = or i32 %parta, %partb
16 ; Check the high end of the defined RLL range.
17 define i32 @f2(i32 %a) {
19 ; CHECK: rll %r2, %r2, 31
21 %parta = shl i32 %a, 31
22 %partb = lshr i32 %a, 1
23 %or = or i32 %parta, %partb
27 ; We don't generate shifts by out-of-range values.
28 define i32 @f3(i32 %a) {
32 %parta = shl i32 %a, 32
33 %partb = lshr i32 %a, 0
34 %or = or i32 %parta, %partb
38 ; Check variable shifts.
39 define i32 @f4(i32 %a, i32 %amt) {
41 ; CHECK: rll %r2, %r2, 0(%r3)
43 %amtb = sub i32 32, %amt
44 %parta = shl i32 %a, %amt
45 %partb = lshr i32 %a, %amtb
46 %or = or i32 %parta, %partb
50 ; Check shift amounts that have a constant term.
51 define i32 @f5(i32 %a, i32 %amt) {
53 ; CHECK: rll %r2, %r2, 10(%r3)
55 %add = add i32 %amt, 10
56 %sub = sub i32 32, %add
57 %parta = shl i32 %a, %add
58 %partb = lshr i32 %a, %sub
59 %or = or i32 %parta, %partb
63 ; ...and again with a truncated 64-bit shift amount.
64 define i32 @f6(i32 %a, i64 %amt) {
66 ; CHECK: rll %r2, %r2, 10(%r3)
68 %add = add i64 %amt, 10
69 %addtrunc = trunc i64 %add to i32
70 %sub = sub i32 32, %addtrunc
71 %parta = shl i32 %a, %addtrunc
72 %partb = lshr i32 %a, %sub
73 %or = or i32 %parta, %partb
77 ; ...and again with a different truncation representation.
78 define i32 @f7(i32 %a, i64 %amt) {
80 ; CHECK: rll %r2, %r2, 10(%r3)
82 %add = add i64 %amt, 10
83 %sub = sub i64 32, %add
84 %addtrunc = trunc i64 %add to i32
85 %subtrunc = trunc i64 %sub to i32
86 %parta = shl i32 %a, %addtrunc
87 %partb = lshr i32 %a, %subtrunc
88 %or = or i32 %parta, %partb
92 ; Check shift amounts that have the largest in-range constant term. We could
93 ; mask the amount instead.
94 define i32 @f8(i32 %a, i32 %amt) {
96 ; CHECK: rll %r2, %r2, 524287(%r3)
98 %add = add i32 %amt, 524287
99 %sub = sub i32 32, %add
100 %parta = shl i32 %a, %add
101 %partb = lshr i32 %a, %sub
102 %or = or i32 %parta, %partb
106 ; Check the next value up, which without masking must use a separate
108 define i32 @f9(i32 %a, i32 %amt) {
110 ; CHECK: afi %r3, 524288
111 ; CHECK: rll %r2, %r2, 0(%r3)
113 %add = add i32 %amt, 524288
114 %sub = sub i32 32, %add
115 %parta = shl i32 %a, %add
116 %partb = lshr i32 %a, %sub
117 %or = or i32 %parta, %partb
121 ; Check cases where 1 is subtracted from the shift amount.
122 define i32 @f10(i32 %a, i32 %amt) {
124 ; CHECK: rll %r2, %r2, -1(%r3)
126 %suba = sub i32 %amt, 1
127 %subb = sub i32 32, %suba
128 %parta = shl i32 %a, %suba
129 %partb = lshr i32 %a, %subb
130 %or = or i32 %parta, %partb
134 ; Check the lowest value that can be subtracted from the shift amount.
135 ; Again, we could mask the shift amount instead.
136 define i32 @f11(i32 %a, i32 %amt) {
138 ; CHECK: rll %r2, %r2, -524288(%r3)
140 %suba = sub i32 %amt, 524288
141 %subb = sub i32 32, %suba
142 %parta = shl i32 %a, %suba
143 %partb = lshr i32 %a, %subb
144 %or = or i32 %parta, %partb
148 ; Check the next value down, which without masking must use a separate
150 define i32 @f12(i32 %a, i32 %amt) {
152 ; CHECK: afi %r3, -524289
153 ; CHECK: rll %r2, %r2, 0(%r3)
155 %suba = sub i32 %amt, 524289
156 %subb = sub i32 32, %suba
157 %parta = shl i32 %a, %suba
158 %partb = lshr i32 %a, %subb
159 %or = or i32 %parta, %partb
163 ; Check that we don't try to generate "indexed" shifts.
164 define i32 @f13(i32 %a, i32 %b, i32 %c) {
166 ; CHECK: ar {{%r3, %r4|%r4, %r3}}
167 ; CHECK: rll %r2, %r2, 0({{%r[34]}})
169 %add = add i32 %b, %c
170 %sub = sub i32 32, %add
171 %parta = shl i32 %a, %add
172 %partb = lshr i32 %a, %sub
173 %or = or i32 %parta, %partb
177 ; Check that the shift amount uses an address register. It cannot be in %r0.
178 define i32 @f14(i32 %a, i32 *%ptr) {
180 ; CHECK: l %r1, 0(%r3)
181 ; CHECK: rll %r2, %r2, 0(%r1)
183 %amt = load i32 *%ptr
184 %amtb = sub i32 32, %amt
185 %parta = shl i32 %a, %amt
186 %partb = lshr i32 %a, %amtb
187 %or = or i32 %parta, %partb
191 ; Check another form of f5, which is the one produced by running f5 through
193 define i32 @f15(i32 %a, i32 %amt) {
195 ; CHECK: rll %r2, %r2, 10(%r3)
197 %add = add i32 %amt, 10
198 %sub = sub i32 22, %amt
199 %parta = shl i32 %a, %add
200 %partb = lshr i32 %a, %sub
201 %or = or i32 %parta, %partb
206 define i32 @f16(i32 %a, i64 %amt) {
208 ; CHECK: rll %r2, %r2, 10(%r3)
210 %add = add i64 %amt, 10
211 %sub = sub i64 22, %amt
212 %addtrunc = trunc i64 %add to i32
213 %subtrunc = trunc i64 %sub to i32
214 %parta = shl i32 %a, %addtrunc
215 %partb = lshr i32 %a, %subtrunc
216 %or = or i32 %parta, %partb
220 ; Check cases where (-x & 31) is used instead of 32 - x.
221 define i32 @f17(i32 %x, i32 %y) {
223 ; CHECK: rll %r2, %r2, 0(%r3)
226 %shl = shl i32 %x, %y
228 %and = and i32 %sub, 31
229 %shr = lshr i32 %x, %and
230 %or = or i32 %shr, %shl
234 ; ...and again with ((32 - x) & 31).
235 define i32 @f18(i32 %x, i32 %y) {
237 ; CHECK: rll %r2, %r2, 0(%r3)
240 %shl = shl i32 %x, %y
241 %sub = sub i32 32, %y
242 %and = and i32 %sub, 31
243 %shr = lshr i32 %x, %and
244 %or = or i32 %shr, %shl
248 ; This is not a rotation.
249 define i32 @f19(i32 %x, i32 %y) {
254 %shl = shl i32 %x, %y
255 %sub = sub i32 16, %y
256 %and = and i32 %sub, 31
257 %shr = lshr i32 %x, %and
258 %or = or i32 %shr, %shl
262 ; Repeat f17 with an addition on the shift count.
263 define i32 @f20(i32 %x, i32 %y) {
265 ; CHECK: rll %r2, %r2, 199(%r3)
268 %add = add i32 %y, 199
269 %shl = shl i32 %x, %add
270 %sub = sub i32 0, %add
271 %and = and i32 %sub, 31
272 %shr = lshr i32 %x, %and
273 %or = or i32 %shr, %shl
277 ; ...and again with the InstCombine version.
278 define i32 @f21(i32 %x, i32 %y) {
280 ; CHECK: rll %r2, %r2, 199(%r3)
283 %add = add i32 %y, 199
284 %shl = shl i32 %x, %add
285 %sub = sub i32 -199, %y
286 %and = and i32 %sub, 31
287 %shr = lshr i32 %x, %and
288 %or = or i32 %shr, %shl