Make MergeConsecutiveStores look at other stores on same chain
[oota-llvm.git] / test / CodeGen / SystemZ / frame-08.ll
1 ; Test the saving and restoring of GPRs in large frames.
2 ;
3 ; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
4
5 ; This is the largest frame size that can use a plain LMG for %r6 and above.
6 ; It is big enough to require two emergency spill slots at 160(%r15),
7 ; so get a frame of size 524232 by allocating (524232 - 176) / 8 = 65507
8 ; extra doublewords.
9 define void @f1(i32 *%ptr, i64 %x) {
10 ; CHECK-LABEL: f1:
11 ; CHECK: stmg %r6, %r15, 48(%r15)
12 ; CHECK: .cfi_offset %r6, -112
13 ; CHECK: .cfi_offset %r7, -104
14 ; CHECK: .cfi_offset %r8, -96
15 ; CHECK: .cfi_offset %r9, -88
16 ; CHECK: .cfi_offset %r10, -80
17 ; CHECK: .cfi_offset %r11, -72
18 ; CHECK: .cfi_offset %r12, -64
19 ; CHECK: .cfi_offset %r13, -56
20 ; CHECK: .cfi_offset %r14, -48
21 ; CHECK: .cfi_offset %r15, -40
22 ; CHECK: agfi %r15, -524232
23 ; CHECK: .cfi_def_cfa_offset 524392
24 ; ...main function body...
25 ; CHECK-NOT: ag
26 ; CHECK: lmg %r6, %r15, 524280(%r15)
27 ; CHECK: br %r14
28   %l0 = load volatile i32 , i32 *%ptr
29   %l1 = load volatile i32 , i32 *%ptr
30   %l4 = load volatile i32 , i32 *%ptr
31   %l5 = load volatile i32 , i32 *%ptr
32   %l6 = load volatile i32 , i32 *%ptr
33   %l7 = load volatile i32 , i32 *%ptr
34   %l8 = load volatile i32 , i32 *%ptr
35   %l9 = load volatile i32 , i32 *%ptr
36   %l10 = load volatile i32 , i32 *%ptr
37   %l11 = load volatile i32 , i32 *%ptr
38   %l12 = load volatile i32 , i32 *%ptr
39   %l13 = load volatile i32 , i32 *%ptr
40   %l14 = load volatile i32 , i32 *%ptr
41   %add0 = add i32 %l0, %l0
42   %add1 = add i32 %l1, %add0
43   %add4 = add i32 %l4, %add1
44   %add5 = add i32 %l5, %add4
45   %add6 = add i32 %l6, %add5
46   %add7 = add i32 %l7, %add6
47   %add8 = add i32 %l8, %add7
48   %add9 = add i32 %l9, %add8
49   %add10 = add i32 %l10, %add9
50   %add11 = add i32 %l11, %add10
51   %add12 = add i32 %l12, %add11
52   %add13 = add i32 %l13, %add12
53   %add14 = add i32 %l14, %add13
54   store volatile i32 %add0, i32 *%ptr
55   store volatile i32 %add1, i32 *%ptr
56   store volatile i32 %add4, i32 *%ptr
57   store volatile i32 %add5, i32 *%ptr
58   store volatile i32 %add6, i32 *%ptr
59   store volatile i32 %add7, i32 *%ptr
60   store volatile i32 %add8, i32 *%ptr
61   store volatile i32 %add9, i32 *%ptr
62   store volatile i32 %add10, i32 *%ptr
63   store volatile i32 %add11, i32 *%ptr
64   store volatile i32 %add12, i32 *%ptr
65   store volatile i32 %add13, i32 *%ptr
66   store volatile i32 %add14, i32 *%ptr
67   %y = alloca [65507 x i64], align 8
68   %entry = getelementptr inbounds [65507 x i64], [65507 x i64]* %y, i64 0, i64 0
69   store volatile i64 %x, i64* %entry
70   ret void
71 }
72
73 ; This is the largest frame size that can use a plain LMG for %r14 and above
74 ; It is big enough to require two emergency spill slots at 160(%r15),
75 ; so get a frame of size 524168 by allocating (524168 - 176) / 8 = 65499
76 ; extra doublewords.
77 define void @f2(i32 *%ptr, i64 %x) {
78 ; CHECK-LABEL: f2:
79 ; CHECK: stmg %r14, %r15, 112(%r15)
80 ; CHECK: .cfi_offset %r14, -48
81 ; CHECK: .cfi_offset %r15, -40
82 ; CHECK: agfi %r15, -524168
83 ; CHECK: .cfi_def_cfa_offset 524328
84 ; ...main function body...
85 ; CHECK-NOT: ag
86 ; CHECK: lmg %r14, %r15, 524280(%r15)
87 ; CHECK: br %r14
88   %l0 = load volatile i32 , i32 *%ptr
89   %l1 = load volatile i32 , i32 *%ptr
90   %l4 = load volatile i32 , i32 *%ptr
91   %l5 = load volatile i32 , i32 *%ptr
92   %l14 = load volatile i32 , i32 *%ptr
93   %add0 = add i32 %l0, %l0
94   %add1 = add i32 %l1, %add0
95   %add4 = add i32 %l4, %add1
96   %add5 = add i32 %l5, %add4
97   %add14 = add i32 %l14, %add5
98   store volatile i32 %add0, i32 *%ptr
99   store volatile i32 %add1, i32 *%ptr
100   store volatile i32 %add4, i32 *%ptr
101   store volatile i32 %add5, i32 *%ptr
102   store volatile i32 %add14, i32 *%ptr
103   %y = alloca [65499 x i64], align 8
104   %entry = getelementptr inbounds [65499 x i64], [65499 x i64]* %y, i64 0, i64 0
105   store volatile i64 %x, i64* %entry
106   ret void
107 }
108
109 ; Like f1 but with a frame that is 8 bytes bigger.  This is the smallest
110 ; frame size that needs two instructions to perform the final LMG for
111 ; %r6 and above.
112 define void @f3(i32 *%ptr, i64 %x) {
113 ; CHECK-LABEL: f3:
114 ; CHECK: stmg %r6, %r15, 48(%r15)
115 ; CHECK: .cfi_offset %r6, -112
116 ; CHECK: .cfi_offset %r7, -104
117 ; CHECK: .cfi_offset %r8, -96
118 ; CHECK: .cfi_offset %r9, -88
119 ; CHECK: .cfi_offset %r10, -80
120 ; CHECK: .cfi_offset %r11, -72
121 ; CHECK: .cfi_offset %r12, -64
122 ; CHECK: .cfi_offset %r13, -56
123 ; CHECK: .cfi_offset %r14, -48
124 ; CHECK: .cfi_offset %r15, -40
125 ; CHECK: agfi %r15, -524240
126 ; CHECK: .cfi_def_cfa_offset 524400
127 ; ...main function body...
128 ; CHECK: aghi %r15, 8
129 ; CHECK: lmg %r6, %r15, 524280(%r15)
130 ; CHECK: br %r14
131   %l0 = load volatile i32 , i32 *%ptr
132   %l1 = load volatile i32 , i32 *%ptr
133   %l4 = load volatile i32 , i32 *%ptr
134   %l5 = load volatile i32 , i32 *%ptr
135   %l6 = load volatile i32 , i32 *%ptr
136   %l7 = load volatile i32 , i32 *%ptr
137   %l8 = load volatile i32 , i32 *%ptr
138   %l9 = load volatile i32 , i32 *%ptr
139   %l10 = load volatile i32 , i32 *%ptr
140   %l11 = load volatile i32 , i32 *%ptr
141   %l12 = load volatile i32 , i32 *%ptr
142   %l13 = load volatile i32 , i32 *%ptr
143   %l14 = load volatile i32 , i32 *%ptr
144   %add0 = add i32 %l0, %l0
145   %add1 = add i32 %l1, %add0
146   %add4 = add i32 %l4, %add1
147   %add5 = add i32 %l5, %add4
148   %add6 = add i32 %l6, %add5
149   %add7 = add i32 %l7, %add6
150   %add8 = add i32 %l8, %add7
151   %add9 = add i32 %l9, %add8
152   %add10 = add i32 %l10, %add9
153   %add11 = add i32 %l11, %add10
154   %add12 = add i32 %l12, %add11
155   %add13 = add i32 %l13, %add12
156   %add14 = add i32 %l14, %add13
157   store volatile i32 %add0, i32 *%ptr
158   store volatile i32 %add1, i32 *%ptr
159   store volatile i32 %add4, i32 *%ptr
160   store volatile i32 %add5, i32 *%ptr
161   store volatile i32 %add6, i32 *%ptr
162   store volatile i32 %add7, i32 *%ptr
163   store volatile i32 %add8, i32 *%ptr
164   store volatile i32 %add9, i32 *%ptr
165   store volatile i32 %add10, i32 *%ptr
166   store volatile i32 %add11, i32 *%ptr
167   store volatile i32 %add12, i32 *%ptr
168   store volatile i32 %add13, i32 *%ptr
169   store volatile i32 %add14, i32 *%ptr
170   %y = alloca [65508 x i64], align 8
171   %entry = getelementptr inbounds [65508 x i64], [65508 x i64]* %y, i64 0, i64 0
172   store volatile i64 %x, i64* %entry
173   ret void
174 }
175
176 ; Like f2 but with a frame that is 8 bytes bigger.  This is the smallest
177 ; frame size that needs two instructions to perform the final LMG for
178 ; %r14 and %r15.
179 define void @f4(i32 *%ptr, i64 %x) {
180 ; CHECK-LABEL: f4:
181 ; CHECK: stmg %r14, %r15, 112(%r15)
182 ; CHECK: .cfi_offset %r14, -48
183 ; CHECK: .cfi_offset %r15, -40
184 ; CHECK: agfi %r15, -524176
185 ; CHECK: .cfi_def_cfa_offset 524336
186 ; ...main function body...
187 ; CHECK: aghi %r15, 8
188 ; CHECK: lmg %r14, %r15, 524280(%r15)
189 ; CHECK: br %r14
190   %l0 = load volatile i32 , i32 *%ptr
191   %l1 = load volatile i32 , i32 *%ptr
192   %l4 = load volatile i32 , i32 *%ptr
193   %l5 = load volatile i32 , i32 *%ptr
194   %l14 = load volatile i32 , i32 *%ptr
195   %add0 = add i32 %l0, %l0
196   %add1 = add i32 %l1, %add0
197   %add4 = add i32 %l4, %add1
198   %add5 = add i32 %l5, %add4
199   %add14 = add i32 %l14, %add5
200   store volatile i32 %add0, i32 *%ptr
201   store volatile i32 %add1, i32 *%ptr
202   store volatile i32 %add4, i32 *%ptr
203   store volatile i32 %add5, i32 *%ptr
204   store volatile i32 %add14, i32 *%ptr
205   %y = alloca [65500 x i64], align 8
206   %entry = getelementptr inbounds [65500 x i64], [65500 x i64]* %y, i64 0, i64 0
207   store volatile i64 %x, i64* %entry
208   ret void
209 }
210
211 ; This is the largest frame size for which the preparatory increment for
212 ; "lmg %r14, %r15, ..." can be done using AGHI.
213 define void @f5(i32 *%ptr, i64 %x) {
214 ; CHECK-LABEL: f5:
215 ; CHECK: stmg %r14, %r15, 112(%r15)
216 ; CHECK: .cfi_offset %r14, -48
217 ; CHECK: .cfi_offset %r15, -40
218 ; CHECK: agfi %r15, -556928
219 ; CHECK: .cfi_def_cfa_offset 557088
220 ; ...main function body...
221 ; CHECK: aghi %r15, 32760
222 ; CHECK: lmg %r14, %r15, 524280(%r15)
223 ; CHECK: br %r14
224   %l0 = load volatile i32 , i32 *%ptr
225   %l1 = load volatile i32 , i32 *%ptr
226   %l4 = load volatile i32 , i32 *%ptr
227   %l5 = load volatile i32 , i32 *%ptr
228   %l14 = load volatile i32 , i32 *%ptr
229   %add0 = add i32 %l0, %l0
230   %add1 = add i32 %l1, %add0
231   %add4 = add i32 %l4, %add1
232   %add5 = add i32 %l5, %add4
233   %add14 = add i32 %l14, %add5
234   store volatile i32 %add0, i32 *%ptr
235   store volatile i32 %add1, i32 *%ptr
236   store volatile i32 %add4, i32 *%ptr
237   store volatile i32 %add5, i32 *%ptr
238   store volatile i32 %add14, i32 *%ptr
239   %y = alloca [69594 x i64], align 8
240   %entry = getelementptr inbounds [69594 x i64], [69594 x i64]* %y, i64 0, i64 0
241   store volatile i64 %x, i64* %entry
242   ret void
243 }
244
245 ; This is the smallest frame size for which the preparatory increment for
246 ; "lmg %r14, %r15, ..." needs to be done using AGFI.
247 define void @f6(i32 *%ptr, i64 %x) {
248 ; CHECK-LABEL: f6:
249 ; CHECK: stmg %r14, %r15, 112(%r15)
250 ; CHECK: .cfi_offset %r14, -48
251 ; CHECK: .cfi_offset %r15, -40
252 ; CHECK: agfi %r15, -556936
253 ; CHECK: .cfi_def_cfa_offset 557096
254 ; ...main function body...
255 ; CHECK: agfi %r15, 32768
256 ; CHECK: lmg %r14, %r15, 524280(%r15)
257 ; CHECK: br %r14
258   %l0 = load volatile i32 , i32 *%ptr
259   %l1 = load volatile i32 , i32 *%ptr
260   %l4 = load volatile i32 , i32 *%ptr
261   %l5 = load volatile i32 , i32 *%ptr
262   %l14 = load volatile i32 , i32 *%ptr
263   %add0 = add i32 %l0, %l0
264   %add1 = add i32 %l1, %add0
265   %add4 = add i32 %l4, %add1
266   %add5 = add i32 %l5, %add4
267   %add14 = add i32 %l14, %add5
268   store volatile i32 %add0, i32 *%ptr
269   store volatile i32 %add1, i32 *%ptr
270   store volatile i32 %add4, i32 *%ptr
271   store volatile i32 %add5, i32 *%ptr
272   store volatile i32 %add14, i32 *%ptr
273   %y = alloca [69595 x i64], align 8
274   %entry = getelementptr inbounds [69595 x i64], [69595 x i64]* %y, i64 0, i64 0
275   store volatile i64 %x, i64* %entry
276   ret void
277 }