ARM: fix yet another stack-folding bug
[oota-llvm.git] / test / CodeGen / ARM / fold-stack-adjust.ll
1 ; RUN: llc -mtriple=thumbv7-apple-darwin-eabi < %s | FileCheck %s
2 ; RUN: llc -mtriple=thumbv6m-apple-darwin-eabi -disable-fp-elim < %s | FileCheck %s --check-prefix=CHECK-T1
3 ; RUN: llc -mtriple=thumbv7-apple-darwin-ios -disable-fp-elim < %s | FileCheck %s --check-prefix=CHECK-IOS
4
5
6 declare void @bar(i8*)
7
8 %bigVec = type [2 x double]
9
10 @var = global %bigVec zeroinitializer
11
12 define void @check_simple() minsize {
13 ; CHECK-LABEL: check_simple:
14 ; CHECK: push.w {r7, r8, r9, r10, r11, lr}
15 ; CHECK-NOT: sub sp, sp,
16 ; ...
17 ; CHECK-NOT: add sp, sp,
18 ; CHECK: pop.w {r0, r1, r2, r3, r11, pc}
19
20 ; CHECK-T1-LABEL: check_simple:
21 ; CHECK-T1: push {r3, r4, r5, r6, r7, lr}
22 ; CHECK-T1: add r7, sp, #16
23 ; CHECK-T1-NOT: sub sp, sp,
24 ; ...
25 ; CHECK-T1-NOT: add sp, sp,
26 ; CHECK-T1: pop {r0, r1, r2, r3, r7, pc}
27
28   ; iOS always has a frame pointer and messing with the push affects
29   ; how it's set in the prologue. Make sure we get that right.
30 ; CHECK-IOS-LABEL: check_simple:
31 ; CHECK-IOS: push {r3, r4, r5, r6, r7, lr}
32 ; CHECK-NOT: sub sp,
33 ; CHECK-IOS: add r7, sp, #16
34 ; CHECK-NOT: sub sp,
35 ; ...
36 ; CHECK-NOT: add sp,
37 ; CHEC: pop {r3, r4, r5, r6, r7, pc}
38
39   %var = alloca i8, i32 16
40   call void @bar(i8* %var)
41   ret void
42 }
43
44 define void @check_simple_too_big() minsize {
45 ; CHECK-LABEL: check_simple_too_big:
46 ; CHECK: push.w {r11, lr}
47 ; CHECK: sub sp,
48 ; ...
49 ; CHECK: add sp,
50 ; CHECK: pop.w {r11, pc}
51   %var = alloca i8, i32 64
52   call void @bar(i8* %var)
53   ret void
54 }
55
56 define void @check_vfp_fold() minsize {
57 ; CHECK-LABEL: check_vfp_fold:
58 ; CHECK: push {r[[GLOBREG:[0-9]+]], lr}
59 ; CHECK: vpush {d6, d7, d8, d9}
60 ; CHECK-NOT: sub sp,
61 ; ...
62 ; CHECK: vldmia r[[GLOBREG]], {d8, d9}
63 ; ...
64 ; CHECK-NOT: add sp,
65 ; CHECK: vpop {d6, d7, d8, d9}
66 ; CHECKL pop {r[[GLOBREG]], pc}
67
68   ; iOS uses aligned NEON stores here, which is convenient since we
69   ; want to make sure that works too.
70 ; CHECK-IOS-LABEL: check_vfp_fold:
71 ; CHECK-IOS: push {r0, r1, r2, r3, r4, r7, lr}
72 ; CHECK-IOS: sub.w r4, sp, #16
73 ; CHECK-IOS: bic r4, r4, #15
74 ; CHECK-IOS: mov sp, r4
75 ; CHECK-IOS: vst1.64 {d8, d9}, [r4:128]
76 ; ...
77 ; CHECK-IOS: add r4, sp, #16
78 ; CHECK-IOS: vld1.64 {d8, d9}, [r4:128]
79 ; CHECK-IOS: mov sp, r4
80 ; CHECK-IOS: pop {r4, r7, pc}
81
82   %var = alloca i8, i32 16
83
84   %tmp = load %bigVec* @var
85   call void @bar(i8* %var)
86   store %bigVec %tmp, %bigVec* @var
87
88   ret void
89 }
90
91 ; This function should use just enough space that the "add sp, sp, ..." could be
92 ; folded in except that doing so would clobber the value being returned.
93 define i64 @check_no_return_clobber() minsize {
94 ; CHECK-LABEL: check_no_return_clobber:
95 ; CHECK: push.w {r1, r2, r3, r4, r5, r6, r7, r8, r9, r10, r11, lr}
96 ; CHECK-NOT: sub sp,
97 ; ...
98 ; CHECK: add sp, #40
99 ; CHECK: pop.w {r11, pc}
100
101   ; Just to keep iOS FileCheck within previous function:
102 ; CHECK-IOS-LABEL: check_no_return_clobber:
103
104   %var = alloca i8, i32 40
105   call void @bar(i8* %var)
106   ret i64 0
107 }
108
109 define arm_aapcs_vfpcc double @check_vfp_no_return_clobber() minsize {
110 ; CHECK-LABEL: check_vfp_no_return_clobber:
111 ; CHECK: push {r[[GLOBREG:[0-9]+]], lr}
112 ; CHECK: vpush {d0, d1, d2, d3, d4, d5, d6, d7, d8, d9}
113 ; CHECK-NOT: sub sp,
114 ; ...
115 ; CHECK: add sp, #64
116 ; CHECK: vpop {d8, d9}
117 ; CHECK: pop {r[[GLOBREG]], pc}
118
119   %var = alloca i8, i32 64
120
121   %tmp = load %bigVec* @var
122   call void @bar(i8* %var)
123   store %bigVec %tmp, %bigVec* @var
124
125   ret double 1.0
126 }
127
128 @dbl = global double 0.0
129
130 ; PR18136: there was a bug determining where the first eligible pop in a
131 ; basic-block was when the entire block was epilogue code.
132 define void @test_fold_point(i1 %tst) minsize {
133 ; CHECK-LABEL: test_fold_point:
134
135   ; Important to check for beginning of basic block, because if it gets
136   ; if-converted the test is probably no longer checking what it should.
137 ; CHECK: {{LBB[0-9]+_2}}:
138 ; CHECK-NEXT: vpop {d7, d8}
139 ; CHECK-NEXT: pop {r4, pc}
140   ; We want some memory so there's a stack adjustment to fold...
141   %var = alloca i8, i32 8
142
143   ; We want a long-lived floating register so that a callee-saved dN is used and
144   ; there's both a vpop and a pop.
145   %live_val = load double* @dbl
146   br i1 %tst, label %true, label %end
147 true:
148   call void @bar(i8* %var)
149   store double %live_val, double* @dbl
150   br label %end
151 end:
152   ; We want the epilogue to be the only thing in a basic block so that we hit
153   ; the correct edge-case (first inst in block is correct one to adjust).
154   ret void
155 }