[WebAssembly] Use the new offset syntax for memory operands in inline asm.
[oota-llvm.git] / test / CodeGen / Thumb / large-stack.ll
1 ; RUN: llc < %s -mtriple=thumb-apple-ios | FileCheck %s --check-prefix=CHECK --check-prefix=IOS
2 ; RUN: llc < %s -mtriple=thumb-none-eabi | FileCheck %s --check-prefix=CHECK --check-prefix=EABI
3 ; RUN: llc < %s -o %t -filetype=obj -mtriple=thumbv6-apple-ios
4 ; RUN: llvm-objdump -triple=thumbv6-apple-ios -d %t | FileCheck %s --check-prefix=CHECK --check-prefix=IOS
5 ; RUN: llc < %s -o %t -filetype=obj -mtriple=thumbv6-none-eabi
6 ; RUN: llvm-objdump -triple=thumbv6-none-eabi -d %t | FileCheck %s --check-prefix=CHECK --check-prefix=EABI
7
8 ; Largest stack for which a single tADDspi/tSUBspi is enough
9 define void @test1() {
10 ; CHECK-LABEL: test1:
11 ; CHECK: sub sp, #508
12 ; CHECK: add sp, #508
13     %tmp = alloca [ 508 x i8 ] , align 4
14     ret void
15 }
16
17 ; Largest stack for which three tADDspi/tSUBspis are enough
18 define void @test100() {
19 ; CHECK-LABEL: test100:
20 ; CHECK: sub sp, #508
21 ; CHECK: sub sp, #508
22 ; CHECK: sub sp, #508
23 ; EABI: add sp, #508
24 ; EABI: add sp, #508
25 ; EABI: add sp, #508
26 ; IOS: subs r4, r7, #4
27 ; IOS: mov sp, r4
28     %tmp = alloca [ 1524 x i8 ] , align 4
29     ret void
30 }
31
32 ; Smallest stack for which we use a constant pool
33 define void @test2() {
34 ; CHECK-LABEL: test2:
35 ; CHECK: ldr [[TEMP:r[0-7]]],
36 ; CHECK: add sp, [[TEMP]]
37 ; EABI: ldr [[TEMP:r[0-7]]],
38 ; EABI: add sp, [[TEMP]]
39 ; IOS: subs r4, r7, #4
40 ; IOS: mov sp, r4
41     %tmp = alloca [ 1528 x i8 ] , align 4
42     ret void
43 }
44
45 define i32 @test3() {
46 ; CHECK-LABEL: test3:
47 ; CHECK: ldr [[TEMP:r[0-7]]],
48 ; CHECK: add sp, [[TEMP]]
49 ; CHECK: ldr [[TEMP]],
50 ; CHECK: add [[TEMP]], sp
51 ; EABI: ldr [[TEMP:r[0-7]]],
52 ; EABI: add sp, [[TEMP]]
53 ; IOS: subs r4, r7, #4
54 ; IOS: mov sp, r4
55     %retval = alloca i32, align 4
56     %tmp = alloca i32, align 4
57     %a = alloca [805306369 x i8], align 16
58     store i32 0, i32* %tmp
59     %tmp1 = load i32, i32* %tmp
60     ret i32 %tmp1
61 }
62
63 ; Here, the adds get optimized out because they are dead, but the calculation
64 ; of the address of stack_a is dead but not optimized out. When the address
65 ; calculation gets expanded to two instructions, we need to avoid reading a
66 ; dead register.
67 ; No CHECK lines (just test for crashes), as we hope this will be optimised
68 ; better in future.
69 define i32 @test4() {
70 entry:
71   %stack_a = alloca i8, align 1
72   %stack_b = alloca [256 x i32*], align 4
73   %int = ptrtoint i8* %stack_a to i32
74   %add = add i32 %int, 1
75   br label %block2
76
77 block2:
78   %add2 = add i32 %add, 1
79   ret i32 0
80 }