AMDGPU: Add pass to detect used kernel features
[oota-llvm.git] / test / CodeGen / AMDGPU / gv-const-addrspace.ll
1 ; RUN: llc -march=amdgcn -mcpu=SI -verify-machineinstrs < %s | FileCheck -check-prefix=SI -check-prefix=GCN -check-prefix=FUNC %s
2 ; RUN: llc -march=amdgcn -mcpu=tonga -verify-machineinstrs < %s | FileCheck -check-prefix=VI -check-prefix=GCN -check-prefix=FUNC %s
3 ; RUN: llc -march=r600 -mcpu=redwood < %s | FileCheck -check-prefix=EG -check-prefix=FUNC %s
4
5
6 @b = internal addrspace(2) constant [1 x i16] [ i16 7 ], align 2
7
8 @float_gv = internal unnamed_addr addrspace(2) constant [5 x float] [float 0.0, float 1.0, float 2.0, float 3.0, float 4.0], align 4
9
10 ; FUNC-LABEL: {{^}}float:
11 ; GCN: s_load_dword
12
13 ; EG-DAG: MOV {{\** *}}T2.X
14 ; EG-DAG: MOV {{\** *}}T3.X
15 ; EG-DAG: MOV {{\** *}}T4.X
16 ; EG-DAG: MOV {{\** *}}T5.X
17 ; EG-DAG: MOV {{\** *}}T6.X
18 ; EG: MOVA_INT
19
20 define void @float(float addrspace(1)* %out, i32 %index) {
21 entry:
22   %0 = getelementptr inbounds [5 x float], [5 x float] addrspace(2)* @float_gv, i32 0, i32 %index
23   %1 = load float, float addrspace(2)* %0
24   store float %1, float addrspace(1)* %out
25   ret void
26 }
27
28 @i32_gv = internal unnamed_addr addrspace(2) constant [5 x i32] [i32 0, i32 1, i32 2, i32 3, i32 4], align 4
29
30 ; FUNC-LABEL: {{^}}i32:
31
32 ; GCN: s_load_dword
33
34 ; EG-DAG: MOV {{\** *}}T2.X
35 ; EG-DAG: MOV {{\** *}}T3.X
36 ; EG-DAG: MOV {{\** *}}T4.X
37 ; EG-DAG: MOV {{\** *}}T5.X
38 ; EG-DAG: MOV {{\** *}}T6.X
39 ; EG: MOVA_INT
40
41 define void @i32(i32 addrspace(1)* %out, i32 %index) {
42 entry:
43   %0 = getelementptr inbounds [5 x i32], [5 x i32] addrspace(2)* @i32_gv, i32 0, i32 %index
44   %1 = load i32, i32 addrspace(2)* %0
45   store i32 %1, i32 addrspace(1)* %out
46   ret void
47 }
48
49
50 %struct.foo = type { float, [5 x i32] }
51
52 @struct_foo_gv = internal unnamed_addr addrspace(2) constant [1 x %struct.foo] [ %struct.foo { float 16.0, [5 x i32] [i32 0, i32 1, i32 2, i32 3, i32 4] } ]
53
54 ; FUNC-LABEL: {{^}}struct_foo_gv_load:
55 ; GCN: s_load_dword
56
57 define void @struct_foo_gv_load(i32 addrspace(1)* %out, i32 %index) {
58   %gep = getelementptr inbounds [1 x %struct.foo], [1 x %struct.foo] addrspace(2)* @struct_foo_gv, i32 0, i32 0, i32 1, i32 %index
59   %load = load i32, i32 addrspace(2)* %gep, align 4
60   store i32 %load, i32 addrspace(1)* %out, align 4
61   ret void
62 }
63
64 @array_v1_gv = internal addrspace(2) constant [4 x <1 x i32>] [ <1 x i32> <i32 1>,
65                                                                 <1 x i32> <i32 2>,
66                                                                 <1 x i32> <i32 3>,
67                                                                 <1 x i32> <i32 4> ]
68
69 ; FUNC-LABEL: {{^}}array_v1_gv_load:
70 ; GCN: s_load_dword
71 define void @array_v1_gv_load(<1 x i32> addrspace(1)* %out, i32 %index) {
72   %gep = getelementptr inbounds [4 x <1 x i32>], [4 x <1 x i32>] addrspace(2)* @array_v1_gv, i32 0, i32 %index
73   %load = load <1 x i32>, <1 x i32> addrspace(2)* %gep, align 4
74   store <1 x i32> %load, <1 x i32> addrspace(1)* %out, align 4
75   ret void
76 }
77
78 define void @gv_addressing_in_branch(float addrspace(1)* %out, i32 %index, i32 %a) {
79 entry:
80   %0 = icmp eq i32 0, %a
81   br i1 %0, label %if, label %else
82
83 if:
84   %1 = getelementptr inbounds [5 x float], [5 x float] addrspace(2)* @float_gv, i32 0, i32 %index
85   %2 = load float, float addrspace(2)* %1
86   store float %2, float addrspace(1)* %out
87   br label %endif
88
89 else:
90   store float 1.0, float addrspace(1)* %out
91   br label %endif
92
93 endif:
94   ret void
95 }