R600/SI: Change how DS offsets are printed
[oota-llvm.git] / test / CodeGen / R600 / unaligned-load-store.ll
1 ; RUN: llc -march=r600 -mcpu=SI -verify-machineinstrs< %s | FileCheck -check-prefix=SI %s
2
3 ; FIXME: This is probably wrong. This probably needs to expand to 8-bit reads and writes.
4 ; SI-LABEL: {{^}}unaligned_load_store_i32:
5 ; SI: DS_READ_U16
6 ; SI: DS_READ_U16
7 ; SI: DS_WRITE_B32
8 ; SI: S_ENDPGM
9 define void @unaligned_load_store_i32(i32 addrspace(3)* %p, i32 addrspace(3)* %r) nounwind {
10   %v = load i32 addrspace(3)* %p, align 1
11   store i32 %v, i32 addrspace(3)* %r, align 1
12   ret void
13 }
14
15 ; SI-LABEL: {{^}}unaligned_load_store_v4i32:
16 ; SI: DS_READ_U16
17 ; SI: DS_READ_U16
18 ; SI: DS_READ_U16
19 ; SI: DS_READ_U16
20 ; SI: DS_READ_U16
21 ; SI: DS_READ_U16
22 ; SI: DS_READ_U16
23 ; SI: DS_READ_U16
24 ; SI: DS_WRITE_B32
25 ; SI: DS_WRITE_B32
26 ; SI: DS_WRITE_B32
27 ; SI: DS_WRITE_B32
28 ; SI: S_ENDPGM
29 define void @unaligned_load_store_v4i32(<4 x i32> addrspace(3)* %p, <4 x i32> addrspace(3)* %r) nounwind {
30   %v = load <4 x i32> addrspace(3)* %p, align 1
31   store <4 x i32> %v, <4 x i32> addrspace(3)* %r, align 1
32   ret void
33 }
34
35 ; SI-LABEL: {{^}}load_lds_i64_align_4:
36 ; SI: DS_READ2_B32
37 ; SI: S_ENDPGM
38 define void @load_lds_i64_align_4(i64 addrspace(1)* nocapture %out, i64 addrspace(3)* %in) #0 {
39   %val = load i64 addrspace(3)* %in, align 4
40   store i64 %val, i64 addrspace(1)* %out, align 8
41   ret void
42 }
43
44 ; SI-LABEL: {{^}}load_lds_i64_align_4_with_offset
45 ; SI: DS_READ2_B32 v[{{[0-9]+}}:{{[0-9]+}}], v{{[0-9]}} offset0:8 offset1:9
46 ; SI: S_ENDPGM
47 define void @load_lds_i64_align_4_with_offset(i64 addrspace(1)* nocapture %out, i64 addrspace(3)* %in) #0 {
48   %ptr = getelementptr i64 addrspace(3)* %in, i32 4
49   %val = load i64 addrspace(3)* %ptr, align 4
50   store i64 %val, i64 addrspace(1)* %out, align 8
51   ret void
52 }
53
54 ; SI-LABEL: {{^}}load_lds_i64_align_4_with_split_offset:
55 ; The tests for the case where the lo offset is 8-bits, but the hi offset is 9-bits
56 ; SI: DS_READ2_B32 v[{{[0-9]+}}:{{[0-9]+}}], v{{[0-9]}} offset0:0 offset1:1
57 ; SI: S_ENDPGM
58 define void @load_lds_i64_align_4_with_split_offset(i64 addrspace(1)* nocapture %out, i64 addrspace(3)* %in) #0 {
59   %ptr = bitcast i64 addrspace(3)* %in to i32 addrspace(3)*
60   %ptr255 = getelementptr i32 addrspace(3)* %ptr, i32 255
61   %ptri64 = bitcast i32 addrspace(3)* %ptr255 to i64 addrspace(3)*
62   %val = load i64 addrspace(3)* %ptri64, align 4
63   store i64 %val, i64 addrspace(1)* %out, align 8
64   ret void
65 }
66
67 ; FIXME: Need to fix this case.
68 ; define void @load_lds_i64_align_1(i64 addrspace(1)* nocapture %out, i64 addrspace(3)* %in) #0 {
69 ;   %val = load i64 addrspace(3)* %in, align 1
70 ;   store i64 %val, i64 addrspace(1)* %out, align 8
71 ;   ret void
72 ; }
73
74 ; SI-LABEL: {{^}}store_lds_i64_align_4:
75 ; SI: DS_WRITE2_B32
76 ; SI: S_ENDPGM
77 define void @store_lds_i64_align_4(i64 addrspace(3)* %out, i64 %val) #0 {
78   store i64 %val, i64 addrspace(3)* %out, align 4
79   ret void
80 }
81
82 ; SI-LABEL: {{^}}store_lds_i64_align_4_with_offset
83 ; SI: DS_WRITE2_B32 v{{[0-9]+}}, v{{[0-9]+}}, v{{[0-9]+}} offset0:8 offset1:9
84 ; SI: S_ENDPGM
85 define void @store_lds_i64_align_4_with_offset(i64 addrspace(3)* %out) #0 {
86   %ptr = getelementptr i64 addrspace(3)* %out, i32 4
87   store i64 0, i64 addrspace(3)* %ptr, align 4
88   ret void
89 }
90
91 ; SI-LABEL: {{^}}store_lds_i64_align_4_with_split_offset:
92 ; The tests for the case where the lo offset is 8-bits, but the hi offset is 9-bits
93 ; SI: DS_WRITE2_B32 v{{[0-9]+}}, v{{[0-9]+}}, v{{[0-9]+}} offset0:0 offset1:1
94 ; SI: S_ENDPGM
95 define void @store_lds_i64_align_4_with_split_offset(i64 addrspace(3)* %out) #0 {
96   %ptr = bitcast i64 addrspace(3)* %out to i32 addrspace(3)*
97   %ptr255 = getelementptr i32 addrspace(3)* %ptr, i32 255
98   %ptri64 = bitcast i32 addrspace(3)* %ptr255 to i64 addrspace(3)*
99   store i64 0, i64 addrspace(3)* %out, align 4
100   ret void
101 }