[LoopVectorizer] Refine loop vectorizer's register usage calculator by ignoring speci...
[oota-llvm.git] / test / Transforms / AtomicExpand / ARM / atomic-expansion-v8.ll
1 ; RUN: opt -S -o - -mtriple=armv8-linux-gnueabihf -atomic-expand %s | FileCheck %s
2
3 define i8 @test_atomic_xchg_i8(i8* %ptr, i8 %xchgend) {
4 ; CHECK-LABEL: @test_atomic_xchg_i8
5 ; CHECK-NOT: fence
6 ; CHECK: br label %[[LOOP:.*]]
7 ; CHECK: [[LOOP]]:
8 ; CHECK: [[OLDVAL32:%.*]] = call i32 @llvm.arm.ldrex.p0i8(i8* %ptr)
9 ; CHECK: [[OLDVAL:%.*]] = trunc i32 [[OLDVAL32]] to i8
10 ; CHECK: [[NEWVAL32:%.*]] = zext i8 %xchgend to i32
11 ; CHECK: [[TRYAGAIN:%.*]] = call i32 @llvm.arm.strex.p0i8(i32 [[NEWVAL32]], i8* %ptr)
12 ; CHECK: [[TST:%.*]] = icmp ne i32 [[TRYAGAIN]], 0
13 ; CHECK: br i1 [[TST]], label %[[LOOP]], label %[[END:.*]]
14 ; CHECK: [[END]]:
15 ; CHECK-NOT: fence
16 ; CHECK: ret i8 [[OLDVAL]]
17   %res = atomicrmw xchg i8* %ptr, i8 %xchgend monotonic
18   ret i8 %res
19 }
20
21 define i16 @test_atomic_add_i16(i16* %ptr, i16 %addend) {
22 ; CHECK-LABEL: @test_atomic_add_i16
23 ; CHECK-NOT: fence
24 ; CHECK: br label %[[LOOP:.*]]
25 ; CHECK: [[LOOP]]:
26 ; CHECK: [[OLDVAL32:%.*]] = call i32 @llvm.arm.ldaex.p0i16(i16* %ptr)
27 ; CHECK: [[OLDVAL:%.*]] = trunc i32 [[OLDVAL32]] to i16
28 ; CHECK: [[NEWVAL:%.*]] = add i16 [[OLDVAL]], %addend
29 ; CHECK: [[NEWVAL32:%.*]] = zext i16 [[NEWVAL]] to i32
30 ; CHECK: [[TRYAGAIN:%.*]] = call i32 @llvm.arm.stlex.p0i16(i32 [[NEWVAL32]], i16* %ptr)
31 ; CHECK: [[TST:%.*]] = icmp ne i32 [[TRYAGAIN]], 0
32 ; CHECK: br i1 [[TST]], label %[[LOOP]], label %[[END:.*]]
33 ; CHECK: [[END]]:
34 ; CHECK-NOT: fence
35 ; CHECK: ret i16 [[OLDVAL]]
36   %res = atomicrmw add i16* %ptr, i16 %addend seq_cst
37   ret i16 %res
38 }
39
40 define i32 @test_atomic_sub_i32(i32* %ptr, i32 %subend) {
41 ; CHECK-LABEL: @test_atomic_sub_i32
42 ; CHECK-NOT: fence
43 ; CHECK: br label %[[LOOP:.*]]
44 ; CHECK: [[LOOP]]:
45 ; CHECK: [[OLDVAL:%.*]] = call i32 @llvm.arm.ldaex.p0i32(i32* %ptr)
46 ; CHECK: [[NEWVAL:%.*]] = sub i32 [[OLDVAL]], %subend
47 ; CHECK: [[TRYAGAIN:%.*]] = call i32 @llvm.arm.strex.p0i32(i32 [[NEWVAL]], i32* %ptr)
48 ; CHECK: [[TST:%.*]] = icmp ne i32 [[TRYAGAIN]], 0
49 ; CHECK: br i1 [[TST]], label %[[LOOP]], label %[[END:.*]]
50 ; CHECK: [[END]]:
51 ; CHECK-NOT: fence
52 ; CHECK: ret i32 [[OLDVAL]]
53   %res = atomicrmw sub i32* %ptr, i32 %subend acquire
54   ret i32 %res
55 }
56
57 define i64 @test_atomic_or_i64(i64* %ptr, i64 %orend) {
58 ; CHECK-LABEL: @test_atomic_or_i64
59 ; CHECK-NOT: fence
60 ; CHECK: br label %[[LOOP:.*]]
61 ; CHECK: [[LOOP]]:
62 ; CHECK: [[PTR8:%.*]] = bitcast i64* %ptr to i8*
63 ; CHECK: [[LOHI:%.*]] = call { i32, i32 } @llvm.arm.ldaexd(i8* [[PTR8]])
64 ; CHECK: [[LO:%.*]] = extractvalue { i32, i32 } [[LOHI]], 0
65 ; CHECK: [[HI:%.*]] = extractvalue { i32, i32 } [[LOHI]], 1
66 ; CHECK: [[LO64:%.*]] = zext i32 [[LO]] to i64
67 ; CHECK: [[HI64_TMP:%.*]] = zext i32 [[HI]] to i64
68 ; CHECK: [[HI64:%.*]] = shl i64 [[HI64_TMP]], 32
69 ; CHECK: [[OLDVAL:%.*]] = or i64 [[LO64]], [[HI64]]
70 ; CHECK: [[NEWVAL:%.*]] = or i64 [[OLDVAL]], %orend
71 ; CHECK: [[NEWLO:%.*]] = trunc i64 [[NEWVAL]] to i32
72 ; CHECK: [[NEWHI_TMP:%.*]] = lshr i64 [[NEWVAL]], 32
73 ; CHECK: [[NEWHI:%.*]] = trunc i64 [[NEWHI_TMP]] to i32
74 ; CHECK: [[PTR8:%.*]] = bitcast i64* %ptr to i8*
75 ; CHECK: [[TRYAGAIN:%.*]] = call i32 @llvm.arm.stlexd(i32 [[NEWLO]], i32 [[NEWHI]], i8* [[PTR8]])
76 ; CHECK: [[TST:%.*]] = icmp ne i32 [[TRYAGAIN]], 0
77 ; CHECK: br i1 [[TST]], label %[[LOOP]], label %[[END:.*]]
78 ; CHECK: [[END]]:
79 ; CHECK-NOT: fence
80 ; CHECK: ret i64 [[OLDVAL]]
81   %res = atomicrmw or i64* %ptr, i64 %orend seq_cst
82   ret i64 %res
83 }
84
85 define i8 @test_cmpxchg_i8_seqcst_seqcst(i8* %ptr, i8 %desired, i8 %newval) {
86 ; CHECK-LABEL: @test_cmpxchg_i8_seqcst_seqcst
87 ; CHECK-NOT: fence
88 ; CHECK: br label %[[LOOP:.*]]
89
90 ; CHECK: [[LOOP]]:
91 ; CHECK: [[OLDVAL32:%.*]] = call i32 @llvm.arm.ldaex.p0i8(i8* %ptr)
92 ; CHECK: [[OLDVAL:%.*]] = trunc i32 %1 to i8
93 ; CHECK: [[SHOULD_STORE:%.*]] = icmp eq i8 [[OLDVAL]], %desired
94 ; CHECK: br i1 [[SHOULD_STORE]], label %[[TRY_STORE:.*]], label %[[NO_STORE_BB:.*]]
95
96 ; CHECK: [[TRY_STORE]]:
97 ; CHECK: [[NEWVAL32:%.*]] = zext i8 %newval to i32
98 ; CHECK: [[TRYAGAIN:%.*]] =  call i32 @llvm.arm.stlex.p0i8(i32 [[NEWVAL32]], i8* %ptr)
99 ; CHECK: [[TST:%.*]] = icmp eq i32 [[TRYAGAIN]], 0
100 ; CHECK: br i1 [[TST]], label %[[SUCCESS_BB:.*]], label %[[LOOP]]
101
102 ; CHECK: [[SUCCESS_BB]]:
103 ; CHECK-NOT: fence_cst
104 ; CHECK: br label %[[DONE:.*]]
105
106 ; CHECK: [[NO_STORE_BB]]:
107 ; CHECK-NEXT: call void @llvm.arm.clrex()
108 ; CHECK-NEXT: br label %[[FAILURE_BB:.*]]
109
110 ; CHECK: [[FAILURE_BB]]:
111 ; CHECK-NOT: fence_cst
112 ; CHECK: br label %[[DONE]]
113
114 ; CHECK: [[DONE]]:
115 ; CHECK: [[SUCCESS:%.*]] = phi i1 [ true, %[[SUCCESS_BB]] ], [ false, %[[FAILURE_BB]] ]
116 ; CHECK: ret i8 [[OLDVAL]]
117
118   %pairold = cmpxchg i8* %ptr, i8 %desired, i8 %newval seq_cst seq_cst
119   %old = extractvalue { i8, i1 } %pairold, 0
120   ret i8 %old
121 }
122
123 define i16 @test_cmpxchg_i16_seqcst_monotonic(i16* %ptr, i16 %desired, i16 %newval) {
124 ; CHECK-LABEL: @test_cmpxchg_i16_seqcst_monotonic
125 ; CHECK-NOT: fence
126 ; CHECK: br label %[[LOOP:.*]]
127
128 ; CHECK: [[LOOP]]:
129 ; CHECK: [[OLDVAL32:%.*]] = call i32 @llvm.arm.ldaex.p0i16(i16* %ptr)
130 ; CHECK: [[OLDVAL:%.*]] = trunc i32 %1 to i16
131 ; CHECK: [[SHOULD_STORE:%.*]] = icmp eq i16 [[OLDVAL]], %desired
132 ; CHECK: br i1 [[SHOULD_STORE]], label %[[TRY_STORE:.*]], label %[[NO_STORE_BB:.*]]
133
134 ; CHECK: [[TRY_STORE]]:
135 ; CHECK: [[NEWVAL32:%.*]] = zext i16 %newval to i32
136 ; CHECK: [[TRYAGAIN:%.*]] =  call i32 @llvm.arm.stlex.p0i16(i32 [[NEWVAL32]], i16* %ptr)
137 ; CHECK: [[TST:%.*]] = icmp eq i32 [[TRYAGAIN]], 0
138 ; CHECK: br i1 [[TST]], label %[[SUCCESS_BB:.*]], label %[[LOOP]]
139
140 ; CHECK: [[SUCCESS_BB]]:
141 ; CHECK-NOT: fence
142 ; CHECK: br label %[[DONE:.*]]
143
144 ; CHECK: [[NO_STORE_BB]]:
145 ; CHECK-NEXT: call void @llvm.arm.clrex()
146 ; CHECK-NEXT: br label %[[FAILURE_BB:.*]]
147
148 ; CHECK: [[FAILURE_BB]]:
149 ; CHECK-NOT: fence
150 ; CHECK: br label %[[DONE]]
151
152 ; CHECK: [[DONE]]:
153 ; CHECK: [[SUCCESS:%.*]] = phi i1 [ true, %[[SUCCESS_BB]] ], [ false, %[[FAILURE_BB]] ]
154 ; CHECK: ret i16 [[OLDVAL]]
155
156   %pairold = cmpxchg i16* %ptr, i16 %desired, i16 %newval seq_cst monotonic
157   %old = extractvalue { i16, i1 } %pairold, 0
158   ret i16 %old
159 }
160
161 define i32 @test_cmpxchg_i32_acquire_acquire(i32* %ptr, i32 %desired, i32 %newval) {
162 ; CHECK-LABEL: @test_cmpxchg_i32_acquire_acquire
163 ; CHECK-NOT: fence
164 ; CHECK: br label %[[LOOP:.*]]
165
166 ; CHECK: [[LOOP]]:
167 ; CHECK: [[OLDVAL:%.*]] = call i32 @llvm.arm.ldaex.p0i32(i32* %ptr)
168 ; CHECK: [[SHOULD_STORE:%.*]] = icmp eq i32 [[OLDVAL]], %desired
169 ; CHECK: br i1 [[SHOULD_STORE]], label %[[TRY_STORE:.*]], label %[[NO_STORE_BB:.*]]
170
171 ; CHECK: [[TRY_STORE]]:
172 ; CHECK: [[TRYAGAIN:%.*]] =  call i32 @llvm.arm.strex.p0i32(i32 %newval, i32* %ptr)
173 ; CHECK: [[TST:%.*]] = icmp eq i32 [[TRYAGAIN]], 0
174 ; CHECK: br i1 [[TST]], label %[[SUCCESS_BB:.*]], label %[[LOOP]]
175
176 ; CHECK: [[SUCCESS_BB]]:
177 ; CHECK-NOT: fence_cst
178 ; CHECK: br label %[[DONE:.*]]
179
180 ; CHECK: [[NO_STORE_BB]]:
181 ; CHECK-NEXT: call void @llvm.arm.clrex()
182 ; CHECK-NEXT: br label %[[FAILURE_BB:.*]]
183
184 ; CHECK: [[FAILURE_BB]]:
185 ; CHECK-NOT: fence_cst
186 ; CHECK: br label %[[DONE]]
187
188 ; CHECK: [[DONE]]:
189 ; CHECK: [[SUCCESS:%.*]] = phi i1 [ true, %[[SUCCESS_BB]] ], [ false, %[[FAILURE_BB]] ]
190 ; CHECK: ret i32 [[OLDVAL]]
191
192   %pairold = cmpxchg i32* %ptr, i32 %desired, i32 %newval acquire acquire
193   %old = extractvalue { i32, i1 } %pairold, 0
194   ret i32 %old
195 }
196
197 define i64 @test_cmpxchg_i64_monotonic_monotonic(i64* %ptr, i64 %desired, i64 %newval) {
198 ; CHECK-LABEL: @test_cmpxchg_i64_monotonic_monotonic
199 ; CHECK-NOT: fence
200 ; CHECK: br label %[[LOOP:.*]]
201
202 ; CHECK: [[LOOP]]:
203 ; CHECK: [[PTR8:%.*]] = bitcast i64* %ptr to i8*
204 ; CHECK: [[LOHI:%.*]] = call { i32, i32 } @llvm.arm.ldrexd(i8* [[PTR8]])
205 ; CHECK: [[LO:%.*]] = extractvalue { i32, i32 } [[LOHI]], 0
206 ; CHECK: [[HI:%.*]] = extractvalue { i32, i32 } [[LOHI]], 1
207 ; CHECK: [[LO64:%.*]] = zext i32 [[LO]] to i64
208 ; CHECK: [[HI64_TMP:%.*]] = zext i32 [[HI]] to i64
209 ; CHECK: [[HI64:%.*]] = shl i64 [[HI64_TMP]], 32
210 ; CHECK: [[OLDVAL:%.*]] = or i64 [[LO64]], [[HI64]]
211 ; CHECK: [[SHOULD_STORE:%.*]] = icmp eq i64 [[OLDVAL]], %desired
212 ; CHECK: br i1 [[SHOULD_STORE]], label %[[TRY_STORE:.*]], label %[[NO_STORE_BB:.*]]
213
214 ; CHECK: [[TRY_STORE]]:
215 ; CHECK: [[NEWLO:%.*]] = trunc i64 %newval to i32
216 ; CHECK: [[NEWHI_TMP:%.*]] = lshr i64 %newval, 32
217 ; CHECK: [[NEWHI:%.*]] = trunc i64 [[NEWHI_TMP]] to i32
218 ; CHECK: [[PTR8:%.*]] = bitcast i64* %ptr to i8*
219 ; CHECK: [[TRYAGAIN:%.*]] = call i32 @llvm.arm.strexd(i32 [[NEWLO]], i32 [[NEWHI]], i8* [[PTR8]])
220 ; CHECK: [[TST:%.*]] = icmp eq i32 [[TRYAGAIN]], 0
221 ; CHECK: br i1 [[TST]], label %[[SUCCESS_BB:.*]], label %[[LOOP]]
222
223 ; CHECK: [[SUCCESS_BB]]:
224 ; CHECK-NOT: fence_cst
225 ; CHECK: br label %[[DONE:.*]]
226
227 ; CHECK: [[NO_STORE_BB]]:
228 ; CHECK-NEXT: call void @llvm.arm.clrex()
229 ; CHECK-NEXT: br label %[[FAILURE_BB:.*]]
230
231 ; CHECK: [[FAILURE_BB]]:
232 ; CHECK-NOT: fence_cst
233 ; CHECK: br label %[[DONE]]
234
235 ; CHECK: [[DONE]]:
236 ; CHECK: [[SUCCESS:%.*]] = phi i1 [ true, %[[SUCCESS_BB]] ], [ false, %[[FAILURE_BB]] ]
237 ; CHECK: ret i64 [[OLDVAL]]
238
239   %pairold = cmpxchg i64* %ptr, i64 %desired, i64 %newval monotonic monotonic
240   %old = extractvalue { i64, i1 } %pairold, 0
241   ret i64 %old
242 }