[ARM] Enable shrink-wrapping by default.
[oota-llvm.git] / test / CodeGen / ARM / vmov.ll
1 ; RUN: llc -mtriple=arm-eabi -mattr=+neon %s -o - | FileCheck %s
2
3 define <8 x i8> @v_movi8() nounwind {
4 ;CHECK-LABEL: v_movi8:
5 ;CHECK: vmov.i8 d{{.*}}, #0x8
6         ret <8 x i8> < i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8 >
7 }
8
9 define <4 x i16> @v_movi16a() nounwind {
10 ;CHECK-LABEL: v_movi16a:
11 ;CHECK: vmov.i16 d{{.*}}, #0x10
12         ret <4 x i16> < i16 16, i16 16, i16 16, i16 16 >
13 }
14
15 define <4 x i16> @v_movi16b() nounwind {
16 ;CHECK-LABEL: v_movi16b:
17 ;CHECK: vmov.i16 d{{.*}}, #0x1000
18         ret <4 x i16> < i16 4096, i16 4096, i16 4096, i16 4096 >
19 }
20
21 define <4 x i16> @v_mvni16a() nounwind {
22 ;CHECK-LABEL: v_mvni16a:
23 ;CHECK: vmvn.i16 d{{.*}}, #0x10
24         ret <4 x i16> < i16 65519, i16 65519, i16 65519, i16 65519 >
25 }
26
27 define <4 x i16> @v_mvni16b() nounwind {
28 ;CHECK-LABEL: v_mvni16b:
29 ;CHECK: vmvn.i16 d{{.*}}, #0x1000
30         ret <4 x i16> < i16 61439, i16 61439, i16 61439, i16 61439 >
31 }
32
33 define <2 x i32> @v_movi32a() nounwind {
34 ;CHECK-LABEL: v_movi32a:
35 ;CHECK: vmov.i32 d{{.*}}, #0x20
36         ret <2 x i32> < i32 32, i32 32 >
37 }
38
39 define <2 x i32> @v_movi32b() nounwind {
40 ;CHECK-LABEL: v_movi32b:
41 ;CHECK: vmov.i32 d{{.*}}, #0x2000
42         ret <2 x i32> < i32 8192, i32 8192 >
43 }
44
45 define <2 x i32> @v_movi32c() nounwind {
46 ;CHECK-LABEL: v_movi32c:
47 ;CHECK: vmov.i32 d{{.*}}, #0x200000
48         ret <2 x i32> < i32 2097152, i32 2097152 >
49 }
50
51 define <2 x i32> @v_movi32d() nounwind {
52 ;CHECK-LABEL: v_movi32d:
53 ;CHECK: vmov.i32 d{{.*}}, #0x20000000
54         ret <2 x i32> < i32 536870912, i32 536870912 >
55 }
56
57 define <2 x i32> @v_movi32e() nounwind {
58 ;CHECK-LABEL: v_movi32e:
59 ;CHECK: vmov.i32 d{{.*}}, #0x20ff
60         ret <2 x i32> < i32 8447, i32 8447 >
61 }
62
63 define <2 x i32> @v_movi32f() nounwind {
64 ;CHECK-LABEL: v_movi32f:
65 ;CHECK: vmov.i32 d{{.*}}, #0x20ffff
66         ret <2 x i32> < i32 2162687, i32 2162687 >
67 }
68
69 define <2 x i32> @v_mvni32a() nounwind {
70 ;CHECK-LABEL: v_mvni32a:
71 ;CHECK: vmvn.i32 d{{.*}}, #0x20
72         ret <2 x i32> < i32 4294967263, i32 4294967263 >
73 }
74
75 define <2 x i32> @v_mvni32b() nounwind {
76 ;CHECK-LABEL: v_mvni32b:
77 ;CHECK: vmvn.i32 d{{.*}}, #0x2000
78         ret <2 x i32> < i32 4294959103, i32 4294959103 >
79 }
80
81 define <2 x i32> @v_mvni32c() nounwind {
82 ;CHECK-LABEL: v_mvni32c:
83 ;CHECK: vmvn.i32 d{{.*}}, #0x200000
84         ret <2 x i32> < i32 4292870143, i32 4292870143 >
85 }
86
87 define <2 x i32> @v_mvni32d() nounwind {
88 ;CHECK-LABEL: v_mvni32d:
89 ;CHECK: vmvn.i32 d{{.*}}, #0x20000000
90         ret <2 x i32> < i32 3758096383, i32 3758096383 >
91 }
92
93 define <2 x i32> @v_mvni32e() nounwind {
94 ;CHECK-LABEL: v_mvni32e:
95 ;CHECK: vmvn.i32 d{{.*}}, #0x20ff
96         ret <2 x i32> < i32 4294958848, i32 4294958848 >
97 }
98
99 define <2 x i32> @v_mvni32f() nounwind {
100 ;CHECK-LABEL: v_mvni32f:
101 ;CHECK: vmvn.i32 d{{.*}}, #0x20ffff
102         ret <2 x i32> < i32 4292804608, i32 4292804608 >
103 }
104
105 define <1 x i64> @v_movi64() nounwind {
106 ;CHECK-LABEL: v_movi64:
107 ;CHECK: vmov.i64 d{{.*}}, #0xff0000ff0000ffff
108         ret <1 x i64> < i64 18374687574888349695 >
109 }
110
111 define <16 x i8> @v_movQi8() nounwind {
112 ;CHECK-LABEL: v_movQi8:
113 ;CHECK: vmov.i8 q{{.*}}, #0x8
114         ret <16 x i8> < i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8, i8 8 >
115 }
116
117 define <8 x i16> @v_movQi16a() nounwind {
118 ;CHECK-LABEL: v_movQi16a:
119 ;CHECK: vmov.i16 q{{.*}}, #0x10
120         ret <8 x i16> < i16 16, i16 16, i16 16, i16 16, i16 16, i16 16, i16 16, i16 16 >
121 }
122
123 define <8 x i16> @v_movQi16b() nounwind {
124 ;CHECK-LABEL: v_movQi16b:
125 ;CHECK: vmov.i16 q{{.*}}, #0x1000
126         ret <8 x i16> < i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096, i16 4096 >
127 }
128
129 define <4 x i32> @v_movQi32a() nounwind {
130 ;CHECK-LABEL: v_movQi32a:
131 ;CHECK: vmov.i32 q{{.*}}, #0x20
132         ret <4 x i32> < i32 32, i32 32, i32 32, i32 32 >
133 }
134
135 define <4 x i32> @v_movQi32b() nounwind {
136 ;CHECK-LABEL: v_movQi32b:
137 ;CHECK: vmov.i32 q{{.*}}, #0x2000
138         ret <4 x i32> < i32 8192, i32 8192, i32 8192, i32 8192 >
139 }
140
141 define <4 x i32> @v_movQi32c() nounwind {
142 ;CHECK-LABEL: v_movQi32c:
143 ;CHECK: vmov.i32 q{{.*}}, #0x200000
144         ret <4 x i32> < i32 2097152, i32 2097152, i32 2097152, i32 2097152 >
145 }
146
147 define <4 x i32> @v_movQi32d() nounwind {
148 ;CHECK-LABEL: v_movQi32d:
149 ;CHECK: vmov.i32 q{{.*}}, #0x20000000
150         ret <4 x i32> < i32 536870912, i32 536870912, i32 536870912, i32 536870912 >
151 }
152
153 define <4 x i32> @v_movQi32e() nounwind {
154 ;CHECK-LABEL: v_movQi32e:
155 ;CHECK: vmov.i32 q{{.*}}, #0x20ff
156         ret <4 x i32> < i32 8447, i32 8447, i32 8447, i32 8447 >
157 }
158
159 define <4 x i32> @v_movQi32f() nounwind {
160 ;CHECK-LABEL: v_movQi32f:
161 ;CHECK: vmov.i32 q{{.*}}, #0x20ffff
162         ret <4 x i32> < i32 2162687, i32 2162687, i32 2162687, i32 2162687 >
163 }
164
165 define <2 x i64> @v_movQi64() nounwind {
166 ;CHECK-LABEL: v_movQi64:
167 ;CHECK: vmov.i64 q{{.*}}, #0xff0000ff0000ffff
168         ret <2 x i64> < i64 18374687574888349695, i64 18374687574888349695 >
169 }
170
171 ; Check for correct assembler printing for immediate values.
172 %struct.int8x8_t = type { <8 x i8> }
173 define void @vdupn128(%struct.int8x8_t* noalias nocapture sret %agg.result) nounwind {
174 entry:
175 ;CHECK-LABEL: vdupn128:
176 ;CHECK: vmov.i8 d{{.*}}, #0x80
177   %0 = getelementptr inbounds %struct.int8x8_t, %struct.int8x8_t* %agg.result, i32 0, i32 0 ; <<8 x i8>*> [#uses=1]
178   store <8 x i8> <i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128, i8 -128>, <8 x i8>* %0, align 8
179   ret void
180 }
181
182 define void @vdupnneg75(%struct.int8x8_t* noalias nocapture sret %agg.result) nounwind {
183 entry:
184 ;CHECK-LABEL: vdupnneg75:
185 ;CHECK: vmov.i8 d{{.*}}, #0xb5
186   %0 = getelementptr inbounds %struct.int8x8_t, %struct.int8x8_t* %agg.result, i32 0, i32 0 ; <<8 x i8>*> [#uses=1]
187   store <8 x i8> <i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75, i8 -75>, <8 x i8>* %0, align 8
188   ret void
189 }
190
191 define <8 x i16> @vmovls8(<8 x i8>* %A) nounwind {
192 ;CHECK-LABEL: vmovls8:
193 ;CHECK: vmovl.s8
194         %tmp1 = load <8 x i8>, <8 x i8>* %A
195         %tmp2 = sext <8 x i8> %tmp1 to <8 x i16>
196         ret <8 x i16> %tmp2
197 }
198
199 define <4 x i32> @vmovls16(<4 x i16>* %A) nounwind {
200 ;CHECK-LABEL: vmovls16:
201 ;CHECK: vmovl.s16
202         %tmp1 = load <4 x i16>, <4 x i16>* %A
203         %tmp2 = sext <4 x i16> %tmp1 to <4 x i32>
204         ret <4 x i32> %tmp2
205 }
206
207 define <2 x i64> @vmovls32(<2 x i32>* %A) nounwind {
208 ;CHECK-LABEL: vmovls32:
209 ;CHECK: vmovl.s32
210         %tmp1 = load <2 x i32>, <2 x i32>* %A
211         %tmp2 = sext <2 x i32> %tmp1 to <2 x i64>
212         ret <2 x i64> %tmp2
213 }
214
215 define <8 x i16> @vmovlu8(<8 x i8>* %A) nounwind {
216 ;CHECK-LABEL: vmovlu8:
217 ;CHECK: vmovl.u8
218         %tmp1 = load <8 x i8>, <8 x i8>* %A
219         %tmp2 = zext <8 x i8> %tmp1 to <8 x i16>
220         ret <8 x i16> %tmp2
221 }
222
223 define <4 x i32> @vmovlu16(<4 x i16>* %A) nounwind {
224 ;CHECK-LABEL: vmovlu16:
225 ;CHECK: vmovl.u16
226         %tmp1 = load <4 x i16>, <4 x i16>* %A
227         %tmp2 = zext <4 x i16> %tmp1 to <4 x i32>
228         ret <4 x i32> %tmp2
229 }
230
231 define <2 x i64> @vmovlu32(<2 x i32>* %A) nounwind {
232 ;CHECK-LABEL: vmovlu32:
233 ;CHECK: vmovl.u32
234         %tmp1 = load <2 x i32>, <2 x i32>* %A
235         %tmp2 = zext <2 x i32> %tmp1 to <2 x i64>
236         ret <2 x i64> %tmp2
237 }
238
239 define <8 x i8> @vmovni16(<8 x i16>* %A) nounwind {
240 ;CHECK-LABEL: vmovni16:
241 ;CHECK: vmovn.i16
242         %tmp1 = load <8 x i16>, <8 x i16>* %A
243         %tmp2 = trunc <8 x i16> %tmp1 to <8 x i8>
244         ret <8 x i8> %tmp2
245 }
246
247 define <4 x i16> @vmovni32(<4 x i32>* %A) nounwind {
248 ;CHECK-LABEL: vmovni32:
249 ;CHECK: vmovn.i32
250         %tmp1 = load <4 x i32>, <4 x i32>* %A
251         %tmp2 = trunc <4 x i32> %tmp1 to <4 x i16>
252         ret <4 x i16> %tmp2
253 }
254
255 define <2 x i32> @vmovni64(<2 x i64>* %A) nounwind {
256 ;CHECK-LABEL: vmovni64:
257 ;CHECK: vmovn.i64
258         %tmp1 = load <2 x i64>, <2 x i64>* %A
259         %tmp2 = trunc <2 x i64> %tmp1 to <2 x i32>
260         ret <2 x i32> %tmp2
261 }
262
263 define <8 x i8> @vqmovns16(<8 x i16>* %A) nounwind {
264 ;CHECK-LABEL: vqmovns16:
265 ;CHECK: vqmovn.s16
266         %tmp1 = load <8 x i16>, <8 x i16>* %A
267         %tmp2 = call <8 x i8> @llvm.arm.neon.vqmovns.v8i8(<8 x i16> %tmp1)
268         ret <8 x i8> %tmp2
269 }
270
271 define <4 x i16> @vqmovns32(<4 x i32>* %A) nounwind {
272 ;CHECK-LABEL: vqmovns32:
273 ;CHECK: vqmovn.s32
274         %tmp1 = load <4 x i32>, <4 x i32>* %A
275         %tmp2 = call <4 x i16> @llvm.arm.neon.vqmovns.v4i16(<4 x i32> %tmp1)
276         ret <4 x i16> %tmp2
277 }
278
279 define <2 x i32> @vqmovns64(<2 x i64>* %A) nounwind {
280 ;CHECK-LABEL: vqmovns64:
281 ;CHECK: vqmovn.s64
282         %tmp1 = load <2 x i64>, <2 x i64>* %A
283         %tmp2 = call <2 x i32> @llvm.arm.neon.vqmovns.v2i32(<2 x i64> %tmp1)
284         ret <2 x i32> %tmp2
285 }
286
287 define <8 x i8> @vqmovnu16(<8 x i16>* %A) nounwind {
288 ;CHECK-LABEL: vqmovnu16:
289 ;CHECK: vqmovn.u16
290         %tmp1 = load <8 x i16>, <8 x i16>* %A
291         %tmp2 = call <8 x i8> @llvm.arm.neon.vqmovnu.v8i8(<8 x i16> %tmp1)
292         ret <8 x i8> %tmp2
293 }
294
295 define <4 x i16> @vqmovnu32(<4 x i32>* %A) nounwind {
296 ;CHECK-LABEL: vqmovnu32:
297 ;CHECK: vqmovn.u32
298         %tmp1 = load <4 x i32>, <4 x i32>* %A
299         %tmp2 = call <4 x i16> @llvm.arm.neon.vqmovnu.v4i16(<4 x i32> %tmp1)
300         ret <4 x i16> %tmp2
301 }
302
303 define <2 x i32> @vqmovnu64(<2 x i64>* %A) nounwind {
304 ;CHECK-LABEL: vqmovnu64:
305 ;CHECK: vqmovn.u64
306         %tmp1 = load <2 x i64>, <2 x i64>* %A
307         %tmp2 = call <2 x i32> @llvm.arm.neon.vqmovnu.v2i32(<2 x i64> %tmp1)
308         ret <2 x i32> %tmp2
309 }
310
311 define <8 x i8> @vqmovuns16(<8 x i16>* %A) nounwind {
312 ;CHECK-LABEL: vqmovuns16:
313 ;CHECK: vqmovun.s16
314         %tmp1 = load <8 x i16>, <8 x i16>* %A
315         %tmp2 = call <8 x i8> @llvm.arm.neon.vqmovnsu.v8i8(<8 x i16> %tmp1)
316         ret <8 x i8> %tmp2
317 }
318
319 define <4 x i16> @vqmovuns32(<4 x i32>* %A) nounwind {
320 ;CHECK-LABEL: vqmovuns32:
321 ;CHECK: vqmovun.s32
322         %tmp1 = load <4 x i32>, <4 x i32>* %A
323         %tmp2 = call <4 x i16> @llvm.arm.neon.vqmovnsu.v4i16(<4 x i32> %tmp1)
324         ret <4 x i16> %tmp2
325 }
326
327 define <2 x i32> @vqmovuns64(<2 x i64>* %A) nounwind {
328 ;CHECK-LABEL: vqmovuns64:
329 ;CHECK: vqmovun.s64
330         %tmp1 = load <2 x i64>, <2 x i64>* %A
331         %tmp2 = call <2 x i32> @llvm.arm.neon.vqmovnsu.v2i32(<2 x i64> %tmp1)
332         ret <2 x i32> %tmp2
333 }
334
335 declare <8 x i8>  @llvm.arm.neon.vqmovns.v8i8(<8 x i16>) nounwind readnone
336 declare <4 x i16> @llvm.arm.neon.vqmovns.v4i16(<4 x i32>) nounwind readnone
337 declare <2 x i32> @llvm.arm.neon.vqmovns.v2i32(<2 x i64>) nounwind readnone
338
339 declare <8 x i8>  @llvm.arm.neon.vqmovnu.v8i8(<8 x i16>) nounwind readnone
340 declare <4 x i16> @llvm.arm.neon.vqmovnu.v4i16(<4 x i32>) nounwind readnone
341 declare <2 x i32> @llvm.arm.neon.vqmovnu.v2i32(<2 x i64>) nounwind readnone
342
343 declare <8 x i8>  @llvm.arm.neon.vqmovnsu.v8i8(<8 x i16>) nounwind readnone
344 declare <4 x i16> @llvm.arm.neon.vqmovnsu.v4i16(<4 x i32>) nounwind readnone
345 declare <2 x i32> @llvm.arm.neon.vqmovnsu.v2i32(<2 x i64>) nounwind readnone
346
347 ; Truncating vector stores are not supported.  The following should not crash.
348 ; Radar 8598391.
349 define void @noTruncStore(<4 x i32>* %a, <4 x i16>* %b) nounwind {
350 ;CHECK: vmovn
351   %tmp1 = load <4 x i32>, <4 x i32>* %a, align 16
352   %tmp2 = trunc <4 x i32> %tmp1 to <4 x i16>
353   store <4 x i16> %tmp2, <4 x i16>* %b, align 8
354   ret void
355 }
356
357 ; Use vmov.f32 to materialize f32 immediate splats
358 ; rdar://10437054
359 define void @v_mov_v2f32(<2 x float>* nocapture %p) nounwind {
360 entry:
361 ;CHECK-LABEL: v_mov_v2f32:
362 ;CHECK: vmov.f32 d{{.*}}, #-1.600000e+01
363   store <2 x float> <float -1.600000e+01, float -1.600000e+01>, <2 x float>* %p, align 4
364   ret void
365 }
366
367 define void @v_mov_v4f32(<4 x float>* nocapture %p) nounwind {
368 entry:
369 ;CHECK-LABEL: v_mov_v4f32:
370 ;CHECK: vmov.f32 q{{.*}}, #3.100000e+01
371   store <4 x float> <float 3.100000e+01, float 3.100000e+01, float 3.100000e+01, float 3.100000e+01>, <4 x float>* %p, align 4
372   ret void
373 }
374
375 define void @v_mov_v4f32_undef(<4 x float> * nocapture %p) nounwind {
376 entry:
377 ;CHECK-LABEL: v_mov_v4f32_undef:
378 ;CHECK: vmov.f32 q{{.*}}, #1.000000e+00
379   %a = load <4 x float> , <4 x float> *%p
380   %b = fadd <4 x float> %a, <float undef, float 1.0, float 1.0, float 1.0>
381   store <4 x float> %b, <4 x float> *%p
382   ret void
383 }
384
385 ; Vector any_extends must be selected as either vmovl.u or vmovl.s.
386 ; rdar://10723651
387 define void @any_extend(<4 x i1> %x, <4 x i32> %y) nounwind ssp {
388 entry:
389 ;CHECK-LABEL: any_extend:
390 ;CHECK: vmovl
391   %and.i186 = zext <4 x i1> %x to <4 x i32>
392   %add.i185 = sub <4 x i32> %and.i186, %y
393   %sub.i = sub <4 x i32> %add.i185, zeroinitializer
394   %add.i = add <4 x i32> %sub.i, zeroinitializer
395   %vmovn.i = trunc <4 x i32> %add.i to <4 x i16>
396   tail call void @llvm.arm.neon.vst1.p0i8.v4i16(i8* undef, <4 x i16> %vmovn.i, i32 2)
397   unreachable
398 }
399
400 declare void @llvm.arm.neon.vst1.p0i8.v4i16(i8*, <4 x i16>, i32) nounwind