AVX-512: Extend/Truncate operations for SKX,
[oota-llvm.git] / test / CodeGen / X86 / avx512-trunc-ext.ll
1 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=knl | FileCheck %s
2 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=skx | FileCheck --check-prefix=SKX %s
3
4 ; CHECK-LABEL: trunc_16x32_to_16x8
5 ; CHECK: vpmovdb
6 ; CHECK: ret
7 define <16 x i8> @trunc_16x32_to_16x8(<16 x i32> %i) nounwind readnone {
8   %x = trunc <16 x i32> %i to <16 x i8>
9   ret <16 x i8> %x
10 }
11
12 ; CHECK-LABEL: trunc_8x64_to_8x16
13 ; CHECK: vpmovqw
14 ; CHECK: ret
15 define <8 x i16> @trunc_8x64_to_8x16(<8 x i64> %i) nounwind readnone {
16   %x = trunc <8 x i64> %i to <8 x i16>
17   ret <8 x i16> %x
18 }
19
20
21 ; CHECK-LABEL: zext_16x8_to_16x32
22 ; CHECK: vpmovzxbd {{.*}}%zmm
23 ; CHECK: ret
24 define <16 x i32> @zext_16x8_to_16x32(<16 x i8> %i) nounwind readnone {
25   %x = zext <16 x i8> %i to <16 x i32>
26   ret <16 x i32> %x
27 }
28
29 ; CHECK-LABEL: sext_16x8_to_16x32
30 ; CHECK: vpmovsxbd {{.*}}%zmm
31 ; CHECK: ret
32 define <16 x i32> @sext_16x8_to_16x32(<16 x i8> %i) nounwind readnone {
33   %x = sext <16 x i8> %i to <16 x i32>
34   ret <16 x i32> %x
35 }
36
37
38 ; CHECK-LABEL: zext_16x16_to_16x32
39 ; CHECK: vpmovzxwd {{.*}}%zmm
40 ; CHECK: ret
41 define <16 x i32> @zext_16x16_to_16x32(<16 x i16> %i) nounwind readnone {
42   %x = zext <16 x i16> %i to <16 x i32>
43   ret <16 x i32> %x
44 }
45
46 ; CHECK-LABEL: zext_8x16_to_8x64
47 ; CHECK: vpmovzxwq
48 ; CHECK: ret
49 define <8 x i64> @zext_8x16_to_8x64(<8 x i16> %i) nounwind readnone {
50   %x = zext <8 x i16> %i to <8 x i64>
51   ret <8 x i64> %x
52 }
53
54 ;CHECK-LABEL: fptrunc_test
55 ;CHECK: vcvtpd2ps {{.*}}%zmm
56 ;CHECK: ret
57 define <8 x float> @fptrunc_test(<8 x double> %a) nounwind readnone {
58   %b = fptrunc <8 x double> %a to <8 x float>
59   ret <8 x float> %b
60 }
61
62 ;CHECK-LABEL: fpext_test
63 ;CHECK: vcvtps2pd {{.*}}%zmm
64 ;CHECK: ret
65 define <8 x double> @fpext_test(<8 x float> %a) nounwind readnone {
66   %b = fpext <8 x float> %a to <8 x double>
67   ret <8 x double> %b
68 }
69
70 ; CHECK-LABEL: zext_16i1_to_16xi32
71 ; CHECK: vpbroadcastd LCP{{.*}}(%rip), %zmm0 {%k1} {z}
72 ; CHECK: ret
73 define   <16 x i32> @zext_16i1_to_16xi32(i16 %b) {
74   %a = bitcast i16 %b to <16 x i1>
75   %c = zext <16 x i1> %a to <16 x i32>
76   ret <16 x i32> %c
77 }
78
79 ; CHECK-LABEL: zext_8i1_to_8xi64
80 ; CHECK: vpbroadcastq LCP{{.*}}(%rip), %zmm0 {%k1} {z}
81 ; CHECK: ret
82 define   <8 x i64> @zext_8i1_to_8xi64(i8 %b) {
83   %a = bitcast i8 %b to <8 x i1>
84   %c = zext <8 x i1> %a to <8 x i64>
85   ret <8 x i64> %c
86 }
87
88 ; CHECK-LABEL: trunc_16i8_to_16i1
89 ; CHECK: vpmovsxbd
90 ; CHECK: vpandd
91 ; CHECK: vptestmd
92 ; CHECK: ret
93 ; SKX-LABEL: trunc_16i8_to_16i1
94 ; SKX: vpmovb2m %xmm
95 define i16 @trunc_16i8_to_16i1(<16 x i8> %a) {
96   %mask_b = trunc <16 x i8>%a to <16 x i1>
97   %mask = bitcast <16 x i1> %mask_b to i16
98   ret i16 %mask
99 }
100
101 ; CHECK-LABEL: trunc_16i32_to_16i1
102 ; CHECK: vpandd
103 ; CHECK: vptestmd
104 ; CHECK: ret
105 ; SKX-LABEL: trunc_16i32_to_16i1
106 ; SKX: vpmovd2m %zmm
107 define i16 @trunc_16i32_to_16i1(<16 x i32> %a) {
108   %mask_b = trunc <16 x i32>%a to <16 x i1>
109   %mask = bitcast <16 x i1> %mask_b to i16
110   ret i16 %mask
111 }
112
113 ; SKX-LABEL: trunc_4i32_to_4i1
114 ; SKX: vpmovd2m        %xmm
115 ; SKX: kandw
116 ; SKX: vpmovm2d
117 define <4 x i32> @trunc_4i32_to_4i1(<4 x i32> %a, <4 x i32> %b) {
118   %mask_a = trunc <4 x i32>%a to <4 x i1>
119   %mask_b = trunc <4 x i32>%b to <4 x i1>
120   %a_and_b = and <4 x i1>%mask_a, %mask_b
121   %res = sext <4 x i1>%a_and_b to <4 x i32>
122   ret <4 x i32>%res
123 }
124
125 ; CHECK-LABEL: trunc_8i16_to_8i1
126 ; CHECK: vpmovsxwq
127 ; CHECK: vpandq LCP{{.*}}(%rip){1to8}
128 ; CHECK: vptestmq
129 ; CHECK: ret
130
131 ; SKX-LABEL: trunc_8i16_to_8i1
132 ; SKX: vpmovw2m %xmm
133 define i8 @trunc_8i16_to_8i1(<8 x i16> %a) {
134   %mask_b = trunc <8 x i16>%a to <8 x i1>
135   %mask = bitcast <8 x i1> %mask_b to i8
136   ret i8 %mask
137 }
138
139 ; CHECK-LABEL: sext_8i1_8i32
140 ; CHECK: vpbroadcastq  LCP{{.*}}(%rip), %zmm0 {%k1} {z}
141 ; SKX: vpmovm2d
142 ; CHECK: ret
143 define <8 x i32> @sext_8i1_8i32(<8 x i32> %a1, <8 x i32> %a2) nounwind {
144   %x = icmp slt <8 x i32> %a1, %a2
145   %x1 = xor <8 x i1>%x, <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>
146   %y = sext <8 x i1> %x1 to <8 x i32>
147   ret <8 x i32> %y
148 }
149
150 ; CHECK-LABEL: trunc_v16i32_to_v16i16
151 ; CHECK: vpmovdw
152 ; CHECK: ret
153 define <16 x i16> @trunc_v16i32_to_v16i16(<16 x i32> %x) {
154   %1 = trunc <16 x i32> %x to <16 x i16>
155   ret <16 x i16> %1
156 }
157
158 ; CHECK-LABEL: trunc_i32_to_i1
159 ; CHECK: testb
160 ; CHECK: setne
161 ; CKECK: orl
162 ; CHECK: ret
163 define i16 @trunc_i32_to_i1(i32 %a) {
164   %a_i = trunc i32 %a to i1
165   %maskv = insertelement <16 x i1> <i1 true, i1 false, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, i1 %a_i, i32 0
166   %res = bitcast <16 x i1> %maskv to i16
167   ret i16 %res
168 }
169
170 ; CHECK-LABEL: sext_8i1_8i16
171 ; SKX: vpmovm2w
172 ; CHECK: ret
173 define <8 x i16> @sext_8i1_8i16(<8 x i32> %a1, <8 x i32> %a2) nounwind {
174   %x = icmp slt <8 x i32> %a1, %a2
175   %y = sext <8 x i1> %x to <8 x i16>
176   ret <8 x i16> %y
177 }
178
179 ; CHECK-LABEL: sext_16i1_16i32
180 ; SKX: vpmovm2d
181 ; CHECK: ret
182 define <16 x i32> @sext_16i1_16i32(<16 x i32> %a1, <16 x i32> %a2) nounwind {
183   %x = icmp slt <16 x i32> %a1, %a2
184   %y = sext <16 x i1> %x to <16 x i32>
185   ret <16 x i32> %y
186 }
187
188 ; CHECK-LABEL: sext_8i1_8i64
189 ; SKX: vpmovm2q
190 ; CHECK: ret
191 define <8 x i64> @sext_8i1_8i64(<8 x i32> %a1, <8 x i32> %a2) nounwind {
192   %x = icmp slt <8 x i32> %a1, %a2
193   %y = sext <8 x i1> %x to <8 x i64>
194   ret <8 x i64> %y
195 }