[x86] Fix another miscompile in the new vector shuffle lowering found
[oota-llvm.git] / test / CodeGen / X86 / vector-shuffle-128-v8.ll
1 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -x86-experimental-vector-shuffle-lowering | FileCheck %s --check-prefix=ALL --check-prefix=SSE2
2 ; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mcpu=x86-64 -mattr=+ssse3 -x86-experimental-vector-shuffle-lowering | FileCheck %s --check-prefix=ALL --check-prefix=SSSE3
3
4 target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
5 target triple = "x86_64-unknown-unknown"
6
7 define <8 x i16> @shuffle_v8i16_01012323(<8 x i16> %a, <8 x i16> %b) {
8 ; ALL-LABEL: @shuffle_v8i16_01012323
9 ; ALL:       # BB#0:
10 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,0,1,1]
11 ; ALL-NEXT:    retq
12   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 1, i32 0, i32 1, i32 2, i32 3, i32 2, i32 3>
13   ret <8 x i16> %shuffle
14 }
15 define <8 x i16> @shuffle_v8i16_67452301(<8 x i16> %a, <8 x i16> %b) {
16 ; ALL-LABEL: @shuffle_v8i16_67452301
17 ; ALL:       # BB#0:
18 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[3,2,1,0]
19 ; ALL-NEXT:    retq
20   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 6, i32 7, i32 4, i32 5, i32 2, i32 3, i32 0, i32 1>
21   ret <8 x i16> %shuffle
22 }
23 define <8 x i16> @shuffle_v8i16_456789AB(<8 x i16> %a, <8 x i16> %b) {
24 ; ALL-LABEL: @shuffle_v8i16_456789AB
25 ; ALL:       # BB#0:
26 ; ALL:         shufpd {{.*}} # xmm0 = xmm0[1],xmm1[0]
27 ; ALL-NEXT:    retq
28   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 5, i32 6, i32 7, i32 8, i32 9, i32 10, i32 11>
29   ret <8 x i16> %shuffle
30 }
31
32 define <8 x i16> @shuffle_v8i16_00000000(<8 x i16> %a, <8 x i16> %b) {
33 ; SSE2-LABEL: @shuffle_v8i16_00000000
34 ; SSE2:       # BB#0:
35 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,0,3]
36 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,0,0,0,4,5,6,7]
37 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
38 ; SSE2-NEXT:    retq
39 ;
40 ; SSSE3-LABEL: @shuffle_v8i16_00000000
41 ; SSSE3:       # BB#0:
42 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,0,1,0,1,0,1,0,1,0,1,0,1,0,1]
43 ; SSSE3-NEXT:    retq
44   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
45   ret <8 x i16> %shuffle
46 }
47 define <8 x i16> @shuffle_v8i16_00004444(<8 x i16> %a, <8 x i16> %b) {
48 ; ALL-LABEL: @shuffle_v8i16_00004444
49 ; ALL:       # BB#0:
50 ; ALL-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,0,0,0,4,5,6,7]
51 ; ALL-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
52 ; ALL-NEXT:    retq
53   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>
54   ret <8 x i16> %shuffle
55 }
56 define <8 x i16> @shuffle_v8i16_31206745(<8 x i16> %a, <8 x i16> %b) {
57 ; ALL-LABEL: @shuffle_v8i16_31206745
58 ; ALL:       # BB#0:
59 ; ALL-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[3,1,2,0,4,5,6,7]
60 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,3,2]
61 ; ALL-NEXT:    retq
62   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 3, i32 1, i32 2, i32 0, i32 6, i32 7, i32 4, i32 5>
63   ret <8 x i16> %shuffle
64 }
65 define <8 x i16> @shuffle_v8i16_44440000(<8 x i16> %a, <8 x i16> %b) {
66 ; SSE2-LABEL: @shuffle_v8i16_44440000
67 ; SSE2:       # BB#0:
68 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,1,0,3]
69 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,0,0,0,4,5,6,7]
70 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
71 ; SSE2-NEXT:    retq
72 ;
73 ; SSSE3-LABEL: @shuffle_v8i16_44440000
74 ; SSSE3:       # BB#0:
75 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[8,9,8,9,8,9,8,9,0,1,0,1,0,1,0,1]
76 ; SSSE3-NEXT:    retq
77   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 4, i32 4, i32 4, i32 0, i32 0, i32 0, i32 0>
78   ret <8 x i16> %shuffle
79 }
80 define <8 x i16> @shuffle_v8i16_75643120(<8 x i16> %a, <8 x i16> %b) {
81 ; SSE2-LABEL: @shuffle_v8i16_75643120
82 ; SSE2:       # BB#0:
83 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,3,0,1]
84 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[3,1,2,0,4,5,6,7]
85 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,5,6,4]
86 ; SSE2-NEXT:    retq
87 ;
88 ; SSSE3-LABEL: @shuffle_v8i16_75643120
89 ; SSSE3:       # BB#0:
90 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[14,15,10,11,12,13,8,9,6,7,2,3,4,5,0,1]
91 ; SSSE3-NEXT:    retq
92   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 7, i32 5, i32 6, i32 4, i32 3, i32 1, i32 2, i32 0>
93   ret <8 x i16> %shuffle
94 }
95
96 define <8 x i16> @shuffle_v8i16_10545410(<8 x i16> %a, <8 x i16> %b) {
97 ; SSE2-LABEL: @shuffle_v8i16_10545410
98 ; SSE2:       # BB#0:
99 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,0]
100 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[1,0,3,2,4,5,6,7]
101 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,5,4,7,6]
102 ; SSE2-NEXT:    retq
103 ;
104 ; SSSE3-LABEL: @shuffle_v8i16_10545410
105 ; SSSE3:       # BB#0:
106 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[2,3,0,1,10,11,8,9,10,11,8,9,2,3,0,1]
107 ; SSSE3-NEXT:    retq
108   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 1, i32 0, i32 5, i32 4, i32 5, i32 4, i32 1, i32 0>
109   ret <8 x i16> %shuffle
110 }
111 define <8 x i16> @shuffle_v8i16_54105410(<8 x i16> %a, <8 x i16> %b) {
112 ; SSE2-LABEL: @shuffle_v8i16_54105410
113 ; SSE2:       # BB#0:
114 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,0]
115 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[3,2,1,0,4,5,6,7]
116 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,5,4,7,6]
117 ; SSE2-NEXT:    retq
118 ;
119 ; SSSE3-LABEL: @shuffle_v8i16_54105410
120 ; SSSE3:       # BB#0:
121 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[10,11,8,9,2,3,0,1,10,11,8,9,2,3,0,1]
122 ; SSSE3-NEXT:    retq
123   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 5, i32 4, i32 1, i32 0, i32 5, i32 4, i32 1, i32 0>
124   ret <8 x i16> %shuffle
125 }
126 define <8 x i16> @shuffle_v8i16_54101054(<8 x i16> %a, <8 x i16> %b) {
127 ; SSE2-LABEL: @shuffle_v8i16_54101054
128 ; SSE2:       # BB#0:
129 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,0]
130 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[3,2,1,0,4,5,6,7]
131 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,6,5,4]
132 ; SSE2-NEXT:    retq
133 ;
134 ; SSSE3-LABEL: @shuffle_v8i16_54101054
135 ; SSSE3:       # BB#0:
136 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[10,11,8,9,2,3,0,1,2,3,0,1,10,11,8,9]
137 ; SSSE3-NEXT:    retq
138   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 5, i32 4, i32 1, i32 0, i32 1, i32 0, i32 5, i32 4>
139   ret <8 x i16> %shuffle
140 }
141 define <8 x i16> @shuffle_v8i16_04400440(<8 x i16> %a, <8 x i16> %b) {
142 ; SSE2-LABEL: @shuffle_v8i16_04400440
143 ; SSE2:       # BB#0:
144 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,0]
145 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,2,0,4,5,6,7]
146 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,6,4,4,6]
147 ; SSE2-NEXT:    retq
148 ;
149 ; SSSE3-LABEL: @shuffle_v8i16_04400440
150 ; SSSE3:       # BB#0:
151 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,8,9,8,9,0,1,0,1,8,9,8,9,0,1]
152 ; SSSE3-NEXT:    retq
153   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 4, i32 4, i32 0, i32 0, i32 4, i32 4, i32 0>
154   ret <8 x i16> %shuffle
155 }
156 define <8 x i16> @shuffle_v8i16_40044004(<8 x i16> %a, <8 x i16> %b) {
157 ; SSE2-LABEL: @shuffle_v8i16_40044004
158 ; SSE2:       # BB#0:
159 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,0]
160 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[2,0,0,2,4,5,6,7]
161 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,6,6,4]
162 ; SSE2-NEXT:    retq
163 ;
164 ; SSSE3-LABEL: @shuffle_v8i16_40044004
165 ; SSSE3:       # BB#0:
166 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[8,9,0,1,0,1,8,9,8,9,0,1,0,1,8,9]
167 ; SSSE3-NEXT:    retq
168   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 0, i32 0, i32 4, i32 4, i32 0, i32 0, i32 4>
169   ret <8 x i16> %shuffle
170 }
171
172 define <8 x i16> @shuffle_v8i16_26405173(<8 x i16> %a, <8 x i16> %b) {
173 ; SSE2-LABEL: @shuffle_v8i16_26405173
174 ; SSE2:       # BB#0:
175 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,1,3,4,5,6,7]
176 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,5,6,4]
177 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,3,2,1]
178 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[1,2,3,0,4,5,6,7]
179 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,5,6,4,7]
180 ; SSE2-NEXT:    retq
181 ;
182 ; SSSE3-LABEL: @shuffle_v8i16_26405173
183 ; SSSE3:       # BB#0:
184 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[4,5,12,13,8,9,0,1,10,11,2,3,14,15,6,7]
185 ; SSSE3-NEXT:    retq
186   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 2, i32 6, i32 4, i32 0, i32 5, i32 1, i32 7, i32 3>
187   ret <8 x i16> %shuffle
188 }
189 define <8 x i16> @shuffle_v8i16_20645173(<8 x i16> %a, <8 x i16> %b) {
190 ; SSE2-LABEL: @shuffle_v8i16_20645173
191 ; SSE2:       # BB#0:
192 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,1,3,4,5,6,7]
193 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,5,6,4]
194 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,3,2,1]
195 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[1,0,2,3,4,5,6,7]
196 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,5,6,4,7]
197 ; SSE2-NEXT:    retq
198 ;
199 ; SSSE3-LABEL: @shuffle_v8i16_20645173
200 ; SSSE3:       # BB#0:
201 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[4,5,0,1,12,13,8,9,10,11,2,3,14,15,6,7]
202 ; SSSE3-NEXT:    retq
203   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 2, i32 0, i32 6, i32 4, i32 5, i32 1, i32 7, i32 3>
204   ret <8 x i16> %shuffle
205 }
206 define <8 x i16> @shuffle_v8i16_26401375(<8 x i16> %a, <8 x i16> %b) {
207 ; SSE2-LABEL: @shuffle_v8i16_26401375
208 ; SSE2:       # BB#0:
209 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,1,3,4,5,6,7]
210 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,5,6,4]
211 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,3,1,2]
212 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[1,2,3,0,4,5,6,7]
213 ; SSE2-NEXT:    retq
214 ;
215 ; SSSE3-LABEL: @shuffle_v8i16_26401375
216 ; SSSE3:       # BB#0:
217 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[4,5,12,13,8,9,0,1,2,3,6,7,14,15,10,11]
218 ; SSSE3-NEXT:    retq
219   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 2, i32 6, i32 4, i32 0, i32 1, i32 3, i32 7, i32 5>
220   ret <8 x i16> %shuffle
221 }
222
223 define <8 x i16> @shuffle_v8i16_66751643(<8 x i16> %a, <8 x i16> %b) {
224 ; SSE2-LABEL: @shuffle_v8i16_66751643
225 ; SSE2:       # BB#0:
226 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[3,1,2,3,4,5,6,7]
227 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,6,5,7]
228 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,3,2,0]
229 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[1,1,3,2,4,5,6,7]
230 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,7,5,4,6]
231 ; SSE2-NEXT:    retq
232 ;
233 ; SSSE3-LABEL: @shuffle_v8i16_66751643
234 ; SSSE3:       # BB#0:
235 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[12,13,12,13,14,15,10,11,2,3,12,13,8,9,6,7]
236 ; SSSE3-NEXT:    retq
237   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 6, i32 6, i32 7, i32 5, i32 1, i32 6, i32 4, i32 3>
238   ret <8 x i16> %shuffle
239 }
240
241 define <8 x i16> @shuffle_v8i16_00444444(<8 x i16> %a, <8 x i16> %b) {
242 ; SSE2-LABEL: @shuffle_v8i16_00444444
243 ; SSE2:       # BB#0:
244 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
245 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,0,2,2,4,5,6,7]
246 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
247 ; SSE2-NEXT:    retq
248 ;
249 ; SSSE3-LABEL: @shuffle_v8i16_00444444
250 ; SSSE3:       # BB#0:
251 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,0,1,8,9,8,9,8,9,8,9,8,9,8,9]
252 ; SSSE3-NEXT:    retq
253   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 0, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
254   ret <8 x i16> %shuffle
255 }
256 define <8 x i16> @shuffle_v8i16_44004444(<8 x i16> %a, <8 x i16> %b) {
257 ; SSE2-LABEL: @shuffle_v8i16_44004444
258 ; SSE2:       # BB#0:
259 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
260 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[2,2,0,0,4,5,6,7]
261 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
262 ; SSE2-NEXT:    retq
263 ;
264 ; SSSE3-LABEL: @shuffle_v8i16_44004444
265 ; SSSE3:       # BB#0:
266 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[8,9,8,9,0,1,0,1,8,9,8,9,8,9,8,9]
267 ; SSSE3-NEXT:    retq
268   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 4, i32 0, i32 0, i32 4, i32 4, i32 4, i32 4>
269   ret <8 x i16> %shuffle
270 }
271 define <8 x i16> @shuffle_v8i16_04404444(<8 x i16> %a, <8 x i16> %b) {
272 ; SSE2-LABEL: @shuffle_v8i16_04404444
273 ; SSE2:       # BB#0:
274 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
275 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,2,0,4,5,6,7]
276 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
277 ; SSE2-NEXT:    retq
278 ;
279 ; SSSE3-LABEL: @shuffle_v8i16_04404444
280 ; SSSE3:       # BB#0:
281 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,8,9,8,9,0,1,8,9,8,9,8,9,8,9]
282 ; SSSE3-NEXT:    retq
283   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 4, i32 4, i32 0, i32 4, i32 4, i32 4, i32 4>
284   ret <8 x i16> %shuffle
285 }
286 define <8 x i16> @shuffle_v8i16_04400000(<8 x i16> %a, <8 x i16> %b) {
287 ; SSE2-LABEL: @shuffle_v8i16_04400000
288 ; SSE2:       # BB#0:
289 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,0,3]
290 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,2,0,4,5,6,7]
291 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
292 ; SSE2-NEXT:    retq
293 ;
294 ; SSSE3-LABEL: @shuffle_v8i16_04400000
295 ; SSSE3:       # BB#0:
296 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,8,9,8,9,0,1,0,1,0,1,0,1,0,1]
297 ; SSSE3-NEXT:    retq
298   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 4, i32 4, i32 0, i32 0, i32 0, i32 0, i32 0>
299   ret <8 x i16> %shuffle
300 }
301 define <8 x i16> @shuffle_v8i16_04404567(<8 x i16> %a, <8 x i16> %b) {
302 ; ALL-LABEL: @shuffle_v8i16_04404567
303 ; ALL:       # BB#0:
304 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
305 ; ALL-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,2,0,4,5,6,7]
306 ; ALL-NEXT:    retq
307   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 4, i32 4, i32 0, i32 4, i32 5, i32 6, i32 7>
308   ret <8 x i16> %shuffle
309 }
310
311 define <8 x i16> @shuffle_v8i16_0X444444(<8 x i16> %a, <8 x i16> %b) {
312 ; SSE2-LABEL: @shuffle_v8i16_0X444444
313 ; SSE2:       # BB#0:
314 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
315 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,1,2,2,4,5,6,7]
316 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
317 ; SSE2-NEXT:    retq
318 ;
319 ; SSSE3-LABEL: @shuffle_v8i16_0X444444
320 ; SSSE3:       # BB#0:
321 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,{{[0-9]+,[0-9]+}},8,9,8,9,8,9,8,9,8,9,8,9]
322 ; SSSE3-NEXT:    retq
323   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 undef, i32 4, i32 4, i32 4, i32 4, i32 4, i32 4>
324   ret <8 x i16> %shuffle
325 }
326 define <8 x i16> @shuffle_v8i16_44X04444(<8 x i16> %a, <8 x i16> %b) {
327 ; SSE2-LABEL: @shuffle_v8i16_44X04444
328 ; SSE2:       # BB#0:
329 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
330 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[2,2,2,0,4,5,6,7]
331 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
332 ; SSE2-NEXT:    retq
333 ;
334 ; SSSE3-LABEL: @shuffle_v8i16_44X04444
335 ; SSSE3:       # BB#0:
336 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[8,9,8,9,{{[0-9]+,[0-9]+}},0,1,8,9,8,9,8,9,8,9]
337 ; SSSE3-NEXT:    retq
338   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 4, i32 undef, i32 0, i32 4, i32 4, i32 4, i32 4>
339   ret <8 x i16> %shuffle
340 }
341 define <8 x i16> @shuffle_v8i16_X4404444(<8 x i16> %a, <8 x i16> %b) {
342 ; SSE2-LABEL: @shuffle_v8i16_X4404444
343 ; SSE2:       # BB#0:
344 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
345 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,2,0,4,5,6,7]
346 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,4,4,4]
347 ; SSE2-NEXT:    retq
348 ;
349 ; SSSE3-LABEL: @shuffle_v8i16_X4404444
350 ; SSSE3:       # BB#0:
351 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[{{[0-9]+,[0-9]+}},8,9,8,9,0,1,8,9,8,9,8,9,8,9]
352 ; SSSE3-NEXT:    retq
353   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 undef, i32 4, i32 4, i32 0, i32 4, i32 4, i32 4, i32 4>
354   ret <8 x i16> %shuffle
355 }
356
357 define <8 x i16> @shuffle_v8i16_0127XXXX(<8 x i16> %a, <8 x i16> %b) {
358 ; SSE2-LABEL: @shuffle_v8i16_0127XXXX
359 ; SSE2:       # BB#0:
360 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,1,3]
361 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,7,6,7]
362 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
363 ; SSE2-NEXT:    retq
364 ;
365 ; SSSE3-LABEL: @shuffle_v8i16_0127XXXX
366 ; SSSE3:       # BB#0:
367 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,2,3,4,5,14,15,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
368 ; SSSE3-NEXT:    retq
369   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 7, i32 undef, i32 undef, i32 undef, i32 undef>
370   ret <8 x i16> %shuffle
371 }
372
373 define <8 x i16> @shuffle_v8i16_XXXX4563(<8 x i16> %a, <8 x i16> %b) {
374 ; SSE2-LABEL: @shuffle_v8i16_XXXX4563
375 ; SSE2:       # BB#0:
376 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[3,1,2,0]
377 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,3,2,3,4,5,6,7]
378 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,2,0]
379 ; SSE2-NEXT:    retq
380 ;
381 ; SSSE3-LABEL: @shuffle_v8i16_XXXX4563
382 ; SSSE3:       # BB#0:
383 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}},8,9,10,11,12,13,6,7]
384 ; SSSE3-NEXT:    retq
385   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 undef, i32 4, i32 5, i32 6, i32 3>
386   ret <8 x i16> %shuffle
387 }
388
389 define <8 x i16> @shuffle_v8i16_4563XXXX(<8 x i16> %a, <8 x i16> %b) {
390 ; SSE2-LABEL: @shuffle_v8i16_4563XXXX
391 ; SSE2:       # BB#0:
392 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[3,1,2,0]
393 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,3,2,3,4,5,6,7]
394 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,0,2,3]
395 ; SSE2-NEXT:    retq
396 ;
397 ; SSSE3-LABEL: @shuffle_v8i16_4563XXXX
398 ; SSSE3:       # BB#0:
399 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[8,9,10,11,12,13,6,7,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
400 ; SSSE3-NEXT:    retq
401   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 5, i32 6, i32 3, i32 undef, i32 undef, i32 undef, i32 undef>
402   ret <8 x i16> %shuffle
403 }
404
405 define <8 x i16> @shuffle_v8i16_01274563(<8 x i16> %a, <8 x i16> %b) {
406 ; SSE2-LABEL: @shuffle_v8i16_01274563
407 ; SSE2:       # BB#0:
408 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,1,3]
409 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,6,5,4,7]
410 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,3,1,2]
411 ; SSE2-NEXT:    retq
412 ;
413 ; SSSE3-LABEL: @shuffle_v8i16_01274563
414 ; SSSE3:       # BB#0:
415 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,2,3,4,5,14,15,8,9,10,11,12,13,6,7]
416 ; SSSE3-NEXT:    retq
417   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 7, i32 4, i32 5, i32 6, i32 3>
418   ret <8 x i16> %shuffle
419 }
420
421 define <8 x i16> @shuffle_v8i16_45630127(<8 x i16> %a, <8 x i16> %b) {
422 ; SSE2-LABEL: @shuffle_v8i16_45630127
423 ; SSE2:       # BB#0:
424 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[3,1,2,0]
425 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,3,2,1,4,5,6,7]
426 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,0,3,1]
427 ; SSE2-NEXT:    retq
428 ;
429 ; SSSE3-LABEL: @shuffle_v8i16_45630127
430 ; SSSE3:       # BB#0:
431 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[8,9,10,11,12,13,6,7,0,1,2,3,4,5,14,15]
432 ; SSSE3-NEXT:    retq
433   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 5, i32 6, i32 3, i32 0, i32 1, i32 2, i32 7>
434   ret <8 x i16> %shuffle
435 }
436
437 define <8 x i16> @shuffle_v8i16_08192a3b(<8 x i16> %a, <8 x i16> %b) {
438 ; ALL-LABEL: @shuffle_v8i16_08192a3b
439 ; ALL:       # BB#0:
440 ; ALL-NEXT:    punpcklwd %xmm1, %xmm0
441 ; ALL-NEXT:    retq
442   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 2, i32 10, i32 3, i32 11>
443   ret <8 x i16> %shuffle
444 }
445
446 define <8 x i16> @shuffle_v8i16_0c1d2e3f(<8 x i16> %a, <8 x i16> %b) {
447 ; ALL-LABEL: @shuffle_v8i16_0c1d2e3f
448 ; ALL:       # BB#0:
449 ; ALL-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,3,2,3]
450 ; ALL-NEXT:    punpcklwd %xmm1, %xmm0
451 ; ALL-NEXT:    retq
452   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 12, i32 1, i32 13, i32 2, i32 14, i32 3, i32 15>
453   ret <8 x i16> %shuffle
454 }
455
456 define <8 x i16> @shuffle_v8i16_4c5d6e7f(<8 x i16> %a, <8 x i16> %b) {
457 ; ALL-LABEL: @shuffle_v8i16_4c5d6e7f
458 ; ALL:       # BB#0:
459 ; ALL-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,3,2,3]
460 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,3,2,3]
461 ; ALL-NEXT:    punpcklwd %xmm1, %xmm0
462 ; ALL-NEXT:    retq
463   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 12, i32 5, i32 13, i32 6, i32 14, i32 7, i32 15>
464   ret <8 x i16> %shuffle
465 }
466
467 define <8 x i16> @shuffle_v8i16_48596a7b(<8 x i16> %a, <8 x i16> %b) {
468 ; ALL-LABEL: @shuffle_v8i16_48596a7b
469 ; ALL:       # BB#0:
470 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,3,2,3]
471 ; ALL-NEXT:    punpcklwd %xmm1, %xmm0
472 ; ALL-NEXT:    retq
473   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 8, i32 5, i32 9, i32 6, i32 10, i32 7, i32 11>
474   ret <8 x i16> %shuffle
475 }
476
477 define <8 x i16> @shuffle_v8i16_08196e7f(<8 x i16> %a, <8 x i16> %b) {
478 ; ALL-LABEL: @shuffle_v8i16_08196e7f
479 ; ALL:       # BB#0:
480 ; ALL-NEXT:    pshufd {{.*}} # xmm1 = xmm1[0,3,2,3]
481 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,3,2,3]
482 ; ALL-NEXT:    punpcklwd %xmm1, %xmm0
483 ; ALL-NEXT:    retq
484   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 8, i32 1, i32 9, i32 6, i32 14, i32 7, i32 15>
485   ret <8 x i16> %shuffle
486 }
487
488 define <8 x i16> @shuffle_v8i16_0c1d6879(<8 x i16> %a, <8 x i16> %b) {
489 ; ALL-LABEL: @shuffle_v8i16_0c1d6879
490 ; ALL:       # BB#0:
491 ; ALL-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,0,2,3]
492 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,3,2,3]
493 ; ALL-NEXT:    punpcklwd %xmm1, %xmm0
494 ; ALL-NEXT:    retq
495   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 12, i32 1, i32 13, i32 6, i32 8, i32 7, i32 9>
496   ret <8 x i16> %shuffle
497 }
498
499 define <8 x i16> @shuffle_v8i16_109832ba(<8 x i16> %a, <8 x i16> %b) {
500 ; ALL-LABEL: @shuffle_v8i16_109832ba
501 ; ALL:       # BB#0:
502 ; ALL-NEXT:    punpcklwd %xmm1, %xmm0
503 ; ALL-NEXT:    pshuflw {{.*}} # xmm1 = xmm0[2,0,3,1,4,5,6,7]
504 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,3,2,3]
505 ; ALL-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[2,0,3,1,4,5,6,7]
506 ; ALL-NEXT:    punpcklqdq %xmm0, %xmm1
507 ; ALL-NEXT:    movdqa %xmm1, %xmm0
508 ; ALL-NEXT:    retq
509   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 1, i32 0, i32 9, i32 8, i32 3, i32 2, i32 11, i32 10>
510   ret <8 x i16> %shuffle
511 }
512
513 define <8 x i16> @shuffle_v8i16_8091a2b3(<8 x i16> %a, <8 x i16> %b) {
514 ; ALL-LABEL: @shuffle_v8i16_8091a2b3
515 ; ALL:       # BB#0:
516 ; ALL-NEXT:    punpcklwd %xmm0, %xmm1
517 ; ALL-NEXT:    movdqa %xmm1, %xmm0
518 ; ALL-NEXT:    retq
519   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 8, i32 0, i32 9, i32 1, i32 10, i32 2, i32 11, i32 3>
520   ret <8 x i16> %shuffle
521 }
522 define <8 x i16> @shuffle_v8i16_c4d5e6f7(<8 x i16> %a, <8 x i16> %b) {
523 ; ALL-LABEL: @shuffle_v8i16_c4d5e6f7
524 ; ALL:       # BB#0:
525 ; ALL-NEXT:    pshufd {{.*}} # xmm2 = xmm0[2,3,2,3]
526 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm1[2,3,2,3]
527 ; ALL-NEXT:    punpcklwd %xmm2, %xmm0
528 ; ALL-NEXT:    retq
529   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 12, i32 4, i32 13, i32 5, i32 14, i32 6, i32 15, i32 7>
530   ret <8 x i16> %shuffle
531 }
532
533 define <8 x i16> @shuffle_v8i16_0213cedf(<8 x i16> %a, <8 x i16> %b) {
534 ; ALL-LABEL: @shuffle_v8i16_0213cedf
535 ; ALL:       # BB#0:
536 ; ALL-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,2,1,3,4,5,6,7]
537 ; ALL-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,3,2,3]
538 ; ALL-NEXT:    pshuflw {{.*}} # xmm1 = xmm1[0,2,1,3,4,5,6,7]
539 ; ALL-NEXT:    punpcklqdq %xmm1, %xmm0
540 ; ALL-NEXT:    retq
541   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 2, i32 1, i32 3, i32 12, i32 14, i32 13, i32 15>
542   ret <8 x i16> %shuffle
543 }
544
545 define <8 x i16> @shuffle_v8i16_443aXXXX(<8 x i16> %a, <8 x i16> %b) {
546 ; SSE2-LABEL: @shuffle_v8i16_443aXXXX
547 ; SSE2:       # BB#0:
548 ; SSE2-NEXT:    pshufd {{.*}}          # xmm0 = xmm0[2,1,2,3]
549 ; SSE2-NEXT:    pshuflw {{.*}}         # xmm0 = xmm0[0,0,2,3,4,5,6,7]
550 ; SSE2-NEXT:    punpcklwd %xmm1, %xmm0 # xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
551 ; SSE2-NEXT:    pshuflw {{.*}}         # xmm0 = xmm0[0,2,2,3,4,5,6,7]
552 ; SSE2-NEXT:    pshufhw {{.*}}         # xmm0 = xmm0[0,1,2,3,6,5,6,7]
553 ; SSE2-NEXT:    pshufd {{.*}}          # xmm0 = xmm0[0,2,2,3]
554 ; SSE2-NEXT:    retq
555 ;
556 ; SSSE3-LABEL: @shuffle_v8i16_443aXXXX
557 ; SSSE3:       # BB#0:
558 ; SSSE3-NEXT:    pshufd {{.*}}          # xmm0 = xmm0[2,1,2,3]
559 ; SSSE3-NEXT:    pshuflw {{.*}}         # xmm0 = xmm0[0,0,2,3,4,5,6,7]
560 ; SSSE3-NEXT:    punpcklwd %xmm1, %xmm0 # xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
561 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,4,5,12,13,10,11,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
562 ; SSSE3-NEXT:    retq
563   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 4, i32 4, i32 3, i32 10, i32 undef, i32 undef, i32 undef, i32 undef>
564   ret <8 x i16> %shuffle
565 }
566
567 define <8 x i16> @shuffle_v8i16_032dXXXX(<8 x i16> %a, <8 x i16> %b) {
568 ; SSE2-LABEL: @shuffle_v8i16_032dXXXX
569 ; SSE2:       # BB#0:
570 ; SSE2-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,1,2,3]
571 ; SSE2-NEXT:    punpcklwd %xmm1, %xmm0
572 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,3,2,3,4,5,6,7]
573 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,6,6,7]
574 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
575 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,3,2,1,4,5,6,7]
576 ; SSE2-NEXT:    retq
577 ;
578 ; SSSE3-LABEL: @shuffle_v8i16_032dXXXX
579 ; SSSE3:       # BB#0:
580 ; SSSE3-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,1,2,3]
581 ; SSSE3-NEXT:    punpcklwd %xmm1, %xmm0 # xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
582 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,12,13,8,9,6,7,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
583 ; SSSE3-NEXT:    retq
584   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 3, i32 2, i32 13, i32 undef, i32 undef, i32 undef, i32 undef>
585   ret <8 x i16> %shuffle
586 }
587 define <8 x i16> @shuffle_v8i16_XXXcXXXX(<8 x i16> %a, <8 x i16> %b) {
588 ; ALL-LABEL: @shuffle_v8i16_XXXcXXXX
589 ; ALL:       # BB#0:
590 ; ALL-NEXT:    pshufd {{.*}} # xmm0 = xmm1[2,1,2,3]
591 ; ALL-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[0,1,2,1,4,5,6,7]
592 ; ALL-NEXT:    retq
593   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 13, i32 undef, i32 undef, i32 undef, i32 undef>
594   ret <8 x i16> %shuffle
595 }
596
597 define <8 x i16> @shuffle_v8i16_012dXXXX(<8 x i16> %a, <8 x i16> %b) {
598 ; SSE2-LABEL: @shuffle_v8i16_012dXXXX
599 ; SSE2:       # BB#0:
600 ; SSE2-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,1,2,3]
601 ; SSE2-NEXT:    punpcklwd %xmm1, %xmm0
602 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[3,1,2,0]
603 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,6,6,7]
604 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,1,2,3]
605 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[1,2,0,3,4,5,6,7]
606 ; SSE2-NEXT:    retq
607 ;
608 ; SSSE3-LABEL: @shuffle_v8i16_012dXXXX
609 ; SSSE3:       # BB#0:
610 ; SSSE3-NEXT:    pshufd {{.*}} # xmm1 = xmm1[2,1,2,3]
611 ; SSSE3-NEXT:    punpcklwd %xmm1, %xmm0 # xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
612 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,4,5,8,9,6,7,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
613 ; SSSE3-NEXT:    retq
614   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 13, i32 undef, i32 undef, i32 undef, i32 undef>
615   ret <8 x i16> %shuffle
616 }
617
618 define <8 x i16> @shuffle_v8i16_XXXXcde3(<8 x i16> %a, <8 x i16> %b) {
619 ; SSE2-LABEL: @shuffle_v8i16_XXXXcde3
620 ; SSE2:       # BB#0:
621 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,2,1]
622 ; SSE2-NEXT:    punpckhwd %xmm0, %xmm1
623 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm1[0,2,2,3,4,5,6,7]
624 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,7,6,7]
625 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,0,2]
626 ; SSE2-NEXT:    retq
627 ;
628 ; SSSE3-LABEL: @shuffle_v8i16_XXXXcde3
629 ; SSSE3:       # BB#0:
630 ; SSSE3-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,2,1]
631 ; SSSE3-NEXT:    punpckhwd %xmm0, %xmm1 # xmm1 = xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
632 ; SSSE3-NEXT:    pshufb {{.*}} # xmm1 = xmm1[{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}},0,1,4,5,8,9,14,15]
633 ; SSSE3-NEXT:    movdqa %xmm1, %xmm0
634 ; SSSE3-NEXT:    retq
635   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 undef, i32 12, i32 13, i32 14, i32 3>
636   ret <8 x i16> %shuffle
637 }
638
639 define <8 x i16> @shuffle_v8i16_cde3XXXX(<8 x i16> %a, <8 x i16> %b) {
640 ; SSE2-LABEL: @shuffle_v8i16_cde3XXXX
641 ; SSE2:       # BB#0:
642 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,2,1]
643 ; SSE2-NEXT:    punpckhwd %xmm0, %xmm1
644 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm1[0,2,2,3,4,5,6,7]
645 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,7,6,7]
646 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,2,2,3]
647 ; SSE2-NEXT:    retq
648 ;
649 ; SSSE3-LABEL: @shuffle_v8i16_cde3XXXX
650 ; SSSE3:       # BB#0:
651 ; SSSE3-NEXT:    pshufd {{.*}} # xmm0 = xmm0[0,1,2,1]
652 ; SSSE3-NEXT:    punpckhwd %xmm0, %xmm1 # xmm1 = xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
653 ; SSSE3-NEXT:    pshufb {{.*}} # xmm1 = xmm1[0,1,4,5,8,9,14,15,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
654 ; SSSE3-NEXT:    movdqa %xmm1, %xmm0
655 ; SSSE3-NEXT:    retq
656   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 12, i32 13, i32 14, i32 3, i32 undef, i32 undef, i32 undef, i32 undef>
657   ret <8 x i16> %shuffle
658 }
659
660 define <8 x i16> @shuffle_v8i16_012dcde3(<8 x i16> %a, <8 x i16> %b) {
661 ; SSE2-LABEL: @shuffle_v8i16_012dcde3
662 ; SSE2:       # BB#0:
663 ; SSE2-NEXT:    pshufd {{.*}} # xmm2 = xmm0[0,1,2,1]
664 ; SSE2-NEXT:    pshufd {{.*}} # xmm3 = xmm1[2,1,2,3]
665 ; SSE2-NEXT:    punpckhwd %xmm2, %xmm1
666 ; SSE2-NEXT:    pshuflw {{.*}} # xmm1 = xmm1[0,2,2,3,4,5,6,7]
667 ; SSE2-NEXT:    pshufhw {{.*}} # xmm1 = xmm1[0,1,2,3,4,7,6,7]
668 ; SSE2-NEXT:    pshufd {{.*}} # xmm1 = xmm1[0,2,2,3]
669 ; SSE2-NEXT:    punpcklwd %xmm3, %xmm0
670 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[3,1,2,0]
671 ; SSE2-NEXT:    pshufhw {{.*}} # xmm0 = xmm0[0,1,2,3,4,6,6,7]
672 ; SSE2-NEXT:    pshufd {{.*}} # xmm0 = xmm0[2,1,2,3]
673 ; SSE2-NEXT:    pshuflw {{.*}} # xmm0 = xmm0[1,2,0,3,4,5,6,7]
674 ; SSE2-NEXT:    punpcklqdq %xmm1, %xmm0
675 ; SSE2-NEXT:    retq
676 ;
677 ; SSSE3-LABEL: @shuffle_v8i16_012dcde3
678 ; SSSE3:       # BB#0:
679 ; SSSE3-NEXT:    pshufd {{.*}} # xmm2 = xmm0[0,1,2,1]
680 ; SSSE3-NEXT:    pshufd {{.*}} # xmm3 = xmm1[2,1,2,3]
681 ; SSSE3-NEXT:    punpckhwd %xmm2, %xmm1 # xmm1 = xmm1[4],xmm2[4],xmm1[5],xmm2[5],xmm1[6],xmm2[6],xmm1[7],xmm2[7]
682 ; SSSE3-NEXT:    pshufb {{.*}} # xmm1 = xmm1[0,1,4,5,8,9,14,15,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
683 ; SSSE3-NEXT:    punpcklwd %xmm3, %xmm0 # xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3]
684 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[0,1,4,5,8,9,6,7,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
685 ; SSSE3-NEXT:    punpcklqdq %xmm1, %xmm0
686 ; SSSE3-NEXT:    retq
687   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 0, i32 1, i32 2, i32 13, i32 12, i32 13, i32 14, i32 3>
688   ret <8 x i16> %shuffle
689 }
690
691 define <8 x i16> @shuffle_v8i16_XXX1X579(<8 x i16> %a, <8 x i16> %b) {
692 ; SSE2-LABEL: @shuffle_v8i16_XXX1X579
693 ; SSE2:       # BB#0:
694 ; SSE2-NEXT:    pshufhw {{.*}}   # xmm0 = xmm0[0,1,2,3,7,5,6,7]
695 ; SSE2-NEXT:    pshufd {{.*}}    # xmm0 = xmm0[0,2,2,3]
696 ; SSE2-NEXT:    pshuflw {{.*}}   # xmm0 = xmm0[0,1,3,2,4,5,6,7]
697 ; SSE2-NEXT:    punpcklwd {{.*}} # xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
698 ; SSE2-NEXT:    pshufhw {{.*}}   # xmm0 = xmm0[0,1,2,3,4,6,6,7]
699 ; SSE2-NEXT:    pshufd {{.*}}    # xmm0 = xmm0[0,1,2,1]
700 ; SSE2-NEXT:    pshuflw {{.*}}   # xmm0 = xmm0[0,1,2,2,4,5,6,7]
701 ; SSE2-NEXT:    pshufhw {{.*}}   # xmm0 = xmm0[0,1,2,3,4,4,5,7]
702 ; SSE2-NEXT:    retq
703 ;
704 ; SSSE3-LABEL: @shuffle_v8i16_XXX1X579
705 ; SSSE3:       # BB#0:
706 ; SSSE3-NEXT:    pshufb {{.*}}    # xmm0 = xmm0[{{[0-9]+,[0-9]+}},2,3,10,11,14,15,{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}}]
707 ; SSSE3-NEXT:    punpcklwd {{.*}} # xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
708 ; SSSE3-NEXT:    pshufb {{.*}}    # xmm0 = xmm0[{{[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+,[0-9]+}},4,5,{{[0-9]+,[0-9]+}},8,9,12,13,6,7]
709 ; SSSE3-NEXT:    retq
710   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 undef, i32 undef, i32 undef, i32 1, i32 undef, i32 5, i32 7, i32 9>
711   ret <8 x i16> %shuffle
712 }
713
714 define <8 x i16> @shuffle_v8i16_XX4X8acX(<8 x i16> %a, <8 x i16> %b) {
715 ; SSE2-LABEL: @shuffle_v8i16_XX4X8acX
716 ; SSE2:       # BB#0:
717 ; SSE2-NEXT:    pshufd {{.*}}    # xmm0 = xmm0[2,1,2,3]
718 ; SSE2-NEXT:    pshuflw {{.*}}   # xmm1 = xmm1[0,2,2,3,4,5,6,7]
719 ; SSE2-NEXT:    pshufd {{.*}}    # xmm1 = xmm1[0,2,2,3]
720 ; SSE2-NEXT:    punpcklwd {{.*}} # xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3]
721 ; SSE2-NEXT:    pshuflw {{.*}}   # xmm0 = xmm1[0,1,2,0,4,5,6,7]
722 ; SSE2-NEXT:    pshufd {{.*}}    # xmm0 = xmm0[0,1,2,1]
723 ; SSE2-NEXT:    pshuflw {{.*}}   # xmm0 = xmm0[0,1,1,3,4,5,6,7]
724 ; SSE2-NEXT:    pshufhw {{.*}}   # xmm0 = xmm0[0,1,2,3,7,6,4,7]
725 ; SSE2-NEXT:    retq
726 ;
727 ; SSSE3-LABEL: @shuffle_v8i16_XX4X8acX
728 ; SSSE3:       # BB#0:
729 ; SSSE3-NEXT:    pshufd {{.*}}    # [[X:xmm[0-9]+]] = xmm0[2,1,2,3]
730 ; SSSE3-NEXT:    pshuflw {{.*}}   # xmm0 = xmm1[0,2,2,3,4,5,6,7]
731 ; SSSE3-NEXT:    pshufd {{.*}}    # xmm0 = xmm0[0,2,2,3]
732 ; SSSE3-NEXT:    punpcklwd {{.*}} # xmm0 = xmm0[0],[[X]][0],xmm0[1],[[X]][1],xmm0[2],[[X]][2],xmm0[3],[[X]][3]
733 ; SSSE3-NEXT:    pshufb {{.*}} # xmm0 = xmm0[{{[0-9]+,[0-9]+,[0-9]+,[0-9]+}},2,3,{{[0-9]+,[0-9]+}},0,1,4,5,8,9,{{[0-9]+,[0-9]+}}]
734 ; SSSE3-NEXT:    retq
735   %shuffle = shufflevector <8 x i16> %a, <8 x i16> %b, <8 x i32> <i32 undef, i32 undef, i32 4, i32 undef, i32 8, i32 10, i32 12, i32 undef>
736   ret <8 x i16> %shuffle
737 }