[X86] Emulate AVX 256bit MIN/MAX support by splitting the vector.
[oota-llvm.git] / test / CodeGen / X86 / vec_split.ll
1 ; RUN: llc -march=x86-64 -mcpu=corei7 < %s | FileCheck %s -check-prefix=SSE4
2 ; RUN: llc -march=x86-64 -mcpu=corei7-avx < %s | FileCheck %s -check-prefix=AVX1
3 ; RUN: llc -march=x86-64 -mcpu=core-avx2 < %s | FileCheck %s -check-prefix=AVX2
4
5 define <16 x i16> @split16(<16 x i16> %a, <16 x i16> %b, <16 x i8> %__mask) {
6 ; SSE4-LABEL: split16:
7 ; SSE4: pminuw
8 ; SSE4: pminuw
9 ; AVX1-LABEL: split16:
10 ; AVX1: vpminuw
11 ; AVX1: vpminuw
12 ; AVX2-LABEL: split16:
13 ; AVX2: vpminuw
14 ; AVX2: ret
15   %1 = icmp ult <16 x i16> %a, %b
16   %2 = select <16 x i1> %1, <16 x i16> %a, <16 x i16> %b
17   ret <16 x i16> %2
18 }
19
20 define <32 x i16> @split32(<32 x i16> %a, <32 x i16> %b, <32 x i8> %__mask) {
21 ; SSE4-LABEL: split32:
22 ; SSE4: pminuw
23 ; SSE4: pminuw
24 ; SSE4: pminuw
25 ; SSE4: pminuw
26 ; AVX1-LABEL: split32:
27 ; AVX1: vpminuw
28 ; AVX1: vpminuw
29 ; AVX1: vpminuw
30 ; AVX1: vpminuw
31 ; AVX2-LABEL: split32:
32 ; AVX2: vpminuw
33 ; AVX2: vpminuw
34 ; AVX2: ret
35   %1 = icmp ult <32 x i16> %a, %b
36   %2 = select <32 x i1> %1, <32 x i16> %a, <32 x i16> %b
37   ret <32 x i16> %2
38 }