[InstCombine] add tests to show potential vector IR shuffle transforms
[oota-llvm.git] / test / Transforms / InstCombine / insert-extract-shuffle.ll
1 ; RUN: opt -S -instcombine %s | FileCheck %s
2
3 define <1 x i8> @test1(<8 x i8> %in) {
4 ; CHECK-LABEL: @test1
5 ; CHECK: shufflevector <8 x i8> %in, <8 x i8> undef, <1 x i32> <i32 5>
6   %val = extractelement <8 x i8> %in, i32 5
7   %vec = insertelement <1 x i8> undef, i8 %val, i32 0
8   ret <1 x i8> %vec
9 }
10
11 define <4 x i16> @test2(<8 x i16> %in, <8 x i16> %in2) {
12 ; CHECK-LABEL: @test2
13 ; CHECK: shufflevector <8 x i16> %in2, <8 x i16> %in, <4 x i32> <i32 11, i32 9, i32 0, i32 10>
14   %elt0 = extractelement <8 x i16> %in, i32 3
15   %elt1 = extractelement <8 x i16> %in, i32 1
16   %elt2 = extractelement <8 x i16> %in2, i32 0
17   %elt3 = extractelement <8 x i16> %in, i32 2
18
19   %vec.0 = insertelement <4 x i16> undef, i16 %elt0, i32 0
20   %vec.1 = insertelement <4 x i16> %vec.0, i16 %elt1, i32 1
21   %vec.2 = insertelement <4 x i16> %vec.1, i16 %elt2, i32 2
22   %vec.3 = insertelement <4 x i16> %vec.2, i16 %elt3, i32 3
23
24   ret <4 x i16> %vec.3
25 }
26
27 define <2 x i64> @test_vcopyq_lane_p64(<2 x i64> %a, <1 x i64> %b) {
28 ; CHECK-LABEL: @test_vcopyq_lane_p64
29 ; CHECK-NEXT: extractelement
30 ; CHECK-NEXT: insertelement
31 ; CHECK-NEXT: ret <2 x i64> %res
32   %elt = extractelement <1 x i64> %b, i32 0
33   %res = insertelement <2 x i64> %a, i64 %elt, i32 1
34   ret <2 x i64> %res
35 }
36
37 ; PR2109: https://llvm.org/bugs/show_bug.cgi?id=2109
38
39 define <4 x float> @widen_extract2(<4 x float> %ins, <2 x float> %ext) {
40 ; CHECK-LABEL: @widen_extract2(
41 ; CHECK-NEXT: extractelement
42 ; CHECK-NEXT: extractelement
43 ; CHECK-NEXT: insertelement
44 ; CHECK-NEXT: insertelement
45 ; CHECK-NEXT: ret <4 x float> %i2
46   %e1 = extractelement <2 x float> %ext, i32 0
47   %e2 = extractelement <2 x float> %ext, i32 1
48   %i1 = insertelement <4 x float> %ins, float %e1, i32 1
49   %i2 = insertelement <4 x float> %i1, float %e2, i32 3
50   ret <4 x float> %i2
51 }
52
53 define <4 x float> @widen_extract3(<4 x float> %ins, <3 x float> %ext) {
54 ; CHECK-LABEL: @widen_extract3(
55 ; CHECK-NEXT: extractelement
56 ; CHECK-NEXT: extractelement
57 ; CHECK-NEXT: extractelement
58 ; CHECK-NEXT: insertelement
59 ; CHECK-NEXT: insertelement
60 ; CHECK-NEXT: insertelement
61 ; CHECK-NEXT: ret <4 x float> %i3
62   %e1 = extractelement <3 x float> %ext, i32 0
63   %e2 = extractelement <3 x float> %ext, i32 1
64   %e3 = extractelement <3 x float> %ext, i32 2
65   %i1 = insertelement <4 x float> %ins, float %e1, i32 2
66   %i2 = insertelement <4 x float> %i1, float %e2, i32 1
67   %i3 = insertelement <4 x float> %i2, float %e3, i32 0
68   ret <4 x float> %i3
69 }
70
71 define <8 x float> @too_wide(<8 x float> %ins, <2 x float> %ext) {
72 ; CHECK-LABEL: @too_wide(
73 ; CHECK-NEXT: extractelement
74 ; CHECK-NEXT: insertelement
75 ; CHECK-NEXT: ret <8 x float> %i1
76   %e1 = extractelement <2 x float> %ext, i32 0
77   %i1 = insertelement <8 x float> %ins, float %e1, i32 2
78   ret <8 x float> %i1
79 }
80