Add a triple to switch.ll test.
[oota-llvm.git] / test / CodeGen / X86 / avx-arith.ll
1 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=corei7-avx -mattr=+avx | FileCheck %s
2
3 ; CHECK: vaddpd
4 define <4 x double> @addpd256(<4 x double> %y, <4 x double> %x) nounwind uwtable readnone ssp {
5 entry:
6   %add.i = fadd <4 x double> %x, %y
7   ret <4 x double> %add.i
8 }
9
10 ; CHECK: vaddpd LCP{{.*}}(%rip)
11 define <4 x double> @addpd256fold(<4 x double> %y) nounwind uwtable readnone ssp {
12 entry:
13   %add.i = fadd <4 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
14   ret <4 x double> %add.i
15 }
16
17 ; CHECK: vaddps
18 define <8 x float> @addps256(<8 x float> %y, <8 x float> %x) nounwind uwtable readnone ssp {
19 entry:
20   %add.i = fadd <8 x float> %x, %y
21   ret <8 x float> %add.i
22 }
23
24 ; CHECK: vaddps LCP{{.*}}(%rip)
25 define <8 x float> @addps256fold(<8 x float> %y) nounwind uwtable readnone ssp {
26 entry:
27   %add.i = fadd <8 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>
28   ret <8 x float> %add.i
29 }
30
31 ; CHECK: vsubpd
32 define <4 x double> @subpd256(<4 x double> %y, <4 x double> %x) nounwind uwtable readnone ssp {
33 entry:
34   %sub.i = fsub <4 x double> %x, %y
35   ret <4 x double> %sub.i
36 }
37
38 ; CHECK: vsubpd (%
39 define <4 x double> @subpd256fold(<4 x double> %y, <4 x double>* nocapture %x) nounwind uwtable readonly ssp {
40 entry:
41   %tmp2 = load <4 x double>, <4 x double>* %x, align 32
42   %sub.i = fsub <4 x double> %y, %tmp2
43   ret <4 x double> %sub.i
44 }
45
46 ; CHECK: vsubps
47 define <8 x float> @subps256(<8 x float> %y, <8 x float> %x) nounwind uwtable readnone ssp {
48 entry:
49   %sub.i = fsub <8 x float> %x, %y
50   ret <8 x float> %sub.i
51 }
52
53 ; CHECK: vsubps (%
54 define <8 x float> @subps256fold(<8 x float> %y, <8 x float>* nocapture %x) nounwind uwtable readonly ssp {
55 entry:
56   %tmp2 = load <8 x float>, <8 x float>* %x, align 32
57   %sub.i = fsub <8 x float> %y, %tmp2
58   ret <8 x float> %sub.i
59 }
60
61 ; CHECK: vmulpd
62 define <4 x double> @mulpd256(<4 x double> %y, <4 x double> %x) nounwind uwtable readnone ssp {
63 entry:
64   %mul.i = fmul <4 x double> %x, %y
65   ret <4 x double> %mul.i
66 }
67
68 ; CHECK: vmulpd LCP{{.*}}(%rip)
69 define <4 x double> @mulpd256fold(<4 x double> %y) nounwind uwtable readnone ssp {
70 entry:
71   %mul.i = fmul <4 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
72   ret <4 x double> %mul.i
73 }
74
75 ; CHECK: vmulps
76 define <8 x float> @mulps256(<8 x float> %y, <8 x float> %x) nounwind uwtable readnone ssp {
77 entry:
78   %mul.i = fmul <8 x float> %x, %y
79   ret <8 x float> %mul.i
80 }
81
82 ; CHECK: vmulps LCP{{.*}}(%rip)
83 define <8 x float> @mulps256fold(<8 x float> %y) nounwind uwtable readnone ssp {
84 entry:
85   %mul.i = fmul <8 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>
86   ret <8 x float> %mul.i
87 }
88
89 ; CHECK: vdivpd
90 define <4 x double> @divpd256(<4 x double> %y, <4 x double> %x) nounwind uwtable readnone ssp {
91 entry:
92   %div.i = fdiv <4 x double> %x, %y
93   ret <4 x double> %div.i
94 }
95
96 ; CHECK: vdivpd LCP{{.*}}(%rip)
97 define <4 x double> @divpd256fold(<4 x double> %y) nounwind uwtable readnone ssp {
98 entry:
99   %div.i = fdiv <4 x double> %y, <double 4.500000e+00, double 3.400000e+00, double 2.300000e+00, double 1.200000e+00>
100   ret <4 x double> %div.i
101 }
102
103 ; CHECK: vdivps
104 define <8 x float> @divps256(<8 x float> %y, <8 x float> %x) nounwind uwtable readnone ssp {
105 entry:
106   %div.i = fdiv <8 x float> %x, %y
107   ret <8 x float> %div.i
108 }
109
110 ; CHECK: vdivps LCP{{.*}}(%rip)
111 define <8 x float> @divps256fold(<8 x float> %y) nounwind uwtable readnone ssp {
112 entry:
113   %div.i = fdiv <8 x float> %y, <float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000, float 4.500000e+00, float 0x400B333340000000, float 0x4002666660000000, float 0x3FF3333340000000>
114   ret <8 x float> %div.i
115 }
116
117 ; CHECK: vsqrtss
118 define float @sqrtA(float %a) nounwind uwtable readnone ssp {
119 entry:
120   %conv1 = tail call float @sqrtf(float %a) nounwind readnone
121   ret float %conv1
122 }
123
124 declare double @sqrt(double) readnone
125
126 ; CHECK: vsqrtsd
127 define double @sqrtB(double %a) nounwind uwtable readnone ssp {
128 entry:
129   %call = tail call double @sqrt(double %a) nounwind readnone
130   ret double %call
131 }
132
133 declare float @sqrtf(float) readnone
134
135
136 ; CHECK: vextractf128 $1
137 ; CHECK-NEXT: vextractf128 $1
138 ; CHECK-NEXT: vpaddq %xmm
139 ; CHECK-NEXT: vpaddq %xmm
140 ; CHECK-NEXT: vinsertf128 $1
141 define <4 x i64> @vpaddq(<4 x i64> %i, <4 x i64> %j) nounwind readnone {
142   %x = add <4 x i64> %i, %j
143   ret <4 x i64> %x
144 }
145
146 ; CHECK: vextractf128 $1
147 ; CHECK-NEXT: vextractf128 $1
148 ; CHECK-NEXT: vpaddd %xmm
149 ; CHECK-NEXT: vpaddd %xmm
150 ; CHECK-NEXT: vinsertf128 $1
151 define <8 x i32> @vpaddd(<8 x i32> %i, <8 x i32> %j) nounwind readnone {
152   %x = add <8 x i32> %i, %j
153   ret <8 x i32> %x
154 }
155
156 ; CHECK: vextractf128 $1
157 ; CHECK-NEXT: vextractf128 $1
158 ; CHECK-NEXT: vpaddw %xmm
159 ; CHECK-NEXT: vpaddw %xmm
160 ; CHECK-NEXT: vinsertf128 $1
161 define <16 x i16> @vpaddw(<16 x i16> %i, <16 x i16> %j) nounwind readnone {
162   %x = add <16 x i16> %i, %j
163   ret <16 x i16> %x
164 }
165
166 ; CHECK: vextractf128 $1
167 ; CHECK-NEXT: vextractf128 $1
168 ; CHECK-NEXT: vpaddb %xmm
169 ; CHECK-NEXT: vpaddb %xmm
170 ; CHECK-NEXT: vinsertf128 $1
171 define <32 x i8> @vpaddb(<32 x i8> %i, <32 x i8> %j) nounwind readnone {
172   %x = add <32 x i8> %i, %j
173   ret <32 x i8> %x
174 }
175
176 ; CHECK: vextractf128 $1
177 ; CHECK-NEXT: vextractf128 $1
178 ; CHECK-NEXT: vpsubq %xmm
179 ; CHECK-NEXT: vpsubq %xmm
180 ; CHECK-NEXT: vinsertf128 $1
181 define <4 x i64> @vpsubq(<4 x i64> %i, <4 x i64> %j) nounwind readnone {
182   %x = sub <4 x i64> %i, %j
183   ret <4 x i64> %x
184 }
185
186 ; CHECK: vextractf128 $1
187 ; CHECK-NEXT: vextractf128 $1
188 ; CHECK-NEXT: vpsubd %xmm
189 ; CHECK-NEXT: vpsubd %xmm
190 ; CHECK-NEXT: vinsertf128 $1
191 define <8 x i32> @vpsubd(<8 x i32> %i, <8 x i32> %j) nounwind readnone {
192   %x = sub <8 x i32> %i, %j
193   ret <8 x i32> %x
194 }
195
196 ; CHECK: vextractf128 $1
197 ; CHECK-NEXT: vextractf128 $1
198 ; CHECK-NEXT: vpsubw %xmm
199 ; CHECK-NEXT: vpsubw %xmm
200 ; CHECK-NEXT: vinsertf128 $1
201 define <16 x i16> @vpsubw(<16 x i16> %i, <16 x i16> %j) nounwind readnone {
202   %x = sub <16 x i16> %i, %j
203   ret <16 x i16> %x
204 }
205
206 ; CHECK: vextractf128 $1
207 ; CHECK-NEXT: vextractf128 $1
208 ; CHECK-NEXT: vpsubb %xmm
209 ; CHECK-NEXT: vpsubb %xmm
210 ; CHECK-NEXT: vinsertf128 $1
211 define <32 x i8> @vpsubb(<32 x i8> %i, <32 x i8> %j) nounwind readnone {
212   %x = sub <32 x i8> %i, %j
213   ret <32 x i8> %x
214 }
215
216 ; CHECK: vextractf128 $1
217 ; CHECK-NEXT: vextractf128 $1
218 ; CHECK-NEXT: vpmulld %xmm
219 ; CHECK-NEXT: vpmulld %xmm
220 ; CHECK-NEXT: vinsertf128 $1
221 define <8 x i32> @vpmulld(<8 x i32> %i, <8 x i32> %j) nounwind readnone {
222   %x = mul <8 x i32> %i, %j
223   ret <8 x i32> %x
224 }
225
226 ; CHECK: vextractf128 $1
227 ; CHECK-NEXT: vextractf128 $1
228 ; CHECK-NEXT: vpmullw %xmm
229 ; CHECK-NEXT: vpmullw %xmm
230 ; CHECK-NEXT: vinsertf128 $1
231 define <16 x i16> @vpmullw(<16 x i16> %i, <16 x i16> %j) nounwind readnone {
232   %x = mul <16 x i16> %i, %j
233   ret <16 x i16> %x
234 }
235
236 ; CHECK: vextractf128 $1
237 ; CHECK-NEXT: vextractf128 $1
238 ; CHECK-NEXT: vpmuludq %xmm
239 ; CHECK-NEXT: vpsrlq $32, %xmm
240 ; CHECK-NEXT: vpmuludq %xmm
241 ; CHECK-NEXT: vpsllq $32, %xmm
242 ; CHECK-NEXT: vpaddq %xmm
243 ; CHECK-NEXT: vpsrlq $32, %xmm
244 ; CHECK-NEXT: vpmuludq %xmm
245 ; CHECK-NEXT: vpsllq $32, %xmm
246 ; CHECK-NEXT: vpaddq %xmm
247 ; CHECK-NEXT: vpmuludq %xmm
248 ; CHECK-NEXT: vpsrlq $32, %xmm
249 ; CHECK-NEXT: vpmuludq %xmm
250 ; CHECK-NEXT: vpsllq $32, %xmm
251 ; CHECK-NEXT: vpaddq %xmm
252 ; CHECK-NEXT: vpsrlq $32, %xmm
253 ; CHECK-NEXT: vpmuludq %xmm
254 ; CHECK-NEXT: vpsllq $32, %xmm
255 ; CHECK-NEXT: vpaddq %xmm
256 ; CHECK-NEXT: vinsertf128 $1
257 define <4 x i64> @mul-v4i64(<4 x i64> %i, <4 x i64> %j) nounwind readnone {
258   %x = mul <4 x i64> %i, %j
259   ret <4 x i64> %x
260 }
261
262 declare <4 x float> @llvm.x86.sse.sqrt.ss(<4 x float>) nounwind readnone
263
264 define <4 x float> @int_sqrt_ss() {
265 ; CHECK: int_sqrt_ss
266 ; CHECK: vsqrtss
267  %x0 = load float, float addrspace(1)* undef, align 8
268  %x1 = insertelement <4 x float> undef, float %x0, i32 0
269  %x2 = call <4 x float> @llvm.x86.sse.sqrt.ss(<4 x float> %x1) nounwind
270  ret <4 x float> %x2
271 }