fix for PR20354 - Miscompile of fabs due to vectorization
[oota-llvm.git] / test / CodeGen / X86 / vec_fabs.ll
1 ; RUN: llc < %s -march=x86 -mattr=+avx | FileCheck %s
2
3
4 define <2 x double> @fabs_v2f64(<2 x double> %p)
5 {
6   ; CHECK-LABEL: fabs_v2f64
7   ; CHECK: vandps
8   %t = call <2 x double> @llvm.fabs.v2f64(<2 x double> %p)
9   ret <2 x double> %t
10 }
11 declare <2 x double> @llvm.fabs.v2f64(<2 x double> %p)
12
13 define <4 x float> @fabs_v4f32(<4 x float> %p)
14 {
15   ; CHECK-LABEL: fabs_v4f32
16   ; CHECK: vandps
17   %t = call <4 x float> @llvm.fabs.v4f32(<4 x float> %p)
18   ret <4 x float> %t
19 }
20 declare <4 x float> @llvm.fabs.v4f32(<4 x float> %p)
21
22 define <4 x double> @fabs_v4f64(<4 x double> %p)
23 {
24   ; CHECK-LABEL: fabs_v4f64
25   ; CHECK: vandps
26   %t = call <4 x double> @llvm.fabs.v4f64(<4 x double> %p)
27   ret <4 x double> %t
28 }
29 declare <4 x double> @llvm.fabs.v4f64(<4 x double> %p)
30
31 define <8 x float> @fabs_v8f32(<8 x float> %p)
32 {
33   ; CHECK-LABEL: fabs_v8f32
34   ; CHECK: vandps
35   %t = call <8 x float> @llvm.fabs.v8f32(<8 x float> %p)
36   ret <8 x float> %t
37 }
38 declare <8 x float> @llvm.fabs.v8f32(<8 x float> %p)
39
40 ; PR20354: when generating code for a vector fabs op,
41 ; make sure the correct mask is used for all vector elements.
42 ; CHECK-LABEL: LCPI4_0
43 ; CHECK: .long  2147483648
44 ; CHECK: .long  2147483648
45 ; CHECK-LABEL: LCPI4_1 
46 ; CHECK: .long  2147483647
47 ; CHECK: .long  2147483647
48 ; CHECK-LABEL: fabs_v2f32_1
49 ; CHECK: vmovdqa LCPI4_0, %xmm0
50 ; CHECK: vpand   LCPI4_1, %xmm0, %xmm0
51 ; CHECK: vmovd   %xmm0, %eax
52 ; CHECK: vpextrd $1, %xmm0, %edx
53 define i64 @fabs_v2f32_1() {
54   %highbits = bitcast i64 9223372039002259456 to <2 x float> ; 0x8000_0000_8000_0000
55   %fabs = call <2 x float> @llvm.fabs.v2f32(<2 x float> %highbits)
56   %ret = bitcast <2 x float> %fabs to i64
57   ret i64 %ret
58 }
59
60 declare <2 x float> @llvm.fabs.v2f32(<2 x float> %p)