[X86][SSE] Fixed arch/triple and regenerated results.
[oota-llvm.git] / test / CodeGen / X86 / 2011-20-21-zext-ui2fp.ll
1 ; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mcpu=corei7 | FileCheck %s
2
3 ; Check that the booleans are converted using zext and not via sext.
4 ; 0x1 means that we only look at the first bit.
5
6 define void @ui_to_fp_conv(<8 x float> * nocapture %aFOO, <8 x float>* nocapture %RET) nounwind {
7 ; CHECK: 0x1
8 ; CHECK-LABEL: ui_to_fp_conv:
9 ; CHECK:       # BB#0: # %allocas
10 ; CHECK-NEXT:    movaps {{.*#+}} xmm0 = [1.000000e+00,1.000000e+00,3.000000e+00,3.000000e+00]
11 ; CHECK-NEXT:    cmpltps {{.*}}(%rip), %xmm0
12 ; CHECK-NEXT:    pshufb {{.*#+}} xmm0 = xmm0[0,1,4,5,8,9,12,13,8,9,12,13,12,13,14,15]
13 ; CHECK-NEXT:    pxor %xmm1, %xmm1
14 ; CHECK-NEXT:    punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
15 ; CHECK-NEXT:    psllw $15, %xmm0
16 ; CHECK-NEXT:    psraw $15, %xmm0
17 ; CHECK-NEXT:    pmovzxwd {{.*#+}} xmm1 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
18 ; CHECK-NEXT:    movdqa {{.*#+}} xmm2 = [1,1,1,1]
19 ; CHECK-NEXT:    pand %xmm2, %xmm1
20 ; CHECK-NEXT:    movdqa {{.*#+}} xmm3 = [1258291200,1258291200,1258291200,1258291200]
21 ; CHECK-NEXT:    movdqa %xmm1, %xmm4
22 ; CHECK-NEXT:    pblendw {{.*#+}} xmm4 = xmm4[0],xmm3[1],xmm4[2],xmm3[3],xmm4[4],xmm3[5],xmm4[6],xmm3[7]
23 ; CHECK-NEXT:    psrld $16, %xmm1
24 ; CHECK-NEXT:    movdqa {{.*#+}} xmm5 = [1392508928,1392508928,1392508928,1392508928]
25 ; CHECK-NEXT:    pblendw {{.*#+}} xmm1 = xmm1[0],xmm5[1],xmm1[2],xmm5[3],xmm1[4],xmm5[5],xmm1[6],xmm5[7]
26 ; CHECK-NEXT:    movaps {{.*#+}} xmm6 = [-5.497642e+11,-5.497642e+11,-5.497642e+11,-5.497642e+11]
27 ; CHECK-NEXT:    addps %xmm6, %xmm1
28 ; CHECK-NEXT:    addps %xmm4, %xmm1
29 ; CHECK-NEXT:    punpckhwd {{.*#+}} xmm0 = xmm0[4,4,5,5,6,6,7,7]
30 ; CHECK-NEXT:    pand %xmm2, %xmm0
31 ; CHECK-NEXT:    pblendw {{.*#+}} xmm3 = xmm0[0],xmm3[1],xmm0[2],xmm3[3],xmm0[4],xmm3[5],xmm0[6],xmm3[7]
32 ; CHECK-NEXT:    psrld $16, %xmm0
33 ; CHECK-NEXT:    pblendw {{.*#+}} xmm0 = xmm0[0],xmm5[1],xmm0[2],xmm5[3],xmm0[4],xmm5[5],xmm0[6],xmm5[7]
34 ; CHECK-NEXT:    addps %xmm6, %xmm0
35 ; CHECK-NEXT:    addps %xmm3, %xmm0
36 ; CHECK-NEXT:    movups %xmm0, 16(%rsi)
37 ; CHECK-NEXT:    movups %xmm1, (%rsi)
38 ; CHECK-NEXT:    retq
39 allocas:
40   %bincmp = fcmp olt <8 x float> <float 1.000000e+00, float 1.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00> , <float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00, float 3.000000e+00>
41   %bool2float = uitofp <8 x i1> %bincmp to <8 x float>
42   store <8 x float> %bool2float, <8 x float>* %RET, align 4
43   ret void
44 }
45
46
47