Merging r261039:

[oota-llvm.git] / test / CodeGen / X86 / vselect.ll
diff --git a/test/CodeGen/X86/vselect.ll b/test/CodeGen/X86/vselect.ll

index 3bd1dc4cb97239533db989e3fe3bcd4298ae1e8c..359ea7eb3ee5af6eae563f504835d2696edc4ab5 100644 (file)
--- a/test/CodeGen/X86/vselect.ll
+++ b/test/CodeGen/X86/vselect.ll
@@ -1,4 +1,5 @@
-; RUN: llc -mtriple=x86_64-unknown-unknown -mcpu=corei7 -mattr=-sse4.1 < %s | FileCheck %s
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc -mtriple=x86_64-unknown-unknown -mattr=+sse2,-sse4.1 < %s | FileCheck %s
  
  ; Verify that we don't emit packed vector shifts instructions if the
  ; condition used by the vector select is a vector of constants.
@@ -6,9 +7,8 @@
  define <4 x float> @test1(<4 x float> %a, <4 x float> %b) {
  ; CHECK-LABEL: test1:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    andps {{.*}}(%rip), %xmm1
-; CHECK-NEXT:    andps {{.*}}(%rip), %xmm0
-; CHECK-NEXT:    orps %xmm1, %xmm0
+; CHECK-NEXT:    shufps {{.*#+}} xmm0 = xmm0[0,2],xmm1[1,3]
+; CHECK-NEXT:    shufps {{.*#+}} xmm0 = xmm0[0,2,1,3]
  ; CHECK-NEXT:    retq
    %1 = select <4 x i1> <i1 true, i1 false, i1 true, i1 false>, <4 x float> %a, <4 x float> %b
    ret <4 x float> %1
@@ -17,8 +17,8 @@ define <4 x float> @test1(<4 x float> %a, <4 x float> %b) {
  define <4 x float> @test2(<4 x float> %a, <4 x float> %b) {
  ; CHECK-LABEL: test2:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movsd %xmm0, %xmm1
-; CHECK-NEXT:    movaps %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
+; CHECK-NEXT:    movapd %xmm1, %xmm0
  ; CHECK-NEXT:    retq
    %1 = select <4 x i1> <i1 true, i1 true, i1 false, i1 false>, <4 x float> %a, <4 x float> %b
    ret <4 x float> %1
@@ -27,7 +27,7 @@ define <4 x float> @test2(<4 x float> %a, <4 x float> %b) {
  define <4 x float> @test3(<4 x float> %a, <4 x float> %b) {
  ; CHECK-LABEL: test3:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movsd %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
  ; CHECK-NEXT:    retq
    %1 = select <4 x i1> <i1 false, i1 false, i1 true, i1 true>, <4 x float> %a, <4 x float> %b
    ret <4 x float> %1
@@ -53,10 +53,6 @@ define <4 x float> @test5(<4 x float> %a, <4 x float> %b) {
  define <8 x i16> @test6(<8 x i16> %a, <8 x i16> %b) {
  ; CHECK-LABEL: test6:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movaps {{.*#+}} xmm1 = [0,65535,0,65535,0,65535,0,65535]
-; CHECK-NEXT:    andps %xmm0, %xmm1
-; CHECK-NEXT:    andps {{.*}}(%rip), %xmm0
-; CHECK-NEXT:    orps %xmm1, %xmm0
  ; CHECK-NEXT:    retq
    %1 = select <8 x i1> <i1 true, i1 false, i1 true, i1 false, i1 true, i1 false, i1 true, i1 false>, <8 x i16> %a, <8 x i16> %a
    ret <8 x i16> %1
@@ -65,9 +61,8 @@ define <8 x i16> @test6(<8 x i16> %a, <8 x i16> %b) {
  define <8 x i16> @test7(<8 x i16> %a, <8 x i16> %b) {
  ; CHECK-LABEL: test7:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    andps {{.*}}(%rip), %xmm1
-; CHECK-NEXT:    andps {{.*}}(%rip), %xmm0
-; CHECK-NEXT:    orps %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
+; CHECK-NEXT:    movapd %xmm1, %xmm0
  ; CHECK-NEXT:    retq
    %1 = select <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 false, i1 false, i1 false, i1 false>, <8 x i16> %a, <8 x i16> %b
    ret <8 x i16> %1
@@ -76,9 +71,7 @@ define <8 x i16> @test7(<8 x i16> %a, <8 x i16> %b) {
  define <8 x i16> @test8(<8 x i16> %a, <8 x i16> %b) {
  ; CHECK-LABEL: test8:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    andps {{.*}}(%rip), %xmm1
-; CHECK-NEXT:    andps {{.*}}(%rip), %xmm0
-; CHECK-NEXT:    orps %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
  ; CHECK-NEXT:    retq
    %1 = select <8 x i1> <i1 false, i1 false, i1 false, i1 false, i1 true, i1 true, i1 true, i1 true>, <8 x i16> %a, <8 x i16> %b
    ret <8 x i16> %1
@@ -104,7 +97,7 @@ define <8 x i16> @test10(<8 x i16> %a, <8 x i16> %b) {
  define <8 x i16> @test11(<8 x i16> %a, <8 x i16> %b) {
  ; CHECK-LABEL: test11:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movaps {{.*#+}} xmm2 = <0,65535,65535,0,u,65535,65535,u>
+; CHECK-NEXT:    movaps {{.*#+}} xmm2 = [0,65535,65535,0,65535,65535,65535,65535]
  ; CHECK-NEXT:    andps %xmm2, %xmm0
  ; CHECK-NEXT:    andnps %xmm1, %xmm2
  ; CHECK-NEXT:    orps %xmm2, %xmm0
@@ -170,7 +163,7 @@ define <8 x i16> @test17(<8 x i16> %a, <8 x i16> %b) {
  define <4 x float> @test18(<4 x float> %a, <4 x float> %b) {
  ; CHECK-LABEL: test18:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movss %xmm1, %xmm0
+; CHECK-NEXT:    movss {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3]
  ; CHECK-NEXT:    retq
    %1 = select <4 x i1> <i1 false, i1 true, i1 true, i1 true>, <4 x float> %a, <4 x float> %b
    ret <4 x float> %1
@@ -179,7 +172,7 @@ define <4 x float> @test18(<4 x float> %a, <4 x float> %b) {
  define <4 x i32> @test19(<4 x i32> %a, <4 x i32> %b) {
  ; CHECK-LABEL: test19:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movss %xmm1, %xmm0
+; CHECK-NEXT:    movss {{.*#+}} xmm0 = xmm1[0],xmm0[1,2,3]
  ; CHECK-NEXT:    retq
    %1 = select <4 x i1> <i1 false, i1 true, i1 true, i1 true>, <4 x i32> %a, <4 x i32> %b
    ret <4 x i32> %1
@@ -188,7 +181,7 @@ define <4 x i32> @test19(<4 x i32> %a, <4 x i32> %b) {
  define <2 x double> @test20(<2 x double> %a, <2 x double> %b) {
  ; CHECK-LABEL: test20:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movsd %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
  ; CHECK-NEXT:    retq
    %1 = select <2 x i1> <i1 false, i1 true>, <2 x double> %a, <2 x double> %b
    ret <2 x double> %1
@@ -197,7 +190,7 @@ define <2 x double> @test20(<2 x double> %a, <2 x double> %b) {
  define <2 x i64> @test21(<2 x i64> %a, <2 x i64> %b) {
  ; CHECK-LABEL: test21:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movsd %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
  ; CHECK-NEXT:    retq
    %1 = select <2 x i1> <i1 false, i1 true>, <2 x i64> %a, <2 x i64> %b
    ret <2 x i64> %1
@@ -206,7 +199,7 @@ define <2 x i64> @test21(<2 x i64> %a, <2 x i64> %b) {
  define <4 x float> @test22(<4 x float> %a, <4 x float> %b) {
  ; CHECK-LABEL: test22:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movss %xmm0, %xmm1
+; CHECK-NEXT:    movss {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3]
  ; CHECK-NEXT:    movaps %xmm1, %xmm0
  ; CHECK-NEXT:    retq
    %1 = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x float> %a, <4 x float> %b
@@ -216,7 +209,7 @@ define <4 x float> @test22(<4 x float> %a, <4 x float> %b) {
  define <4 x i32> @test23(<4 x i32> %a, <4 x i32> %b) {
  ; CHECK-LABEL: test23:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movss %xmm0, %xmm1
+; CHECK-NEXT:    movss {{.*#+}} xmm1 = xmm0[0],xmm1[1,2,3]
  ; CHECK-NEXT:    movaps %xmm1, %xmm0
  ; CHECK-NEXT:    retq
    %1 = select <4 x i1> <i1 true, i1 false, i1 false, i1 false>, <4 x i32> %a, <4 x i32> %b
@@ -226,8 +219,8 @@ define <4 x i32> @test23(<4 x i32> %a, <4 x i32> %b) {
  define <2 x double> @test24(<2 x double> %a, <2 x double> %b) {
  ; CHECK-LABEL: test24:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movsd %xmm0, %xmm1
-; CHECK-NEXT:    movaps %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
+; CHECK-NEXT:    movapd %xmm1, %xmm0
  ; CHECK-NEXT:    retq
    %1 = select <2 x i1> <i1 true, i1 false>, <2 x double> %a, <2 x double> %b
    ret <2 x double> %1
@@ -236,8 +229,8 @@ define <2 x double> @test24(<2 x double> %a, <2 x double> %b) {
  define <2 x i64> @test25(<2 x i64> %a, <2 x i64> %b) {
  ; CHECK-LABEL: test25:
  ; CHECK:       # BB#0:
-; CHECK-NEXT:    movsd %xmm0, %xmm1
-; CHECK-NEXT:    movaps %xmm1, %xmm0
+; CHECK-NEXT:    movsd {{.*#+}} xmm1 = xmm0[0],xmm1[1]
+; CHECK-NEXT:    movapd %xmm1, %xmm0
  ; CHECK-NEXT:    retq
    %1 = select <2 x i1> <i1 true, i1 false>, <2 x i64> %a, <2 x i64> %b
    ret <2 x i64> %1
@@ -276,6 +269,7 @@ define <16 x double> @select_illegal(<16 x double> %a, <16 x double> %b) {
  ; CHECK-NEXT:    movaps %xmm2, 32(%rdi)
  ; CHECK-NEXT:    movaps %xmm1, 16(%rdi)
  ; CHECK-NEXT:    movaps %xmm0, (%rdi)
+; CHECK-NEXT:    movq %rdi, %rax
  ; CHECK-NEXT:    retq
    %sel = select <16 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false, i1 false>, <16 x double> %a, <16 x double> %b
    ret <16 x double> %sel