[X86][AVX512] Added support for AVX512 UNPCK shuffle decode comments.
[oota-llvm.git] / test / CodeGen / X86 / rot32.ll
index 655ed272837ac3c0d55fbfdc86eb31e5ac687037..5738f70fa47e628a3a7b89e8bef5c8f1699a1a86 100644 (file)
@@ -1,11 +1,10 @@
-; RUN: llc < %s -march=x86 > %t
-; RUN: grep rol %t | count 3
-; RUN: grep ror %t | count 1
-; RUN: grep shld %t | count 2
-; RUN: grep shrd %t | count 2
+; RUN: llc < %s -march=x86 -mcpu=corei7 | FileCheck %s
+; RUN: llc < %s -march=x86 -mcpu=core-avx2 | FileCheck %s --check-prefix=BMI2
 
 define i32 @foo(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: foo:
+; CHECK: roll %cl
        %0 = shl i32 %x, %z
        %1 = sub i32 32, %z
        %2 = lshr i32 %x, %1
@@ -15,6 +14,8 @@ entry:
 
 define i32 @bar(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: bar:
+; CHECK: shldl %cl
        %0 = shl i32 %y, %z
        %1 = sub i32 32, %z
        %2 = lshr i32 %x, %1
@@ -24,6 +25,8 @@ entry:
 
 define i32 @un(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: un:
+; CHECK: rorl %cl
        %0 = lshr i32 %x, %z
        %1 = sub i32 32, %z
        %2 = shl i32 %x, %1
@@ -33,6 +36,8 @@ entry:
 
 define i32 @bu(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: bu:
+; CHECK: shrdl %cl
        %0 = lshr i32 %y, %z
        %1 = sub i32 32, %z
        %2 = shl i32 %x, %1
@@ -42,14 +47,31 @@ entry:
 
 define i32 @xfoo(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xfoo:
+; CHECK: roll $7
+; BMI2-LABEL: xfoo:
+; BMI2: rorxl $25
        %0 = lshr i32 %x, 25
        %1 = shl i32 %x, 7
        %2 = or i32 %0, %1
        ret i32 %2
 }
 
+define i32 @xfoop(i32* %p) nounwind readnone {
+entry:
+; BMI2-LABEL: xfoop:
+; BMI2: rorxl $25, ({{.+}}), %{{.+}}
+       %x = load i32, i32* %p
+       %a = lshr i32 %x, 25
+       %b = shl i32 %x, 7
+       %c = or i32 %a, %b
+       ret i32 %c
+}
+
 define i32 @xbar(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xbar:
+; CHECK: shldl $7
        %0 = shl i32 %y, 7
        %1 = lshr i32 %x, 25
        %2 = or i32 %0, %1
@@ -58,14 +80,31 @@ entry:
 
 define i32 @xun(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xun:
+; CHECK: roll $25
+; BMI2-LABEL: xun:
+; BMI2: rorxl $7
        %0 = lshr i32 %x, 7
        %1 = shl i32 %x, 25
        %2 = or i32 %0, %1
        ret i32 %2
 }
 
+define i32 @xunp(i32* %p) nounwind readnone {
+entry:
+; BMI2-LABEL: xunp:
+; BMI2: rorxl $7, ({{.+}}), %{{.+}}
+       %x = load i32, i32* %p
+       %a = lshr i32 %x, 7
+       %b = shl i32 %x, 25
+       %c = or i32 %a, %b
+       ret i32 %c
+}
+
 define i32 @xbu(i32 %x, i32 %y, i32 %z) nounwind readnone {
 entry:
+; CHECK-LABEL: xbu:
+; CHECK: shldl
        %0 = lshr i32 %y, 7
        %1 = shl i32 %x, 25
        %2 = or i32 %0, %1