[SystemZ] Add NRK, ORK and XRK
authorRichard Sandiford <rsandifo@linux.vnet.ibm.com>
Fri, 19 Jul 2013 16:21:55 +0000 (16:21 +0000)
committerRichard Sandiford <rsandifo@linux.vnet.ibm.com>
Fri, 19 Jul 2013 16:21:55 +0000 (16:21 +0000)
The atomic tests assume the two-operand forms, so I've restricted them to z10.

Running and-01.ll, or-01.ll and xor-01.ll for z196 as well as z10 shows why
using convertToThreeAddress() is better than exposing the three-operand forms
first and then converting back to two operands where possible (which is what
I'd originally tried).  Using the three-operand form first stops us from
taking advantage of NG, OG and XG for spills.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@186683 91177308-0d34-0410-b5e6-96231b3b80d8

15 files changed:
lib/Target/SystemZ/SystemZInstrFormats.td
lib/Target/SystemZ/SystemZInstrInfo.td
test/CodeGen/SystemZ/and-01.ll
test/CodeGen/SystemZ/and-07.ll [new file with mode: 0644]
test/CodeGen/SystemZ/atomicrmw-and-03.ll
test/CodeGen/SystemZ/atomicrmw-nand-03.ll
test/CodeGen/SystemZ/atomicrmw-or-03.ll
test/CodeGen/SystemZ/atomicrmw-xor-03.ll
test/CodeGen/SystemZ/or-01.ll
test/CodeGen/SystemZ/or-07.ll [new file with mode: 0644]
test/CodeGen/SystemZ/xor-01.ll
test/CodeGen/SystemZ/xor-07.ll [new file with mode: 0644]
test/MC/Disassembler/SystemZ/insns.txt
test/MC/SystemZ/insn-bad.s
test/MC/SystemZ/insn-good-z196.s

index b0301821a31b0ca7c7c7ee87bf064176b5bef96c..24f86bca09f91504c5baf45cdef7b310783a3b43 100644 (file)
@@ -729,6 +729,24 @@ class BinaryRRF<string mnemonic, bits<16> opcode, SDPatternOperator operator,
   let OpType = "reg";
 }
 
+class BinaryRRFK<string mnemonic, bits<16> opcode, SDPatternOperator operator,
+                 RegisterOperand cls1, RegisterOperand cls2>
+  : InstRRF<opcode, (outs cls1:$R1), (ins cls1:$R2, cls2:$R3),
+            mnemonic#"rk\t$R1, $R2, $R3",
+            [(set cls1:$R1, (operator cls1:$R2, cls2:$R3))]>;
+
+multiclass BinaryRRAndK<string mnemonic, bits<8> opcode1, bits<16> opcode2,
+                        SDPatternOperator operator, RegisterOperand cls1,
+                        RegisterOperand cls2> {
+  let NumOpsKey = mnemonic in {
+    let NumOpsValue = "3" in
+      def K : BinaryRRFK<mnemonic, opcode2, null_frag, cls1, cls2>,
+              Requires<[FeatureDistinctOps]>;
+    let NumOpsValue = "2", isConvertibleToThreeAddress = 1 in
+      def "" : BinaryRR<mnemonic, opcode1, operator, cls1, cls2>;
+  }
+}
+
 class BinaryRI<string mnemonic, bits<12> opcode, SDPatternOperator operator,
                RegisterOperand cls, Immediate imm>
   : InstRI<opcode, (outs cls:$R1), (ins cls:$R1src, imm:$I2),
index 4670156bb28d899a9f327bbb0ff0492625ee3eff..94b8a3efb09541b51aba1cfc59daa1b2b72eb16b 100644 (file)
@@ -648,7 +648,7 @@ let Defs = [CC], Uses = [CC] in {
 let Defs = [CC] in {
   // ANDs of a register.
   let isCommutable = 1 in {
-    def NR  : BinaryRR <"n",  0x14,   and, GR32, GR32>;
+    defm NR : BinaryRRAndK<"n", 0x14, 0xB9F4, and, GR32, GR32>;
     def NGR : BinaryRRE<"ng", 0xB980, and, GR64, GR64>;
   }
 
@@ -685,7 +685,7 @@ defm : RMWIByte<and, bdaddr20pair, NIY>;
 let Defs = [CC] in {
   // ORs of a register.
   let isCommutable = 1 in {
-    def OR  : BinaryRR <"o",  0x16,   or, GR32, GR32>;
+    defm OR : BinaryRRAndK<"o", 0x16, 0xB9F6, or, GR32, GR32>;
     def OGR : BinaryRRE<"og", 0xB981, or, GR64, GR64>;
   }
 
@@ -722,7 +722,7 @@ defm : RMWIByte<or, bdaddr20pair, OIY>;
 let Defs = [CC] in {
   // XORs of a register.
   let isCommutable = 1 in {
-    def XR  : BinaryRR <"x",  0x17,   xor, GR32, GR32>;
+    defm XR : BinaryRRAndK<"x", 0x17, 0xB9F7, xor, GR32, GR32>;
     def XGR : BinaryRRE<"xg", 0xB982, xor, GR64, GR64>;
   }
 
index f89314809f685e919074c86322ba93abdc518694..3b230ba1081f05c05fdcf073f4581c43ec9e8c94 100644 (file)
@@ -1,6 +1,7 @@
 ; Test 32-bit ANDs in which the second operand is variable.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z196 | FileCheck %s
 
 declare i32 @foo()
 
diff --git a/test/CodeGen/SystemZ/and-07.ll b/test/CodeGen/SystemZ/and-07.ll
new file mode 100644 (file)
index 0000000..2bdf97d
--- /dev/null
@@ -0,0 +1,21 @@
+; Test the three-operand forms of AND.
+;
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z196 | FileCheck %s
+
+; Check NRK.
+define i32 @f1(i32 %a, i32 %b, i32 %c) {
+; CHECK-LABEL: f1:
+; CHECK: nrk %r2, %r3, %r4
+; CHECK: br %r14
+  %and = and i32 %b, %c
+  ret i32 %and
+}
+
+; Check that we can still use NR in obvious cases.
+define i32 @f2(i32 %a, i32 %b) {
+; CHECK-LABEL: f2:
+; CHECK: nr %r2, %r3
+; CHECK: br %r14
+  %and = and i32 %a, %b
+  ret i32 %and
+}
index dd02828ad835e9fe44f5ffa1efa599a6b51aa8f1..6c7ba23e1b921ca91aa58705c686035db54ca8d9 100644 (file)
@@ -1,6 +1,6 @@
 ; Test 32-bit atomic ANDs.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
 
 ; Check ANDs of a variable.
 define i32 @f1(i32 %dummy, i32 *%src, i32 %b) {
index be306a29e36999143bbe5188138861dd7e5eb922..c511bd608fd59597231986d62341956a3e6d3fbc 100644 (file)
@@ -1,6 +1,6 @@
 ; Test 32-bit atomic NANDs.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
 
 ; Check NANDs of a variable.
 define i32 @f1(i32 %dummy, i32 *%src, i32 %b) {
index 6386847e53eed0cff0201f2cd244fb49dfaaf0be..692b11c4cf3e44472c99bdcb61d82116dd4e2a7d 100644 (file)
@@ -1,6 +1,6 @@
 ; Test 32-bit atomic ORs.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
 
 ; Check ORs of a variable.
 define i32 @f1(i32 %dummy, i32 *%src, i32 %b) {
index 292de3642bc2b9403376094b09e92884a2069fc9..05754e7a0eeb1f74d2313742d8318dc5bb579f99 100644 (file)
@@ -1,6 +1,6 @@
 ; Test 32-bit atomic XORs.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
 
 ; Check XORs of a variable.
 define i32 @f1(i32 %dummy, i32 *%src, i32 %b) {
index ee0a39228d88609e167aca514adabb75c923b26f..23946d320678bfd0f9899c79491158d3ebf075eb 100644 (file)
@@ -1,6 +1,7 @@
 ; Test 32-bit ORs in which the second operand is variable.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z196 | FileCheck %s
 
 declare i32 @foo()
 
diff --git a/test/CodeGen/SystemZ/or-07.ll b/test/CodeGen/SystemZ/or-07.ll
new file mode 100644 (file)
index 0000000..f6848a1
--- /dev/null
@@ -0,0 +1,21 @@
+; Test the three-operand forms of OR.
+;
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z196 | FileCheck %s
+
+; Check XRK.
+define i32 @f1(i32 %a, i32 %b, i32 %c) {
+; CHECK-LABEL: f1:
+; CHECK: ork %r2, %r3, %r4
+; CHECK: br %r14
+  %or = or i32 %b, %c
+  ret i32 %or
+}
+
+; Check that we can still use OR in obvious cases.
+define i32 @f2(i32 %a, i32 %b) {
+; CHECK-LABEL: f2:
+; CHECK: or %r2, %r3
+; CHECK: br %r14
+  %or = or i32 %a, %b
+  ret i32 %or
+}
index f9ba2eb65e784a5579d88a910f192fe155d04cad..185d6bb0a75412197a7aec92f3059e53e0673016 100644 (file)
@@ -1,6 +1,7 @@
 ; Test 32-bit XORs in which the second operand is variable.
 ;
-; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z10 | FileCheck %s
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z196 | FileCheck %s
 
 declare i32 @foo()
 
diff --git a/test/CodeGen/SystemZ/xor-07.ll b/test/CodeGen/SystemZ/xor-07.ll
new file mode 100644 (file)
index 0000000..22deef6
--- /dev/null
@@ -0,0 +1,21 @@
+; Test the three-operand forms of XOR.
+;
+; RUN: llc < %s -mtriple=s390x-linux-gnu -mcpu=z196 | FileCheck %s
+
+; Check XRK.
+define i32 @f1(i32 %a, i32 %b, i32 %c) {
+; CHECK-LABEL: f1:
+; CHECK: xrk %r2, %r3, %r4
+; CHECK: br %r14
+  %xor = xor i32 %b, %c
+  ret i32 %xor
+}
+
+; Check that we can still use XR in obvious cases.
+define i32 @f2(i32 %a, i32 %b) {
+; CHECK-LABEL: f2:
+; CHECK: xr %r2, %r3
+; CHECK: br %r14
+  %xor = xor i32 %a, %b
+  ret i32 %xor
+}
index 6f5e332160955789966e26a52ecafe61c868de95..68d585ad2ae3902aaa1f06dd435f2395979fe104 100644 (file)
 # CHECK: nr %r7, %r8
 0x14 0x78
 
+# CHECK: nrk %r0, %r0, %r0
+0xb9 0xf4 0x00 0x00
+
+# CHECK: nrk %r2, %r3, %r4
+0xb9 0xf4 0x40 0x23
+
 # CHECK: n %r0, 0
 0x54 0x00 0x00 0x00
 
 # CHECK: or %r7, %r8
 0x16 0x78
 
+# CHECK: ork %r0, %r0, %r0
+0xb9 0xf6 0x00 0x00
+
+# CHECK: ork %r2, %r3, %r4
+0xb9 0xf6 0x40 0x23
+
 # CHECK: o %r0, 0
 0x56 0x00 0x00 0x00
 
 # CHECK: xr %r7, %r8
 0x17 0x78
 
+# CHECK: xrk %r0, %r0, %r0
+0xb9 0xf7 0x00 0x00
+
+# CHECK: xrk %r2, %r3, %r4
+0xb9 0xf7 0x40 0x23
+
 # CHECK: x %r0, 0
 0x57 0x00 0x00 0x00
 
index 7c0f23a367b0016b1922dd73335f2d7a645e0420..ccc778dee2fad96371bbff46fda63bbe6845c545 100644 (file)
        niy     0, -1
        niy     0, 256
 
+#CHECK: error: {{(instruction requires: distinct-ops)?}}
+#CHECK: nrk    %r2,%r3,%r4
+
+       nrk     %r2,%r3,%r4
+
 #CHECK: error: invalid operand
 #CHECK: ny     %r0, -524289
 #CHECK: error: invalid operand
        oiy     0, -1
        oiy     0, 256
 
+#CHECK: error: {{(instruction requires: distinct-ops)?}}
+#CHECK: ork    %r2,%r3,%r4
+
+       ork     %r2,%r3,%r4
+
 #CHECK: error: invalid operand
 #CHECK: oy     %r0, -524289
 #CHECK: error: invalid operand
        xiy     0, -1
        xiy     0, 256
 
+#CHECK: error: {{(instruction requires: distinct-ops)?}}
+#CHECK: xrk    %r2,%r3,%r4
+
+       xrk     %r2,%r3,%r4
+
 #CHECK: error: invalid operand
 #CHECK: xy     %r0, -524289
 #CHECK: error: invalid operand
index 28de0ee1588be0279e26b342b85f777ed351857e..9d64670cdf24a2b51856befee224f50e5d0cf41e 100644 (file)
@@ -1,6 +1,30 @@
 # For z196 and above.
 # RUN: llvm-mc -triple s390x-linux-gnu -mcpu=z196 -show-encoding %s | FileCheck %s
 
+#CHECK: nrk    %r0, %r0, %r0           # encoding: [0xb9,0xf4,0x00,0x00]
+#CHECK: nrk    %r0, %r0, %r15          # encoding: [0xb9,0xf4,0xf0,0x00]
+#CHECK: nrk    %r0, %r15, %r0          # encoding: [0xb9,0xf4,0x00,0x0f]
+#CHECK: nrk    %r15, %r0, %r0          # encoding: [0xb9,0xf4,0x00,0xf0]
+#CHECK: nrk    %r7, %r8, %r9           # encoding: [0xb9,0xf4,0x90,0x78]
+
+       nrk     %r0,%r0,%r0
+       nrk     %r0,%r0,%r15
+       nrk     %r0,%r15,%r0
+       nrk     %r15,%r0,%r0
+       nrk     %r7,%r8,%r9
+
+#CHECK: ork    %r0, %r0, %r0           # encoding: [0xb9,0xf6,0x00,0x00]
+#CHECK: ork    %r0, %r0, %r15          # encoding: [0xb9,0xf6,0xf0,0x00]
+#CHECK: ork    %r0, %r15, %r0          # encoding: [0xb9,0xf6,0x00,0x0f]
+#CHECK: ork    %r15, %r0, %r0          # encoding: [0xb9,0xf6,0x00,0xf0]
+#CHECK: ork    %r7, %r8, %r9           # encoding: [0xb9,0xf6,0x90,0x78]
+
+       ork     %r0,%r0,%r0
+       ork     %r0,%r0,%r15
+       ork     %r0,%r15,%r0
+       ork     %r15,%r0,%r0
+       ork     %r7,%r8,%r9
+
 #CHECK: sllk   %r0, %r0, 0             # encoding: [0xeb,0x00,0x00,0x00,0x00,0xdf]
 #CHECK: sllk   %r15, %r1, 0            # encoding: [0xeb,0xf1,0x00,0x00,0x00,0xdf]
 #CHECK: sllk   %r1, %r15, 0            # encoding: [0xeb,0x1f,0x00,0x00,0x00,0xdf]
        srlk    %r0,%r0,0(%r15)
        srlk    %r0,%r0,524287(%r1)
        srlk    %r0,%r0,524287(%r15)
+
+#CHECK: xrk    %r0, %r0, %r0           # encoding: [0xb9,0xf7,0x00,0x00]
+#CHECK: xrk    %r0, %r0, %r15          # encoding: [0xb9,0xf7,0xf0,0x00]
+#CHECK: xrk    %r0, %r15, %r0          # encoding: [0xb9,0xf7,0x00,0x0f]
+#CHECK: xrk    %r15, %r0, %r0          # encoding: [0xb9,0xf7,0x00,0xf0]
+#CHECK: xrk    %r7, %r8, %r9           # encoding: [0xb9,0xf7,0x90,0x78]
+
+       xrk     %r0,%r0,%r0
+       xrk     %r0,%r0,%r15
+       xrk     %r0,%r15,%r0
+       xrk     %r15,%r0,%r0
+       xrk     %r7,%r8,%r9