[SystemZ] Don't use LOAD and STORE REVERSED for volatile accesses

author Richard Sandiford <rsandifo@linux.vnet.ibm.com>

Fri, 31 May 2013 13:25:22 +0000 (13:25 +0000)

committer Richard Sandiford <rsandifo@linux.vnet.ibm.com>

Fri, 31 May 2013 13:25:22 +0000 (13:25 +0000)
author Richard Sandiford <rsandifo@linux.vnet.ibm.com>
Fri, 31 May 2013 13:25:22 +0000 (13:25 +0000)
committer Richard Sandiford <rsandifo@linux.vnet.ibm.com>
Fri, 31 May 2013 13:25:22 +0000 (13:25 +0000)
diff --git a/lib/Target/SystemZ/SystemZInstrInfo.td b/lib/Target/SystemZ/SystemZInstrInfo.td

index 062266bb485e0ffec6871dad4306bc64d36f0f0d..c9ec6bc1f99184dcdeeb0cfc79a32102f91d1568 100644 (file)
--- a/lib/Target/SystemZ/SystemZInstrInfo.td
+++ b/lib/Target/SystemZ/SystemZInstrInfo.td
@@ -382,13 +382,14 @@ let neverHasSideEffects = 1 in {
    def LRVGR : UnaryRRE<"lrvgr", 0xB90F, bswap, GR64, GR64>;
  }
  
-// Byte-swapping loads.
-def LRV  : UnaryRXY<"lrv",  0xE31E, loadu<bswap>, GR32>;
-def LRVG : UnaryRXY<"lrvg", 0xE30F, loadu<bswap>, GR64>;
-
-// Byte-swapping stores.
-def STRV  : StoreRXY<"strv",  0xE33E, storeu<bswap>, GR32>;
-def STRVG : StoreRXY<"strvg", 0xE32F, storeu<bswap>, GR64>;
+// Byte-swapping loads.  Unlike normal loads, these instructions are
+// allowed to access storage more than once.
+def LRV  : UnaryRXY<"lrv",  0xE31E, loadu<bswap, nonvolatile_load>, GR32>;
+def LRVG : UnaryRXY<"lrvg", 0xE30F, loadu<bswap, nonvolatile_load>, GR64>;
+
+// Likewise byte-swapping stores.
+def STRV  : StoreRXY<"strv",  0xE33E, storeu<bswap, nonvolatile_store>, GR32>;
+def STRVG : StoreRXY<"strvg", 0xE32F, storeu<bswap, nonvolatile_store>, GR64>;
  
  //===----------------------------------------------------------------------===//
  // Load address instructions
diff --git a/lib/Target/SystemZ/SystemZOperators.td b/lib/Target/SystemZ/SystemZOperators.td

index 8c4df56b46159307f5c4afcc220f2c8022feec39..ab01b2527a83f10540f4316f6a845ff224d4d97b 100644 (file)
--- a/lib/Target/SystemZ/SystemZOperators.td
+++ b/lib/Target/SystemZ/SystemZOperators.td
@@ -142,6 +142,23 @@ def aligned_store         : AlignedStore<store>;
  def aligned_truncstorei16 : AlignedStore<truncstorei16>;
  def aligned_truncstorei32 : AlignedStore<truncstorei32>;
  
+// Non-volatile loads.  Used for instructions that might access the storage
+// location multiple times.
+class NonvolatileLoad<SDPatternOperator load>
+  : PatFrag<(ops node:$addr), (load node:$addr), [{
+  LoadSDNode *Load = cast<LoadSDNode>(N);
+  return !Load->isVolatile();
+}]>;
+def nonvolatile_load : NonvolatileLoad<load>;
+
+// Non-volatile stores.
+class NonvolatileStore<SDPatternOperator store>
+  : PatFrag<(ops node:$src, node:$addr), (store node:$src, node:$addr), [{
+  StoreSDNode *Store = cast<StoreSDNode>(N);
+  return !Store->isVolatile();
+}]>;
+def nonvolatile_store : NonvolatileStore<store>;
+
  // Insertions.
  def inserti8 : PatFrag<(ops node:$src1, node:$src2),
                         (or (and node:$src1, -256), node:$src2)>;
@@ -186,11 +203,11 @@ def fnabs : PatFrag<(ops node:$ptr), (fneg (fabs node:$ptr))>;
  
  // Create a unary operator that loads from memory and then performs
  // the given operation on it.
-class loadu<SDPatternOperator operator>
+class loadu<SDPatternOperator operator, SDPatternOperator load = load>
    : PatFrag<(ops node:$addr), (operator (load node:$addr))>;
  
  // Create a store operator that performs the given unary operation
  // on the value before storing it.
-class storeu<SDPatternOperator operator>
+class storeu<SDPatternOperator operator, SDPatternOperator store = store>
    : PatFrag<(ops node:$value, node:$addr),
              (store (operator node:$value), node:$addr)>;
diff --git a/test/CodeGen/SystemZ/bswap-02.ll b/test/CodeGen/SystemZ/bswap-02.ll

index e9b7eb5f055b064c7d885d26109e5222d85644e4..8b99077f4c13ed8a45aefb659706e20cadc40edb 100644 (file)
--- a/test/CodeGen/SystemZ/bswap-02.ll
+++ b/test/CodeGen/SystemZ/bswap-02.ll
@@ -85,3 +85,15 @@ define i32 @f7(i64 %src, i64 %index) {
    %swapped = call i32 @llvm.bswap.i32(i32 %a)
    ret i32 %swapped
  }
+
+; Check that volatile accesses do not use LRV, which might access the
+; storage multple times.
+define i32 @f8(i32 *%src) {
+; CHECK: f8:
+; CHECK: l [[REG:%r[0-5]]], 0(%r2)
+; CHECK: lrvr %r2, [[REG]]
+; CHECK: br %r14
+  %a = load volatile i32 *%src
+  %swapped = call i32 @llvm.bswap.i32(i32 %a)
+  ret i32 %swapped
+}
diff --git a/test/CodeGen/SystemZ/bswap-03.ll b/test/CodeGen/SystemZ/bswap-03.ll

index 2e6bcdce265159498ff01d59306911781337ec41..df6624e5b46cce78ac97dc287731ee5429d27f68 100644 (file)
--- a/test/CodeGen/SystemZ/bswap-03.ll
+++ b/test/CodeGen/SystemZ/bswap-03.ll
@@ -85,3 +85,15 @@ define i64 @f7(i64 %src, i64 %index) {
    %swapped = call i64 @llvm.bswap.i64(i64 %a)
    ret i64 %swapped
  }
+
+; Check that volatile accesses do not use LRVG, which might access the
+; storage multple times.
+define i64 @f8(i64 *%src) {
+; CHECK: f8:
+; CHECK: lg [[REG:%r[0-5]]], 0(%r2)
+; CHECK: lrvgr %r2, [[REG]]
+; CHECK: br %r14
+  %a = load volatile i64 *%src
+  %swapped = call i64 @llvm.bswap.i64(i64 %a)
+  ret i64 %swapped
+}
diff --git a/test/CodeGen/SystemZ/bswap-04.ll b/test/CodeGen/SystemZ/bswap-04.ll

index 192327bd256c11afd51b3d7a2009f7aaca9d2877..63b202044e48896f87feddcb185c1ff53d5cc3ed 100644 (file)
--- a/test/CodeGen/SystemZ/bswap-04.ll
+++ b/test/CodeGen/SystemZ/bswap-04.ll
@@ -5,21 +5,21 @@
  declare i32 @llvm.bswap.i32(i32 %a)
  
  ; Check STRV with no displacement.
-define void @f1(i32 *%src, i32 %a) {
+define void @f1(i32 *%dst, i32 %a) {
  ; CHECK: f1:
  ; CHECK: strv %r3, 0(%r2)
  ; CHECK: br %r14
    %swapped = call i32 @llvm.bswap.i32(i32 %a)
-  store i32 %swapped, i32 *%src
+  store i32 %swapped, i32 *%dst
    ret void
  }
  
  ; Check the high end of the aligned STRV range.
-define void @f2(i32 *%src, i32 %a) {
+define void @f2(i32 *%dst, i32 %a) {
  ; CHECK: f2:
  ; CHECK: strv %r3, 524284(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i32 *%src, i64 131071
+  %ptr = getelementptr i32 *%dst, i64 131071
    %swapped = call i32 @llvm.bswap.i32(i32 %a)
    store i32 %swapped, i32 *%ptr
    ret void
@@ -27,34 +27,34 @@ define void @f2(i32 *%src, i32 %a) {
  
  ; Check the next word up, which needs separate address logic.
  ; Other sequences besides this one would be OK.
-define void @f3(i32 *%src, i32 %a) {
+define void @f3(i32 *%dst, i32 %a) {
  ; CHECK: f3:
  ; CHECK: agfi %r2, 524288
  ; CHECK: strv %r3, 0(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i32 *%src, i64 131072
+  %ptr = getelementptr i32 *%dst, i64 131072
    %swapped = call i32 @llvm.bswap.i32(i32 %a)
    store i32 %swapped, i32 *%ptr
    ret void
  }
  
  ; Check the high end of the negative aligned STRV range.
-define void @f4(i32 *%src, i32 %a) {
+define void @f4(i32 *%dst, i32 %a) {
  ; CHECK: f4:
  ; CHECK: strv %r3, -4(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i32 *%src, i64 -1
+  %ptr = getelementptr i32 *%dst, i64 -1
    %swapped = call i32 @llvm.bswap.i32(i32 %a)
    store i32 %swapped, i32 *%ptr
    ret void
  }
  
  ; Check the low end of the STRV range.
-define void @f5(i32 *%src, i32 %a) {
+define void @f5(i32 *%dst, i32 %a) {
  ; CHECK: f5:
  ; CHECK: strv %r3, -524288(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i32 *%src, i64 -131072
+  %ptr = getelementptr i32 *%dst, i64 -131072
    %swapped = call i32 @llvm.bswap.i32(i32 %a)
    store i32 %swapped, i32 *%ptr
    ret void
@@ -62,12 +62,12 @@ define void @f5(i32 *%src, i32 %a) {
  
  ; Check the next word down, which needs separate address logic.
  ; Other sequences besides this one would be OK.
-define void @f6(i32 *%src, i32 %a) {
+define void @f6(i32 *%dst, i32 %a) {
  ; CHECK: f6:
  ; CHECK: agfi %r2, -524292
  ; CHECK: strv %r3, 0(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i32 *%src, i64 -131073
+  %ptr = getelementptr i32 *%dst, i64 -131073
    %swapped = call i32 @llvm.bswap.i32(i32 %a)
    store i32 %swapped, i32 *%ptr
    ret void
@@ -85,3 +85,15 @@ define void @f7(i64 %src, i64 %index, i32 %a) {
    store i32 %swapped, i32 *%ptr
    ret void
  }
+
+; Check that volatile stores do not use STRV, which might access the
+; storage multple times.
+define void @f8(i32 *%dst, i32 %a) {
+; CHECK: f8:
+; CHECK: lrvr [[REG:%r[0-5]]], %r3
+; CHECK: st [[REG]], 0(%r2)
+; CHECK: br %r14
+  %swapped = call i32 @llvm.bswap.i32(i32 %a)
+  store volatile i32 %swapped, i32 *%dst
+  ret void
+}
diff --git a/test/CodeGen/SystemZ/bswap-05.ll b/test/CodeGen/SystemZ/bswap-05.ll

index e58cb80c398158b002bc41eecb0746c7e7e0d606..6f25d3c10ab61ae63d54de53d4c5781499148a8e 100644 (file)
--- a/test/CodeGen/SystemZ/bswap-05.ll
+++ b/test/CodeGen/SystemZ/bswap-05.ll
@@ -5,21 +5,21 @@
  declare i64 @llvm.bswap.i64(i64 %a)
  
  ; Check STRVG with no displacement.
-define void @f1(i64 *%src, i64 %a) {
+define void @f1(i64 *%dst, i64 %a) {
  ; CHECK: f1:
  ; CHECK: strvg %r3, 0(%r2)
  ; CHECK: br %r14
    %swapped = call i64 @llvm.bswap.i64(i64 %a)
-  store i64 %swapped, i64 *%src
+  store i64 %swapped, i64 *%dst
    ret void
  }
  
  ; Check the high end of the aligned STRVG range.
-define void @f2(i64 *%src, i64 %a) {
+define void @f2(i64 *%dst, i64 %a) {
  ; CHECK: f2:
  ; CHECK: strvg %r3, 524280(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i64 *%src, i64 65535
+  %ptr = getelementptr i64 *%dst, i64 65535
    %swapped = call i64 @llvm.bswap.i64(i64 %a)
    store i64 %swapped, i64 *%ptr
    ret void
@@ -27,34 +27,34 @@ define void @f2(i64 *%src, i64 %a) {
  
  ; Check the next doubleword up, which needs separate address logic.
  ; Other sequences besides this one would be OK.
-define void @f3(i64 *%src, i64 %a) {
+define void @f3(i64 *%dst, i64 %a) {
  ; CHECK: f3:
  ; CHECK: agfi %r2, 524288
  ; CHECK: strvg %r3, 0(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i64 *%src, i64 65536
+  %ptr = getelementptr i64 *%dst, i64 65536
    %swapped = call i64 @llvm.bswap.i64(i64 %a)
    store i64 %swapped, i64 *%ptr
    ret void
  }
  
  ; Check the high end of the negative aligned STRVG range.
-define void @f4(i64 *%src, i64 %a) {
+define void @f4(i64 *%dst, i64 %a) {
  ; CHECK: f4:
  ; CHECK: strvg %r3, -8(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i64 *%src, i64 -1
+  %ptr = getelementptr i64 *%dst, i64 -1
    %swapped = call i64 @llvm.bswap.i64(i64 %a)
    store i64 %swapped, i64 *%ptr
    ret void
  }
  
  ; Check the low end of the STRVG range.
-define void @f5(i64 *%src, i64 %a) {
+define void @f5(i64 *%dst, i64 %a) {
  ; CHECK: f5:
  ; CHECK: strvg %r3, -524288(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i64 *%src, i64 -65536
+  %ptr = getelementptr i64 *%dst, i64 -65536
    %swapped = call i64 @llvm.bswap.i64(i64 %a)
    store i64 %swapped, i64 *%ptr
    ret void
@@ -62,12 +62,12 @@ define void @f5(i64 *%src, i64 %a) {
  
  ; Check the next doubleword down, which needs separate address logic.
  ; Other sequences besides this one would be OK.
-define void @f6(i64 *%src, i64 %a) {
+define void @f6(i64 *%dst, i64 %a) {
  ; CHECK: f6:
  ; CHECK: agfi %r2, -524296
  ; CHECK: strvg %r3, 0(%r2)
  ; CHECK: br %r14
-  %ptr = getelementptr i64 *%src, i64 -65537
+  %ptr = getelementptr i64 *%dst, i64 -65537
    %swapped = call i64 @llvm.bswap.i64(i64 %a)
    store i64 %swapped, i64 *%ptr
    ret void
@@ -85,3 +85,15 @@ define void @f7(i64 %src, i64 %index, i64 %a) {
    store i64 %swapped, i64 *%ptr
    ret void
  }
+
+; Check that volatile stores do not use STRVG, which might access the
+; storage multple times.
+define void @f8(i64 *%dst, i64 %a) {
+; CHECK: f8:
+; CHECK: lrvgr [[REG:%r[0-5]]], %r3
+; CHECK: stg [[REG]], 0(%r2)
+; CHECK: br %r14
+  %swapped = call i64 @llvm.bswap.i64(i64 %a)
+  store volatile i64 %swapped, i64 *%dst
+  ret void
+}
author	Richard Sandiford <rsandifo@linux.vnet.ibm.com>
	Fri, 31 May 2013 13:25:22 +0000 (13:25 +0000)
committer	Richard Sandiford <rsandifo@linux.vnet.ibm.com>
	Fri, 31 May 2013 13:25:22 +0000 (13:25 +0000)
lib/Target/SystemZ/SystemZInstrInfo.td		patch \| blob \| history
lib/Target/SystemZ/SystemZOperators.td		patch \| blob \| history
test/CodeGen/SystemZ/bswap-02.ll		patch \| blob \| history
test/CodeGen/SystemZ/bswap-03.ll		patch \| blob \| history
test/CodeGen/SystemZ/bswap-04.ll		patch \| blob \| history
test/CodeGen/SystemZ/bswap-05.ll		patch \| blob \| history