Suppress the IV reversal transformation in the case that the RHS
authorDan Gohman <gohman@apple.com>
Wed, 20 May 2009 00:34:08 +0000 (00:34 +0000)
committerDan Gohman <gohman@apple.com>
Wed, 20 May 2009 00:34:08 +0000 (00:34 +0000)
of the comparison is defined inside the loop. This fixes a
use-before-def problem, because the transformation puts a use
of the RHS outside the loop.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@72149 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Transforms/Scalar/LoopStrengthReduce.cpp
test/Transforms/LoopStrengthReduce/dont_reverse.ll [new file with mode: 0644]

index 3a71d279772a1124e930053b29e67950ebbb1e0d..adfa5272a9ccc274231570d7f916c97380319d85 100644 (file)
@@ -2456,6 +2456,11 @@ void LoopStrengthReduce::OptimizeLoopCountIV(Loop *L) {
   SCEVHandle One = SE->getIntegerSCEV(1, BackedgeTakenCount->getType());
   if (!AR || !AR->isAffine() || AR->getStepRecurrence(*SE) != One)
     return;
+  // If the RHS of the comparison is defined inside the loop, the rewrite
+  // cannot be done.
+  if (Instruction *CR = dyn_cast<Instruction>(Cond->getOperand(1)))
+    if (L->contains(CR->getParent()))
+      return;
 
   // Make sure the IV is only used for counting.  Value may be preinc or
   // postinc; 2 uses in either case.
diff --git a/test/Transforms/LoopStrengthReduce/dont_reverse.ll b/test/Transforms/LoopStrengthReduce/dont_reverse.ll
new file mode 100644 (file)
index 0000000..39eca6c
--- /dev/null
@@ -0,0 +1,21 @@
+; RUN: llvm-as < %s | opt -loop-reduce | llvm-dis \
+; RUN:    | grep {icmp eq i2 %lsr.iv.next, %xmp4344}
+
+; Don't reverse the iteration if the rhs of the compare is defined
+; inside the loop.
+
+define void @Fill_Buffer() nounwind {
+entry:
+       br label %bb8
+
+bb8:
+       %indvar34 = phi i32 [ 0, %entry ], [ %indvar.next35, %bb8 ]
+       %indvar3451 = trunc i32 %indvar34 to i2
+       %xmp4344 = xor i2 0, -1
+       %xmp104 = icmp eq i2 %indvar3451, %xmp4344
+       %indvar.next35 = add i32 %indvar34, 1
+       br i1 %xmp104, label %bb10, label %bb8
+
+bb10:
+       unreachable
+}