BBVectorize: Fix a small bug introduced in r167042.
authorHal Finkel <hfinkel@anl.gov>
Tue, 30 Oct 2012 19:47:37 +0000 (19:47 +0000)
committerHal Finkel <hfinkel@anl.gov>
Tue, 30 Oct 2012 19:47:37 +0000 (19:47 +0000)
We need to make sure that we take the correct load/store alignment
when the inputs are flipped.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@167044 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Transforms/Vectorize/BBVectorize.cpp
test/Transforms/BBVectorize/simple-ldstr.ll

index b29a45e9e81916e263824f8c66713b5858f542b7..32a18f210853d8bc0037add3fc4a387a2cb89188 100644 (file)
@@ -2472,7 +2472,6 @@ namespace {
       Instruction *L = I, *H = J;
       if (FlipMemInputs)
         std::swap(H, L);
-      FlipMemInputs = false;
 
       unsigned NumOperands = I->getNumOperands();
       SmallVector<Value *, 3> ReplacedOperands(NumOperands);
index c1e6a09eea2a55aedd876bcf95992250a6ec2585..6883e844bef77fbe16bba56fdff20f08bf23cf31 100644 (file)
@@ -140,3 +140,31 @@ if.end:
 ; CHECK-AO-NOT: <2 x double>
 }
 
+; Simple 3-pair chain with loads and stores
+define void @test5(double* %a, double* %b, double* %c) nounwind uwtable readonly {
+entry:
+  %i0 = load double* %a, align 8
+  %i1 = load double* %b, align 8
+  %mul = fmul double %i0, %i1
+  %arrayidx3 = getelementptr inbounds double* %a, i64 1
+  %i3 = load double* %arrayidx3, align 8
+  %arrayidx4 = getelementptr inbounds double* %b, i64 1
+  %i4 = load double* %arrayidx4, align 8
+  %mul5 = fmul double %i3, %i4
+  %arrayidx5 = getelementptr inbounds double* %c, i64 1
+  store double %mul5, double* %arrayidx5, align 8
+  store double %mul, double* %c, align 4
+  ret void
+; CHECK: @test5
+; CHECK: %i0.v.i0 = bitcast double* %a to <2 x double>*
+; CHECK: %i1.v.i0 = bitcast double* %b to <2 x double>*
+; CHECK: %i0 = load <2 x double>* %i0.v.i0, align 8
+; CHECK: %i1 = load <2 x double>* %i1.v.i0, align 8
+; CHECK: %mul = fmul <2 x double> %i0, %i1
+; CHECK: %0 = bitcast double* %c to <2 x double>*
+; CHECK: store <2 x double> %mul, <2 x double>* %0, align 4
+; CHECK: ret void
+; CHECK-AO: @test5
+; CHECK-AO-NOT: <2 x double>
+}
+