[AArch64] Fix miscompile of sdiv-by-power-of-2.

[oota-llvm.git] / lib / Target / AArch64 / AArch64FastISel.cpp
diff --git a/lib/Target/AArch64/AArch64FastISel.cpp b/lib/Target/AArch64/AArch64FastISel.cpp

index b074be9419cc3be0def5f7014b0acb633b2dbe3d..5972d4aad78ba33c6461d9383c3f4bd3142e9cac 100644 (file)
--- a/lib/Target/AArch64/AArch64FastISel.cpp
+++ b/lib/Target/AArch64/AArch64FastISel.cpp
@@ -189,6 +189,7 @@ private:
    unsigned emitAdd(MVT RetVT, const Value *LHS, const Value *RHS,
                     bool SetFlags = false, bool WantResult = true,
                     bool IsZExt = false);
+  unsigned emitAdd_ri_(MVT VT, unsigned Op0, bool Op0IsKill, int64_t Imm);
    unsigned emitSub(MVT RetVT, const Value *LHS, const Value *RHS,
                     bool SetFlags = false, bool WantResult = true,
                     bool IsZExt = false);
@@ -1003,20 +1004,10 @@ bool AArch64FastISel::simplifyAddress(Address &Addr, MVT VT) {
    // reg+offset into a register.
    if (ImmediateOffsetNeedsLowering) {
      unsigned ResultReg;
-    if (Addr.getReg()) {
+    if (Addr.getReg())
        // Try to fold the immediate into the add instruction.
-      if (Offset < 0)
-        ResultReg = emitAddSub_ri(/*UseAdd=*/false, MVT::i64, Addr.getReg(),
-                                  /*IsKill=*/false, -Offset);
-      else
-        ResultReg = emitAddSub_ri(/*UseAdd=*/true, MVT::i64, Addr.getReg(),
-                                  /*IsKill=*/false, Offset);
-      if (!ResultReg) {
-        unsigned ImmReg = fastEmit_i(MVT::i64, MVT::i64, ISD::Constant, Offset);
-        ResultReg = emitAddSub_rr(/*UseAdd=*/true, MVT::i64, Addr.getReg(),
-                                  /*IsKill=*/false, ImmReg, /*IsKill=*/true);
-      }
-    } else
+      ResultReg = emitAdd_ri_(MVT::i64, Addr.getReg(), /*IsKill=*/false, Offset);
+    else
        ResultReg = fastEmit_i(MVT::i64, MVT::i64, ISD::Constant, Offset);
  
      if (!ResultReg)
@@ -1443,6 +1434,30 @@ unsigned AArch64FastISel::emitAdd(MVT RetVT, const Value *LHS, const Value *RHS,
                      IsZExt);
  }
  
+/// \brief This method is a wrapper to simplify add emission.
+///
+/// First try to emit an add with an immediate operand using emitAddSub_ri. If
+/// that fails, then try to materialize the immediate into a register and use
+/// emitAddSub_rr instead.
+unsigned AArch64FastISel::emitAdd_ri_(MVT VT, unsigned Op0, bool Op0IsKill,
+                                      int64_t Imm) {
+  unsigned ResultReg;
+  if (Imm < 0)
+    ResultReg = emitAddSub_ri(false, VT, Op0, Op0IsKill, -Imm);
+  else
+    ResultReg = emitAddSub_ri(true, VT, Op0, Op0IsKill, Imm);
+
+  if (ResultReg)
+    return ResultReg;
+
+  unsigned CReg = fastEmit_i(VT, VT, ISD::Constant, Imm);
+  if (!CReg)
+    return 0;
+
+  ResultReg = emitAddSub_rr(true, VT, Op0, Op0IsKill, CReg, true);
+  return ResultReg;
+}
+
  unsigned AArch64FastISel::emitSub(MVT RetVT, const Value *LHS, const Value *RHS,
                                    bool SetFlags, bool WantResult, bool IsZExt) {
    return emitAddSub(/*UseAdd=*/false, RetVT, LHS, RHS, SetFlags, WantResult,
@@ -4500,9 +4515,8 @@ bool AArch64FastISel::selectSDiv(const Instruction *I) {
      return true;
    }
  
-  unsigned Pow2MinusOne = (1 << Lg2) - 1;
-  unsigned AddReg = emitAddSub_ri(/*UseAdd=*/true, VT, Src0Reg,
-                                  /*IsKill=*/false, Pow2MinusOne);
+  int64_t Pow2MinusOne = (1ULL << Lg2) - 1;
+  unsigned AddReg = emitAdd_ri_(VT, Src0Reg, /*IsKill=*/false, Pow2MinusOne);
    if (!AddReg)
      return false;
  
@@ -4542,6 +4556,10 @@ bool AArch64FastISel::selectSDiv(const Instruction *I) {
    return true;
  }
  
+/// This is mostly a copy of the existing FastISel GEP code, but we have to
+/// duplicate it for AArch64, because otherwise we would bail out even for
+/// simple cases. This is because the standard fastEmit functions don't cover
+/// MUL at all and ADD is lowered very inefficientily.
  bool AArch64FastISel::selectGetElementPtr(const Instruction *I) {
    unsigned N = getRegForValue(I->getOperand(0));
    if (!N)
@@ -4573,15 +4591,9 @@ bool AArch64FastISel::selectGetElementPtr(const Instruction *I) {
          continue;
        }
        if (TotalOffs) {
-        N = emitAddSub_ri(/*UseAdd=*/true, VT, N, NIsKill, TotalOffs);
-        if (!N) {
-          unsigned C = fastEmit_i(VT, VT, ISD::Constant, TotalOffs);
-          if (!C)
-            return false;
-          N = emitAddSub_rr(/*UseAdd=*/true, VT, N, NIsKill, C, true);
-          if (!N)
-            return false;
-        }
+        N = emitAdd_ri_(VT, N, NIsKill, TotalOffs);
+        if (!N)
+          return false;
          NIsKill = true;
          TotalOffs = 0;
        }
@@ -4609,17 +4621,10 @@ bool AArch64FastISel::selectGetElementPtr(const Instruction *I) {
      }
    }
    if (TotalOffs) {
-    N = emitAddSub_ri(/*UseAdd=*/true, VT, N, NIsKill, TotalOffs);
-    if (!N) {
-      unsigned C = fastEmit_i(VT, VT, ISD::Constant, TotalOffs);
-      if (!C)
-        return false;
-      N = emitAddSub_rr(/*UseAdd=*/true, VT, N, NIsKill, C, true);
-      if (!N)
-        return false;
-    }
+    N = emitAdd_ri_(VT, N, NIsKill, TotalOffs);
+    if (!N)
+      return false;
    }
-
    updateValueMap(I, N);
    return true;
  }