Fixes ARM LNT bot from SLP change in O3

[oota-llvm.git] / lib / Target / ARM / ARMLoadStoreOptimizer.cpp
diff --git a/lib/Target/ARM/ARMLoadStoreOptimizer.cpp b/lib/Target/ARM/ARMLoadStoreOptimizer.cpp

index 8f6b059479620acd1a5595b2e769bce1ff6ed83b..1803a8a588763c5a4fdd03ca899a460e1a3ad332 100644 (file)
--- a/lib/Target/ARM/ARMLoadStoreOptimizer.cpp
+++ b/lib/Target/ARM/ARMLoadStoreOptimizer.cpp
@@ -18,8 +18,12 @@
  #include "ARMBaseRegisterInfo.h"
  #include "ARMMachineFunctionInfo.h"
  #include "MCTargetDesc/ARMAddressingModes.h"
-#include "llvm/DerivedTypes.h"
-#include "llvm/Function.h"
+#include "llvm/ADT/DenseMap.h"
+#include "llvm/ADT/STLExtras.h"
+#include "llvm/ADT/SmallPtrSet.h"
+#include "llvm/ADT/SmallSet.h"
+#include "llvm/ADT/SmallVector.h"
+#include "llvm/ADT/Statistic.h"
  #include "llvm/CodeGen/MachineBasicBlock.h"
  #include "llvm/CodeGen/MachineFunctionPass.h"
  #include "llvm/CodeGen/MachineInstr.h"
@@ -27,19 +31,15 @@
  #include "llvm/CodeGen/MachineRegisterInfo.h"
  #include "llvm/CodeGen/RegisterScavenging.h"
  #include "llvm/CodeGen/SelectionDAGNodes.h"
-#include "llvm/Target/TargetData.h"
+#include "llvm/IR/DataLayout.h"
+#include "llvm/IR/DerivedTypes.h"
+#include "llvm/IR/Function.h"
+#include "llvm/Support/Debug.h"
+#include "llvm/Support/ErrorHandling.h"
+#include "llvm/Support/raw_ostream.h"
  #include "llvm/Target/TargetInstrInfo.h"
  #include "llvm/Target/TargetMachine.h"
  #include "llvm/Target/TargetRegisterInfo.h"
-#include "llvm/Support/ErrorHandling.h"
-#include "llvm/Support/Debug.h"
-#include "llvm/Support/raw_ostream.h"
-#include "llvm/ADT/DenseMap.h"
-#include "llvm/ADT/STLExtras.h"
-#include "llvm/ADT/SmallPtrSet.h"
-#include "llvm/ADT/SmallSet.h"
-#include "llvm/ADT/SmallVector.h"
-#include "llvm/ADT/Statistic.h"
  using namespace llvm;
  
  STATISTIC(NumLDMGened , "Number of ldm instructions generated");
@@ -109,12 +109,12 @@ namespace {
                          unsigned PredReg,
                          unsigned Scratch,
                          DebugLoc dl,
-                        SmallVector<MachineBasicBlock::iterator, 4> &Merges);
+                        SmallVectorImpl<MachineBasicBlock::iterator> &Merges);
      void MergeLDR_STR(MachineBasicBlock &MBB, unsigned SIndex, unsigned Base,
                        int Opcode, unsigned Size,
                        ARMCC::CondCodes Pred, unsigned PredReg,
                        unsigned Scratch, MemOpQueue &MemOps,
-                      SmallVector<MachineBasicBlock::iterator, 4> &Merges);
+                      SmallVectorImpl<MachineBasicBlock::iterator> &Merges);
  
      void AdvanceRS(MachineBasicBlock &MBB, MemOpQueue &MemOps);
      bool FixInvalidRegPairOp(MachineBasicBlock &MBB,
@@ -371,7 +371,7 @@ void ARMLoadStoreOpt::MergeOpsUpdate(MachineBasicBlock &MBB,
                                       ARMCC::CondCodes Pred, unsigned PredReg,
                                       unsigned Scratch,
                                       DebugLoc dl,
-                          SmallVector<MachineBasicBlock::iterator, 4> &Merges) {
+                         SmallVectorImpl<MachineBasicBlock::iterator> &Merges) {
    // First calculate which of the registers should be killed by the merged
    // instruction.
    const unsigned insertPos = memOps[insertAfter].Position;
@@ -444,10 +444,10 @@ void ARMLoadStoreOpt::MergeOpsUpdate(MachineBasicBlock &MBB,
  /// load / store multiple instructions.
  void
  ARMLoadStoreOpt::MergeLDR_STR(MachineBasicBlock &MBB, unsigned SIndex,
-                          unsigned Base, int Opcode, unsigned Size,
-                          ARMCC::CondCodes Pred, unsigned PredReg,
-                          unsigned Scratch, MemOpQueue &MemOps,
-                          SmallVector<MachineBasicBlock::iterator, 4> &Merges) {
+                         unsigned Base, int Opcode, unsigned Size,
+                         ARMCC::CondCodes Pred, unsigned PredReg,
+                         unsigned Scratch, MemOpQueue &MemOps,
+                         SmallVectorImpl<MachineBasicBlock::iterator> &Merges) {
    bool isNotVFP = isi32Load(Opcode) || isi32Store(Opcode);
    int Offset = MemOps[SIndex].Offset;
    int SOffset = Offset;
@@ -456,8 +456,7 @@ ARMLoadStoreOpt::MergeLDR_STR(MachineBasicBlock &MBB, unsigned SIndex,
    DebugLoc dl = Loc->getDebugLoc();
    const MachineOperand &PMO = Loc->getOperand(0);
    unsigned PReg = PMO.getReg();
-  unsigned PRegNum = PMO.isUndef() ? UINT_MAX
-    : getARMRegisterNumbering(PReg);
+  unsigned PRegNum = PMO.isUndef() ? UINT_MAX : TRI->getEncodingValue(PReg);
    unsigned Count = 1;
    unsigned Limit = ~0U;
  
@@ -483,8 +482,7 @@ ARMLoadStoreOpt::MergeLDR_STR(MachineBasicBlock &MBB, unsigned SIndex,
      int NewOffset = MemOps[i].Offset;
      const MachineOperand &MO = MemOps[i].MBBI->getOperand(0);
      unsigned Reg = MO.getReg();
-    unsigned RegNum = MO.isUndef() ? UINT_MAX
-      : getARMRegisterNumbering(Reg);
+    unsigned RegNum = MO.isUndef() ? UINT_MAX : TRI->getEncodingValue(Reg);
      // Register numbers must be in ascending order. For VFP / NEON load and
      // store multiples, the registers must also be consecutive and within the
      // limit on the number of registers per instruction.
@@ -867,7 +865,7 @@ bool ARMLoadStoreOpt::MergeBaseUpdateLoadStore(MachineBasicBlock &MBB,
    bool isLd = isi32Load(Opcode) || Opcode == ARM::VLDRS || Opcode == ARM::VLDRD;
    // Can't do the merge if the destination register is the same as the would-be
    // writeback register.
-  if (isLd && MI->getOperand(0).getReg() == Base)
+  if (MI->getOperand(0).getReg() == Base)
      return false;
  
    unsigned PredReg = 0;
@@ -1190,7 +1188,6 @@ bool ARMLoadStoreOpt::FixInvalidRegPairOp(MachineBasicBlock &MBB,
            OddDeadKill = true;
          }
          // Never kill the base register in the first instruction.
-        // <rdar://problem/11101911>
          if (EvenReg == BaseReg)
            EvenDeadKill = false;
          InsertLDR_STR(MBB, MBBI, OffImm, isLd, dl, NewOpc,
@@ -1261,6 +1258,22 @@ bool ARMLoadStoreOpt::LoadStoreMultipleOpti(MachineBasicBlock &MBB) {
        // merge the ldr's so far, including this one. But don't try to
        // combine the following ldr(s).
        Clobber = (isi32Load(Opcode) && Base == MBBI->getOperand(0).getReg());
+
+      // Watch out for:
+      // r4 := ldr [r0, #8]
+      // r4 := ldr [r0, #4]
+      //
+      // The optimization may reorder the second ldr in front of the first
+      // ldr, which violates write after write(WAW) dependence. The same as
+      // str. Try to merge inst(s) already in MemOps.
+      bool Overlap = false;
+      for (MemOpQueueIter I = MemOps.begin(), E = MemOps.end(); I != E; ++I) {
+        if (TRI->regsOverlap(Reg, I->MBBI->getOperand(0).getReg())) {
+          Overlap = true;
+          break;
+        }
+      }
+
        if (CurrBase == 0 && !Clobber) {
          // Start of a new chain.
          CurrBase = Base;
@@ -1271,7 +1284,7 @@ bool ARMLoadStoreOpt::LoadStoreMultipleOpti(MachineBasicBlock &MBB) {
          MemOps.push_back(MemOpQueueEntry(Offset, Reg, isKill, Position, MBBI));
          ++NumMemOps;
          Advance = true;
-      } else {
+      } else if (!Overlap) {
          if (Clobber) {
            TryMerge = true;
            Advance = true;
@@ -1410,7 +1423,7 @@ bool ARMLoadStoreOpt::MergeReturnIntoLDM(MachineBasicBlock &MBB) {
                Opcode == ARM::LDMIA_UPD) && "Unsupported multiple load-return!");
        PrevMI->setDesc(TII->get(NewOpc));
        MO.setReg(ARM::PC);
-      PrevMI->copyImplicitOps(&*MBBI);
+      PrevMI->copyImplicitOps(*MBB.getParent(), &*MBBI);
        MBB.erase(MBBI);
        return true;
      }
@@ -1450,7 +1463,7 @@ namespace {
      static char ID;
      ARMPreAllocLoadStoreOpt() : MachineFunctionPass(ID) {}
  
-    const TargetData *TD;
+    const DataLayout *TD;
      const TargetInstrInfo *TII;
      const TargetRegisterInfo *TRI;
      const ARMSubtarget *STI;
@@ -1471,7 +1484,7 @@ namespace {
                            unsigned &PredReg, ARMCC::CondCodes &Pred,
                            bool &isT2);
      bool RescheduleOps(MachineBasicBlock *MBB,
-                       SmallVector<MachineInstr*, 4> &Ops,
+                       SmallVectorImpl<MachineInstr *> &Ops,
                         unsigned Base, bool isLd,
                         DenseMap<MachineInstr*, unsigned> &MI2LocMap);
      bool RescheduleLoadStoreInstrs(MachineBasicBlock *MBB);
@@ -1480,7 +1493,7 @@ namespace {
  }
  
  bool ARMPreAllocLoadStoreOpt::runOnMachineFunction(MachineFunction &Fn) {
-  TD  = Fn.getTarget().getTargetData();
+  TD  = Fn.getTarget().getDataLayout();
    TII = Fn.getTarget().getInstrInfo();
    TRI = Fn.getTarget().getRegisterInfo();
    STI = &Fn.getTarget().getSubtarget<ARMSubtarget>();
@@ -1589,8 +1602,9 @@ ARMPreAllocLoadStoreOpt::CanFormLdStDWord(MachineInstr *Op0, MachineInstr *Op1,
      return false;
  
    // Make sure the base address satisfies i64 ld / st alignment requirement.
+  // At the moment, we ignore the memoryoperand's value.
+  // If we want to use AliasAnalysis, we should check it accordingly.
    if (!Op0->hasOneMemOperand() ||
-      !(*Op0->memoperands_begin())->getValue() ||
        (*Op0->memoperands_begin())->isVolatile())
      return false;
  
@@ -1642,7 +1656,7 @@ namespace {
  }
  
  bool ARMPreAllocLoadStoreOpt::RescheduleOps(MachineBasicBlock *MBB,
-                                 SmallVector<MachineInstr*, 4> &Ops,
+                                 SmallVectorImpl<MachineInstr *> &Ops,
                                   unsigned Base, bool isLd,
                                   DenseMap<MachineInstr*, unsigned> &MI2LocMap) {
    bool RetVal = false;
@@ -1737,7 +1751,7 @@ bool ARMPreAllocLoadStoreOpt::RescheduleOps(MachineBasicBlock *MBB,
            Ops.pop_back();
  
            const MCInstrDesc &MCID = TII->get(NewOpc);
-          const TargetRegisterClass *TRC = TII->getRegClass(MCID, 0, TRI);
+          const TargetRegisterClass *TRC = TII->getRegClass(MCID, 0, TRI, *MF);
            MRI->constrainRegClass(EvenReg, TRC);
            MRI->constrainRegClass(OddReg, TRC);
  
@@ -1844,9 +1858,7 @@ ARMPreAllocLoadStoreOpt::RescheduleLoadStoreInstrs(MachineBasicBlock *MBB) {
            if (!StopHere)
              BI->second.push_back(MI);
          } else {
-          SmallVector<MachineInstr*, 4> MIs;
-          MIs.push_back(MI);
-          Base2LdsMap[Base] = MIs;
+          Base2LdsMap[Base].push_back(MI);
            LdBases.push_back(Base);
          }
        } else {
@@ -1862,9 +1874,7 @@ ARMPreAllocLoadStoreOpt::RescheduleLoadStoreInstrs(MachineBasicBlock *MBB) {
            if (!StopHere)
              BI->second.push_back(MI);
          } else {
-          SmallVector<MachineInstr*, 4> MIs;
-          MIs.push_back(MI);
-          Base2StsMap[Base] = MIs;
+          Base2StsMap[Base].push_back(MI);
            StBases.push_back(Base);
          }
        }
@@ -1880,7 +1890,7 @@ ARMPreAllocLoadStoreOpt::RescheduleLoadStoreInstrs(MachineBasicBlock *MBB) {
      // Re-schedule loads.
      for (unsigned i = 0, e = LdBases.size(); i != e; ++i) {
        unsigned Base = LdBases[i];
-      SmallVector<MachineInstr*, 4> &Lds = Base2LdsMap[Base];
+      SmallVectorImpl<MachineInstr *> &Lds = Base2LdsMap[Base];
        if (Lds.size() > 1)
          RetVal |= RescheduleOps(MBB, Lds, Base, true, MI2LocMap);
      }
@@ -1888,7 +1898,7 @@ ARMPreAllocLoadStoreOpt::RescheduleLoadStoreInstrs(MachineBasicBlock *MBB) {
      // Re-schedule stores.
      for (unsigned i = 0, e = StBases.size(); i != e; ++i) {
        unsigned Base = StBases[i];
-      SmallVector<MachineInstr*, 4> &Sts = Base2StsMap[Base];
+      SmallVectorImpl<MachineInstr *> &Sts = Base2StsMap[Base];
        if (Sts.size() > 1)
          RetVal |= RescheduleOps(MBB, Sts, Base, false, MI2LocMap);
      }