[weak vtables] Remove a bunch of weak vtables

[oota-llvm.git] / lib / Target / X86 / X86InstrInfo.cpp
diff --git a/lib/Target/X86/X86InstrInfo.cpp b/lib/Target/X86/X86InstrInfo.cpp

index 32d2e16fedc26453484856ff3f1cae86a68bf735..d0dfb80a77b23dd00d0d1760f768cecd37c63a6c 100644 (file)
--- a/lib/Target/X86/X86InstrInfo.cpp
+++ b/lib/Target/X86/X86InstrInfo.cpp
@@ -24,6 +24,7 @@
  #include "llvm/CodeGen/MachineFrameInfo.h"
  #include "llvm/CodeGen/MachineInstrBuilder.h"
  #include "llvm/CodeGen/MachineRegisterInfo.h"
+#include "llvm/CodeGen/StackMaps.h"
  #include "llvm/IR/DerivedTypes.h"
  #include "llvm/IR/LLVMContext.h"
  #include "llvm/MC/MCAsmInfo.h"
@@ -35,7 +36,7 @@
  #include "llvm/Target/TargetOptions.h"
  #include <limits>
  
-#define GET_INSTRINFO_CTOR
+#define GET_INSTRINFO_CTOR_DTOR
  #include "X86GenInstrInfo.inc"
  
  using namespace llvm;
@@ -91,6 +92,9 @@ struct X86OpTblEntry {
    uint16_t Flags;
  };
  
+// Pin the vtable to this file.
+void X86InstrInfo::anchor() {}
+
  X86InstrInfo::X86InstrInfo(X86TargetMachine &tm)
    : X86GenInstrInfo((tm.getSubtarget<X86Subtarget>().is64Bit()
                       ? X86::ADJCALLSTACKDOWN64
@@ -441,7 +445,6 @@ X86InstrInfo::X86InstrInfo(X86TargetMachine &tm)
      { X86::MOVSX64rr8,      X86::MOVSX64rm8,          0 },
      { X86::MOVUPDrr,        X86::MOVUPDrm,            TB_ALIGN_16 },
      { X86::MOVUPSrr,        X86::MOVUPSrm,            0 },
-    { X86::MOVZDI2PDIrr,    X86::MOVZDI2PDIrm,        0 },
      { X86::MOVZQI2PQIrr,    X86::MOVZQI2PQIrm,        0 },
      { X86::MOVZPQILo2PQIrr, X86::MOVZPQILo2PQIrm,     TB_ALIGN_16 },
      { X86::MOVZX16rr8,      X86::MOVZX16rm8,          0 },
@@ -502,7 +505,6 @@ X86InstrInfo::X86InstrInfo(X86TargetMachine &tm)
      { X86::VMOVSHDUPrr,     X86::VMOVSHDUPrm,         TB_ALIGN_16 },
      { X86::VMOVUPDrr,       X86::VMOVUPDrm,           0 },
      { X86::VMOVUPSrr,       X86::VMOVUPSrm,           0 },
-    { X86::VMOVZDI2PDIrr,   X86::VMOVZDI2PDIrm,       0 },
      { X86::VMOVZQI2PQIrr,   X86::VMOVZQI2PQIrm,       0 },
      { X86::VMOVZPQILo2PQIrr,X86::VMOVZPQILo2PQIrm,    TB_ALIGN_16 },
      { X86::VPABSBrr128,     X86::VPABSBrm128,         0 },
@@ -3166,7 +3168,8 @@ static unsigned getLoadStoreRegOpcode(unsigned Reg,
      assert(X86::RFP80RegClass.hasSubClassEq(RC) && "Unknown 10-byte regclass");
      return load ? X86::LD_Fp80m : X86::ST_FpP80m;
    case 16: {
-    assert(X86::VR128RegClass.hasSubClassEq(RC) && "Unknown 16-byte regclass");
+    assert((X86::VR128RegClass.hasSubClassEq(RC) ||
+            X86::VR128XRegClass.hasSubClassEq(RC))&& "Unknown 16-byte regclass");
      // If stack is realigned we can use aligned stores.
      if (isStackAligned)
        return load ?
@@ -3178,7 +3181,8 @@ static unsigned getLoadStoreRegOpcode(unsigned Reg,
          (HasAVX ? X86::VMOVUPSmr : X86::MOVUPSmr);
    }
    case 32:
-    assert(X86::VR256RegClass.hasSubClassEq(RC) && "Unknown 32-byte regclass");
+    assert((X86::VR256RegClass.hasSubClassEq(RC) ||
+            X86::VR256XRegClass.hasSubClassEq(RC)) && "Unknown 32-byte regclass");
      // If stack is realigned we can use aligned stores.
      if (isStackAligned)
        return load ? X86::VMOVAPSYrm : X86::VMOVAPSYmr;
@@ -4194,10 +4198,77 @@ breakPartialRegDependency(MachineBasicBlock::iterator MI, unsigned OpNum,
    MI->addRegisterKilled(Reg, TRI, true);
  }
  
-MachineInstr* X86InstrInfo::foldMemoryOperandImpl(MachineFunction &MF,
-                                                  MachineInstr *MI,
-                                           const SmallVectorImpl<unsigned> &Ops,
-                                                  int FrameIndex) const {
+static MachineInstr* foldPatchpoint(MachineFunction &MF,
+                                    MachineInstr *MI,
+                                    const SmallVectorImpl<unsigned> &Ops,
+                                    int FrameIndex,
+                                    const TargetInstrInfo &TII) {
+  bool hasDef = MI->getOperand(0).isReg() && MI->getOperand(0).isDef() &&
+                !MI->getOperand(0).isImplicit();
+  unsigned StartIdx = hasDef ? 1 : 0;
+
+  switch (MI->getOpcode()) {
+  case TargetOpcode::STACKMAP:
+    StartIdx += 2; // Skip ID, nShadowBytes.
+    break;
+  case TargetOpcode::PATCHPOINT:
+    // Skip ID, numBytes, Target, numArgs.
+    // For PatchPoint, the call args are not foldable.
+    StartIdx += MI->getOperand(StartIdx+3).getImm() + 4;
+    break;
+  default:
+    llvm_unreachable("unexpected stackmap opcode");
+  }
+
+  // Return false if any operands requested for folding are not foldable (not
+  // part of the stackmap's live values).
+  for (SmallVectorImpl<unsigned>::const_iterator I = Ops.begin(), E = Ops.end();
+       I != E; ++I) {
+    if (*I < StartIdx)
+      return 0;
+  }
+
+  MachineInstr *NewMI =
+    MF.CreateMachineInstr(TII.get(MI->getOpcode()), MI->getDebugLoc(), true);
+  MachineInstrBuilder MIB(MF, NewMI);
+
+  // No need to fold return, the meta data, and function arguments
+  for (unsigned i = 0; i < StartIdx; ++i)
+    MIB.addOperand(MI->getOperand(i));
+
+  for (unsigned i = StartIdx; i < MI->getNumOperands(); ++i) {
+    MachineOperand &MO = MI->getOperand(i);
+    if (std::find(Ops.begin(), Ops.end(), i) != Ops.end()) {
+      assert(MO.getReg() && "patchpoint can only fold a vreg operand");
+      // Compute the spill slot size and offset.
+      const TargetRegisterClass *RC = MF.getRegInfo().getRegClass(MO.getReg());
+      unsigned SpillSize;
+      unsigned SpillOffset;
+      bool Valid = TII.getStackSlotRange(RC, MO.getSubReg(), SpillSize,
+                                         SpillOffset, &MF.getTarget());
+      if (!Valid)
+        report_fatal_error("cannot spill patchpoint subregister operand");
+
+      MIB.addOperand(MachineOperand::CreateImm(StackMaps::IndirectMemRefOp));
+      MIB.addOperand(MachineOperand::CreateImm(SpillSize));
+      MIB.addOperand(MachineOperand::CreateFI(FrameIndex));
+      addOffset(MIB, SpillOffset);
+    }
+    else
+      MIB.addOperand(MO);
+  }
+  return NewMI;
+}
+
+MachineInstr*
+X86InstrInfo::foldMemoryOperandImpl(MachineFunction &MF, MachineInstr *MI,
+                                    const SmallVectorImpl<unsigned> &Ops,
+                                    int FrameIndex) const {
+  // Special case stack map and patch point intrinsics.
+  if (MI->getOpcode() == TargetOpcode::STACKMAP
+      || MI->getOpcode() == TargetOpcode::PATCHPOINT) {
+    return foldPatchpoint(MF, MI, Ops, FrameIndex, *this);
+  }
    // Check switch flag
    if (NoFusing) return NULL;
  
@@ -4244,6 +4315,12 @@ MachineInstr* X86InstrInfo::foldMemoryOperandImpl(MachineFunction &MF,
                                                    MachineInstr *MI,
                                             const SmallVectorImpl<unsigned> &Ops,
                                                    MachineInstr *LoadMI) const {
+  // If loading from a FrameIndex, fold directly from the FrameIndex.
+  unsigned NumOps = LoadMI->getDesc().getNumOperands();
+  int FrameIndex;
+  if (isLoadFromStackSlot(LoadMI, FrameIndex))
+    return foldMemoryOperandImpl(MF, MI, Ops, FrameIndex);
+
    // Check switch flag
    if (NoFusing) return NULL;
  
@@ -4369,7 +4446,6 @@ MachineInstr* X86InstrInfo::foldMemoryOperandImpl(MachineFunction &MF,
        return NULL;
  
      // Folding a normal load. Just copy the load's address operands.
-    unsigned NumOps = LoadMI->getDesc().getNumOperands();
      for (unsigned i = NumOps - X86::AddrNumOperands; i != NumOps; ++i)
        MOs.push_back(LoadMI->getOperand(i));
      break;