Disable AArch64 fast-isel on big-endian call vector returns.

[oota-llvm.git] / lib / Target / AArch64 / AArch64FastISel.cpp
diff --git a/lib/Target/AArch64/AArch64FastISel.cpp b/lib/Target/AArch64/AArch64FastISel.cpp

index 4d18a4e0b0ff129ed2fa7a86bfa407d2bb64a5ee..c3f6859f510d6840396ef2564bd0eaf782793323 100644 (file)
--- a/lib/Target/AArch64/AArch64FastISel.cpp
+++ b/lib/Target/AArch64/AArch64FastISel.cpp
@@ -14,6 +14,7 @@
  //===----------------------------------------------------------------------===//
  
  #include "AArch64.h"
+#include "AArch64CallingConvention.h"
  #include "AArch64Subtarget.h"
  #include "AArch64TargetMachine.h"
  #include "MCTargetDesc/AArch64AddressingModes.h"
@@ -244,9 +245,10 @@ public:
    unsigned fastMaterializeFloatZero(const ConstantFP* CF) override;
  
    explicit AArch64FastISel(FunctionLoweringInfo &FuncInfo,
-                         const TargetLibraryInfo *LibInfo)
+                           const TargetLibraryInfo *LibInfo)
        : FastISel(FuncInfo, LibInfo, /*SkipTargetIndependentISel=*/true) {
-    Subtarget = &TM.getSubtarget<AArch64Subtarget>();
+    Subtarget =
+        &static_cast<const AArch64Subtarget &>(FuncInfo.MF->getSubtarget());
      Context = &FuncInfo.Fn->getContext();
    }
  
@@ -301,6 +303,8 @@ static unsigned getImplicitScaleFactor(MVT VT) {
  CCAssignFn *AArch64FastISel::CCAssignFnForCall(CallingConv::ID CC) const {
    if (CC == CallingConv::WebKit_JS)
      return CC_AArch64_WebKit_JS;
+  if (CC == CallingConv::GHC)
+    return CC_AArch64_GHC;
    return Subtarget->isTargetDarwin() ? CC_AArch64_DarwinPCS : CC_AArch64_AAPCS;
  }
  
@@ -366,6 +370,24 @@ unsigned AArch64FastISel::materializeFP(const ConstantFP *CFP, MVT VT) {
      return fastEmitInst_i(Opc, TLI.getRegClassFor(VT), Imm);
    }
  
+  // For the MachO large code model materialize the FP constant in code.
+  if (Subtarget->isTargetMachO() && TM.getCodeModel() == CodeModel::Large) {
+    unsigned Opc1 = Is64Bit ? AArch64::MOVi64imm : AArch64::MOVi32imm;
+    const TargetRegisterClass *RC = Is64Bit ?
+        &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;
+
+    unsigned TmpReg = createResultReg(RC);
+    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc, TII.get(Opc1), TmpReg)
+        .addImm(CFP->getValueAPF().bitcastToAPInt().getZExtValue());
+
+    unsigned ResultReg = createResultReg(TLI.getRegClassFor(VT));
+    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
+            TII.get(TargetOpcode::COPY), ResultReg)
+        .addReg(TmpReg, getKillRegState(true));
+
+    return ResultReg;
+  }
+
    // Materialize via constant pool.  MachineConstantPool wants an explicit
    // alignment.
    unsigned Align = DL.getPrefTypeAlignment(CFP->getType());
@@ -752,7 +774,7 @@ bool AArch64FastISel::computeAddress(const Value *Obj, Address &Addr, Type *Ty)
      if (Addr.getOffsetReg())
        break;
  
-    if (DL.getTypeSizeInBits(Ty) != 8)
+    if (!Ty || DL.getTypeSizeInBits(Ty) != 8)
        break;
  
      const Value *LHS = U->getOperand(0);
@@ -1895,7 +1917,8 @@ bool AArch64FastISel::selectLoad(const Instruction *I) {
      // could select it. Emit a copy to subreg if necessary. FastISel will remove
      // it when it selects the integer extend.
      unsigned Reg = lookUpRegForValue(IntExtVal);
-    if (!Reg) {
+    auto *MI = MRI.getUniqueVRegDef(Reg);
+    if (!MI) {
        if (RetVT == MVT::i64 && VT <= MVT::i32) {
          if (WantZExt) {
            // Delete the last emitted instruction from emitLoad (SUBREG_TO_REG).
@@ -1913,10 +1936,7 @@ bool AArch64FastISel::selectLoad(const Instruction *I) {
      // The integer extend has already been emitted - delete all the instructions
      // that have been emitted by the integer extend lowering code and use the
      // result from the load instruction directly.
-    while (Reg) {
-      auto *MI = MRI.getUniqueVRegDef(Reg);
-      if (!MI)
-        break;
+    while (MI) {
        Reg = 0;
        for (auto &Opnd : MI->uses()) {
          if (Opnd.isReg()) {
@@ -1925,6 +1945,9 @@ bool AArch64FastISel::selectLoad(const Instruction *I) {
          }
        }
        MI->eraseFromParent();
+      MI = nullptr;
+      if (Reg)
+        MI = MRI.getUniqueVRegDef(Reg);
      }
      updateValueMap(IntExtVal, ResultReg);
      return true;
@@ -2112,15 +2135,15 @@ bool AArch64FastISel::emitCompareAndBranch(const BranchInst *BI) {
  
    int TestBit = -1;
    bool IsCmpNE;
-  if ((Predicate == CmpInst::ICMP_EQ) || (Predicate == CmpInst::ICMP_NE)) {
-    if (const auto *C = dyn_cast<Constant>(LHS))
-      if (C->isNullValue())
-        std::swap(LHS, RHS);
-
-    if (!isa<Constant>(RHS))
-      return false;
+  switch (Predicate) {
+  default:
+    return false;
+  case CmpInst::ICMP_EQ:
+  case CmpInst::ICMP_NE:
+    if (isa<Constant>(LHS) && cast<Constant>(LHS)->isNullValue())
+      std::swap(LHS, RHS);
  
-    if (!cast<Constant>(RHS)->isNullValue())
+    if (!isa<Constant>(RHS) || !cast<Constant>(RHS)->isNullValue())
        return false;
  
      if (const auto *AI = dyn_cast<BinaryOperator>(LHS))
@@ -2143,26 +2166,27 @@ bool AArch64FastISel::emitCompareAndBranch(const BranchInst *BI) {
        TestBit = 0;
  
      IsCmpNE = Predicate == CmpInst::ICMP_NE;
-  } else if (Predicate == CmpInst::ICMP_SLT) {
-    if (!isa<Constant>(RHS))
-      return false;
-
-    if (!cast<Constant>(RHS)->isNullValue())
+    break;
+  case CmpInst::ICMP_SLT:
+  case CmpInst::ICMP_SGE:
+    if (!isa<Constant>(RHS) || !cast<Constant>(RHS)->isNullValue())
        return false;
  
      TestBit = BW - 1;
-    IsCmpNE = true;
-  } else if (Predicate == CmpInst::ICMP_SGT) {
+    IsCmpNE = Predicate == CmpInst::ICMP_SLT;
+    break;
+  case CmpInst::ICMP_SGT:
+  case CmpInst::ICMP_SLE:
      if (!isa<ConstantInt>(RHS))
        return false;
  
-    if (cast<ConstantInt>(RHS)->getValue() != -1)
+    if (cast<ConstantInt>(RHS)->getValue() != APInt(BW, -1, true))
        return false;
  
      TestBit = BW - 1;
-    IsCmpNE = false;
-  } else
-    return false;
+    IsCmpNE = Predicate == CmpInst::ICMP_SLE;
+    break;
+  } // end switch
  
    static const unsigned OpcTable[2][2][2] = {
      { {AArch64::CBZW,  AArch64::CBZX },
@@ -3011,6 +3035,11 @@ bool AArch64FastISel::finishCall(CallLoweringInfo &CLI, MVT RetVT,
  
      // Copy all of the result registers out of their specified physreg.
      MVT CopyVT = RVLocs[0].getValVT();
+
+    // TODO: Handle big-endian results
+    if (CopyVT.isVector() && !Subtarget->isLittleEndian())
+      return false;
+
      unsigned ResultReg = createResultReg(TLI.getRegClassFor(CopyVT));
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
              TII.get(TargetOpcode::COPY), ResultReg)
@@ -3135,7 +3164,7 @@ bool AArch64FastISel::fastLowerCall(CallLoweringInfo &CLI) {
  
    // Add a register mask with the call-preserved registers.
    // Proper defs for return values will be added by setPhysRegsDeadExcept().
-  MIB.addRegMask(TRI.getCallPreservedMask(CC));
+  MIB.addRegMask(TRI.getCallPreservedMask(*FuncInfo.MF, CC));
  
    CLI.Call = MIB;
  
@@ -3302,8 +3331,7 @@ bool AArch64FastISel::fastLowerIntrinsicCall(const IntrinsicInst *II) {
      MFI->setFrameAddressIsTaken(true);
  
      const AArch64RegisterInfo *RegInfo =
-        static_cast<const AArch64RegisterInfo *>(
-            TM.getSubtargetImpl()->getRegisterInfo());
+        static_cast<const AArch64RegisterInfo *>(Subtarget->getRegisterInfo());
      unsigned FramePtr = RegInfo->getFrameRegister(*(FuncInfo.MF));
      unsigned SrcReg = MRI.createVirtualRegister(&AArch64::GPR64RegClass);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
@@ -3886,7 +3914,7 @@ unsigned AArch64FastISel::emitLSL_rr(MVT RetVT, unsigned Op0Reg, bool Op0IsKill,
  
  unsigned AArch64FastISel::emitLSL_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
                                       bool Op0IsKill, uint64_t Shift,
-                                     bool IsZext) {
+                                     bool IsZExt) {
    assert(RetVT.SimpleTy >= SrcVT.SimpleTy &&
           "Unexpected source/return type pair.");
    assert((SrcVT == MVT::i1 || SrcVT == MVT::i8 || SrcVT == MVT::i16 ||
@@ -3899,6 +3927,20 @@ unsigned AArch64FastISel::emitLSL_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
    unsigned RegSize = Is64Bit ? 64 : 32;
    unsigned DstBits = RetVT.getSizeInBits();
    unsigned SrcBits = SrcVT.getSizeInBits();
+  const TargetRegisterClass *RC =
+      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;
+
+  // Just emit a copy for "zero" shifts.
+  if (Shift == 0) {
+    if (RetVT == SrcVT) {
+      unsigned ResultReg = createResultReg(RC);
+      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
+              TII.get(TargetOpcode::COPY), ResultReg)
+          .addReg(Op0, getKillRegState(Op0IsKill));
+      return ResultReg;
+    } else
+      return emitIntExt(SrcVT, Op0, RetVT, IsZExt);
+  }
  
    // Don't deal with undefined shifts.
    if (Shift >= DstBits)
@@ -3936,9 +3978,7 @@ unsigned AArch64FastISel::emitLSL_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
      {AArch64::SBFMWri, AArch64::SBFMXri},
      {AArch64::UBFMWri, AArch64::UBFMXri}
    };
-  unsigned Opc = OpcTable[IsZext][Is64Bit];
-  const TargetRegisterClass *RC =
-      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;
+  unsigned Opc = OpcTable[IsZExt][Is64Bit];
    if (SrcVT.SimpleTy <= MVT::i32 && RetVT == MVT::i64) {
      unsigned TmpReg = MRI.createVirtualRegister(RC);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
@@ -3984,8 +4024,9 @@ unsigned AArch64FastISel::emitLSR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
                                       bool IsZExt) {
    assert(RetVT.SimpleTy >= SrcVT.SimpleTy &&
           "Unexpected source/return type pair.");
-  assert((SrcVT == MVT::i8 || SrcVT == MVT::i16 || SrcVT == MVT::i32 ||
-          SrcVT == MVT::i64) && "Unexpected source value type.");
+  assert((SrcVT == MVT::i1 || SrcVT == MVT::i8 || SrcVT == MVT::i16 ||
+          SrcVT == MVT::i32 || SrcVT == MVT::i64) &&
+         "Unexpected source value type.");
    assert((RetVT == MVT::i8 || RetVT == MVT::i16 || RetVT == MVT::i32 ||
            RetVT == MVT::i64) && "Unexpected return value type.");
  
@@ -3993,6 +4034,20 @@ unsigned AArch64FastISel::emitLSR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
    unsigned RegSize = Is64Bit ? 64 : 32;
    unsigned DstBits = RetVT.getSizeInBits();
    unsigned SrcBits = SrcVT.getSizeInBits();
+  const TargetRegisterClass *RC =
+      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;
+
+  // Just emit a copy for "zero" shifts.
+  if (Shift == 0) {
+    if (RetVT == SrcVT) {
+      unsigned ResultReg = createResultReg(RC);
+      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
+              TII.get(TargetOpcode::COPY), ResultReg)
+      .addReg(Op0, getKillRegState(Op0IsKill));
+      return ResultReg;
+    } else
+      return emitIntExt(SrcVT, Op0, RetVT, IsZExt);
+  }
  
    // Don't deal with undefined shifts.
    if (Shift >= DstBits)
@@ -4045,8 +4100,6 @@ unsigned AArch64FastISel::emitLSR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
      {AArch64::UBFMWri, AArch64::UBFMXri}
    };
    unsigned Opc = OpcTable[IsZExt][Is64Bit];
-  const TargetRegisterClass *RC =
-      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;
    if (SrcVT.SimpleTy <= MVT::i32 && RetVT == MVT::i64) {
      unsigned TmpReg = MRI.createVirtualRegister(RC);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
@@ -4092,8 +4145,9 @@ unsigned AArch64FastISel::emitASR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
                                       bool IsZExt) {
    assert(RetVT.SimpleTy >= SrcVT.SimpleTy &&
           "Unexpected source/return type pair.");
-  assert((SrcVT == MVT::i8 || SrcVT == MVT::i16 || SrcVT == MVT::i32 ||
-          SrcVT == MVT::i64) && "Unexpected source value type.");
+  assert((SrcVT == MVT::i1 || SrcVT == MVT::i8 || SrcVT == MVT::i16 ||
+          SrcVT == MVT::i32 || SrcVT == MVT::i64) &&
+         "Unexpected source value type.");
    assert((RetVT == MVT::i8 || RetVT == MVT::i16 || RetVT == MVT::i32 ||
            RetVT == MVT::i64) && "Unexpected return value type.");
  
@@ -4101,6 +4155,20 @@ unsigned AArch64FastISel::emitASR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
    unsigned RegSize = Is64Bit ? 64 : 32;
    unsigned DstBits = RetVT.getSizeInBits();
    unsigned SrcBits = SrcVT.getSizeInBits();
+  const TargetRegisterClass *RC =
+      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;
+
+  // Just emit a copy for "zero" shifts.
+  if (Shift == 0) {
+    if (RetVT == SrcVT) {
+      unsigned ResultReg = createResultReg(RC);
+      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
+              TII.get(TargetOpcode::COPY), ResultReg)
+      .addReg(Op0, getKillRegState(Op0IsKill));
+      return ResultReg;
+    } else
+      return emitIntExt(SrcVT, Op0, RetVT, IsZExt);
+  }
  
    // Don't deal with undefined shifts.
    if (Shift >= DstBits)
@@ -4141,8 +4209,6 @@ unsigned AArch64FastISel::emitASR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,
      {AArch64::UBFMWri, AArch64::UBFMXri}
    };
    unsigned Opc = OpcTable[IsZExt][Is64Bit];
-  const TargetRegisterClass *RC =
-      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;
    if (SrcVT.SimpleTy <= MVT::i32 && RetVT == MVT::i64) {
      unsigned TmpReg = MRI.createVirtualRegister(RC);
      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, DbgLoc,
@@ -4503,7 +4569,7 @@ bool AArch64FastISel::selectShift(const Instruction *I) {
      unsigned ResultReg = 0;
      uint64_t ShiftVal = C->getZExtValue();
      MVT SrcVT = RetVT;
-    bool IsZExt = (I->getOpcode() == Instruction::AShr) ? false : true;
+    bool IsZExt = I->getOpcode() != Instruction::AShr;
      const Value *Op0 = I->getOperand(0);
      if (const auto *ZExt = dyn_cast<ZExtInst>(Op0)) {
        if (!isIntExtFree(ZExt)) {