Masked gather and scatter intrinsics - enabled codegen for KNL.

[oota-llvm.git] / lib / CodeGen / SelectionDAG / LegalizeTypes.h
diff --git a/lib/CodeGen/SelectionDAG/LegalizeTypes.h b/lib/CodeGen/SelectionDAG/LegalizeTypes.h

index a726270457535ea17196afa39945630249dfe66d..e24d23d11a94e35887736166913fe258fb5c527e 100644 (file)
--- a/lib/CodeGen/SelectionDAG/LegalizeTypes.h
+++ b/lib/CodeGen/SelectionDAG/LegalizeTypes.h
@@ -13,10 +13,9 @@
  //
  //===----------------------------------------------------------------------===//
  
-#ifndef SELECTIONDAG_LEGALIZETYPES_H
-#define SELECTIONDAG_LEGALIZETYPES_H
+#ifndef LLVM_LIB_CODEGEN_SELECTIONDAG_LEGALIZETYPES_H
+#define LLVM_LIB_CODEGEN_SELECTIONDAG_LEGALIZETYPES_H
  
-#define DEBUG_TYPE "legalize-types"
  #include "llvm/ADT/DenseMap.h"
  #include "llvm/ADT/DenseSet.h"
  #include "llvm/CodeGen/SelectionDAG.h"
@@ -94,6 +93,11 @@ private:
    /// the same size, this map indicates the converted value to use.
    SmallDenseMap<SDValue, SDValue, 8> SoftenedFloats;
  
+  /// PromotedFloats - For floating point nodes that have a smaller precision
+  /// than the smallest supported precision, this map indicates what promoted
+  /// value to use.
+  SmallDenseMap<SDValue, SDValue, 8> PromotedFloats;
+
    /// ExpandedFloats - For float nodes that need to be expanded this map
    /// indicates which operands are the expanded version of the input.
    SmallDenseMap<SDValue, std::pair<SDValue, SDValue>, 8> ExpandedFloats;
@@ -123,8 +127,8 @@ public:
    explicit DAGTypeLegalizer(SelectionDAG &dag)
      : TLI(dag.getTargetLoweringInfo()), DAG(dag),
      ValueTypeActions(TLI.getValueTypeActions()) {
-    assert(MVT::LAST_VALUETYPE <= MVT::MAX_ALLOWED_VALUETYPE &&
-           "Too many value types for ValueTypeActions to hold!");
+    static_assert(MVT::LAST_VALUETYPE <= MVT::MAX_ALLOWED_VALUETYPE,
+                  "Too many value types for ValueTypeActions to hold!");
    }
  
    /// run - This is the main entry point for the type legalizer.  This does a
@@ -168,7 +172,7 @@ private:
                                                   SDNode *Node, bool isSigned);
    std::pair<SDValue, SDValue> ExpandAtomic(SDNode *Node);
  
-  SDValue PromoteTargetBoolean(SDValue Bool, EVT VT);
+  SDValue PromoteTargetBoolean(SDValue Bool, EVT ValVT);
    void ReplaceValueWith(SDValue From, SDValue To);
    void SplitInteger(SDValue Op, SDValue &Lo, SDValue &Hi);
    void SplitInteger(SDValue Op, EVT LoVT, EVT HiVT,
@@ -221,7 +225,7 @@ private:
    SDValue PromoteIntRes_AssertZext(SDNode *N);
    SDValue PromoteIntRes_Atomic0(AtomicSDNode *N);
    SDValue PromoteIntRes_Atomic1(AtomicSDNode *N);
-  SDValue PromoteIntRes_Atomic2(AtomicSDNode *N);
+  SDValue PromoteIntRes_AtomicCmpSwap(AtomicSDNode *N, unsigned ResNo);
    SDValue PromoteIntRes_EXTRACT_SUBVECTOR(SDNode *N);
    SDValue PromoteIntRes_VECTOR_SHUFFLE(SDNode *N);
    SDValue PromoteIntRes_BUILD_VECTOR(SDNode *N);
@@ -238,9 +242,10 @@ private:
    SDValue PromoteIntRes_CTTZ(SDNode *N);
    SDValue PromoteIntRes_EXTRACT_VECTOR_ELT(SDNode *N);
    SDValue PromoteIntRes_FP_TO_XINT(SDNode *N);
-  SDValue PromoteIntRes_FP32_TO_FP16(SDNode *N);
+  SDValue PromoteIntRes_FP_TO_FP16(SDNode *N);
    SDValue PromoteIntRes_INT_EXTEND(SDNode *N);
    SDValue PromoteIntRes_LOAD(LoadSDNode *N);
+  SDValue PromoteIntRes_MLOAD(MaskedLoadSDNode *N);
    SDValue PromoteIntRes_Overflow(SDNode *N);
    SDValue PromoteIntRes_SADDSUBO(SDNode *N, unsigned ResNo);
    SDValue PromoteIntRes_SDIV(SDNode *N);
@@ -286,6 +291,8 @@ private:
    SDValue PromoteIntOp_TRUNCATE(SDNode *N);
    SDValue PromoteIntOp_UINT_TO_FP(SDNode *N);
    SDValue PromoteIntOp_ZERO_EXTEND(SDNode *N);
+  SDValue PromoteIntOp_MSTORE(MaskedStoreSDNode *N, unsigned OpNo);
+  SDValue PromoteIntOp_MLOAD(MaskedLoadSDNode *N, unsigned OpNo);
  
    void PromoteSetCCOperands(SDValue &LHS,SDValue &RHS, ISD::CondCode Code);
  
@@ -388,6 +395,8 @@ private:
    SDValue SoftenFloatRes_ConstantFP(ConstantFPSDNode *N);
    SDValue SoftenFloatRes_EXTRACT_VECTOR_ELT(SDNode *N);
    SDValue SoftenFloatRes_FABS(SDNode *N);
+  SDValue SoftenFloatRes_FMINNUM(SDNode *N);
+  SDValue SoftenFloatRes_FMAXNUM(SDNode *N);
    SDValue SoftenFloatRes_FADD(SDNode *N);
    SDValue SoftenFloatRes_FCEIL(SDNode *N);
    SDValue SoftenFloatRes_FCOPYSIGN(SDNode *N);
@@ -404,7 +413,7 @@ private:
    SDValue SoftenFloatRes_FNEARBYINT(SDNode *N);
    SDValue SoftenFloatRes_FNEG(SDNode *N);
    SDValue SoftenFloatRes_FP_EXTEND(SDNode *N);
-  SDValue SoftenFloatRes_FP16_TO_FP32(SDNode *N);
+  SDValue SoftenFloatRes_FP16_TO_FP(SDNode *N);
    SDValue SoftenFloatRes_FP_ROUND(SDNode *N);
    SDValue SoftenFloatRes_FPOW(SDNode *N);
    SDValue SoftenFloatRes_FPOWI(SDNode *N);
@@ -426,10 +435,10 @@ private:
    bool SoftenFloatOperand(SDNode *N, unsigned OpNo);
    SDValue SoftenFloatOp_BITCAST(SDNode *N);
    SDValue SoftenFloatOp_BR_CC(SDNode *N);
+  SDValue SoftenFloatOp_FP_EXTEND(SDNode *N);
    SDValue SoftenFloatOp_FP_ROUND(SDNode *N);
    SDValue SoftenFloatOp_FP_TO_SINT(SDNode *N);
    SDValue SoftenFloatOp_FP_TO_UINT(SDNode *N);
-  SDValue SoftenFloatOp_FP32_TO_FP16(SDNode *N);
    SDValue SoftenFloatOp_SELECT_CC(SDNode *N);
    SDValue SoftenFloatOp_SETCC(SDNode *N);
    SDValue SoftenFloatOp_STORE(SDNode *N, unsigned OpNo);
@@ -451,6 +460,8 @@ private:
    void ExpandFloatResult(SDNode *N, unsigned ResNo);
    void ExpandFloatRes_ConstantFP(SDNode *N, SDValue &Lo, SDValue &Hi);
    void ExpandFloatRes_FABS      (SDNode *N, SDValue &Lo, SDValue &Hi);
+  void ExpandFloatRes_FMINNUM   (SDNode *N, SDValue &Lo, SDValue &Hi);
+  void ExpandFloatRes_FMAXNUM   (SDNode *N, SDValue &Lo, SDValue &Hi);
    void ExpandFloatRes_FADD      (SDNode *N, SDValue &Lo, SDValue &Hi);
    void ExpandFloatRes_FCEIL     (SDNode *N, SDValue &Lo, SDValue &Hi);
    void ExpandFloatRes_FCOPYSIGN (SDNode *N, SDValue &Lo, SDValue &Hi);
@@ -482,6 +493,7 @@ private:
    // Float Operand Expansion.
    bool ExpandFloatOperand(SDNode *N, unsigned OperandNo);
    SDValue ExpandFloatOp_BR_CC(SDNode *N);
+  SDValue ExpandFloatOp_FCOPYSIGN(SDNode *N);
    SDValue ExpandFloatOp_FP_ROUND(SDNode *N);
    SDValue ExpandFloatOp_FP_TO_SINT(SDNode *N);
    SDValue ExpandFloatOp_FP_TO_UINT(SDNode *N);
@@ -492,6 +504,44 @@ private:
    void FloatExpandSetCCOperands(SDValue &NewLHS, SDValue &NewRHS,
                                  ISD::CondCode &CCCode, SDLoc dl);
  
+
+  //===--------------------------------------------------------------------===//
+  // Float promotion support: LegalizeFloatTypes.cpp
+  //===--------------------------------------------------------------------===//
+
+  SDValue GetPromotedFloat(SDValue Op) {
+    SDValue &PromotedOp = PromotedFloats[Op];
+    RemapValue(PromotedOp);
+    assert(PromotedOp.getNode() && "Operand wasn't promoted?");
+    return PromotedOp;
+  }
+  void SetPromotedFloat(SDValue Op, SDValue Result);
+
+  void PromoteFloatResult(SDNode *N, unsigned ResNo);
+  SDValue PromoteFloatRes_BITCAST(SDNode *N);
+  SDValue PromoteFloatRes_BinOp(SDNode *N);
+  SDValue PromoteFloatRes_ConstantFP(SDNode *N);
+  SDValue PromoteFloatRes_EXTRACT_VECTOR_ELT(SDNode *N);
+  SDValue PromoteFloatRes_FCOPYSIGN(SDNode *N);
+  SDValue PromoteFloatRes_FMAD(SDNode *N);
+  SDValue PromoteFloatRes_FPOWI(SDNode *N);
+  SDValue PromoteFloatRes_FP_ROUND(SDNode *N);
+  SDValue PromoteFloatRes_LOAD(SDNode *N);
+  SDValue PromoteFloatRes_SELECT(SDNode *N);
+  SDValue PromoteFloatRes_SELECT_CC(SDNode *N);
+  SDValue PromoteFloatRes_UnaryOp(SDNode *N);
+  SDValue PromoteFloatRes_UNDEF(SDNode *N);
+  SDValue PromoteFloatRes_XINT_TO_FP(SDNode *N);
+
+  bool PromoteFloatOperand(SDNode *N, unsigned ResNo);
+  SDValue PromoteFloatOp_BITCAST(SDNode *N, unsigned OpNo);
+  SDValue PromoteFloatOp_FCOPYSIGN(SDNode *N, unsigned OpNo);
+  SDValue PromoteFloatOp_FP_EXTEND(SDNode *N, unsigned OpNo);
+  SDValue PromoteFloatOp_FP_TO_XINT(SDNode *N, unsigned OpNo);
+  SDValue PromoteFloatOp_STORE(SDNode *N, unsigned OpNo);
+  SDValue PromoteFloatOp_SELECT_CC(SDNode *N, unsigned OpNo);
+  SDValue PromoteFloatOp_SETCC(SDNode *N, unsigned OpNo);
+
    //===--------------------------------------------------------------------===//
    // Scalarization Support: LegalizeVectorTypes.cpp
    //===--------------------------------------------------------------------===//
@@ -536,10 +586,12 @@ private:
    // Vector Operand Scalarization: <1 x ty> -> ty.
    bool ScalarizeVectorOperand(SDNode *N, unsigned OpNo);
    SDValue ScalarizeVecOp_BITCAST(SDNode *N);
-  SDValue ScalarizeVecOp_EXTEND(SDNode *N);
+  SDValue ScalarizeVecOp_UnaryOp(SDNode *N);
    SDValue ScalarizeVecOp_CONCAT_VECTORS(SDNode *N);
    SDValue ScalarizeVecOp_EXTRACT_VECTOR_ELT(SDNode *N);
+  SDValue ScalarizeVecOp_VSELECT(SDNode *N);
    SDValue ScalarizeVecOp_STORE(StoreSDNode *N, unsigned OpNo);
+  SDValue ScalarizeVecOp_FP_ROUND(SDNode *N, unsigned OpNo);
  
    //===--------------------------------------------------------------------===//
    // Vector Splitting Support: LegalizeVectorTypes.cpp
@@ -560,6 +612,7 @@ private:
    void SplitVecRes_BinOp(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_TernaryOp(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_UnaryOp(SDNode *N, SDValue &Lo, SDValue &Hi);
+  void SplitVecRes_ExtendOp(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_InregOp(SDNode *N, SDValue &Lo, SDValue &Hi);
  
    void SplitVecRes_BITCAST(SDNode *N, SDValue &Lo, SDValue &Hi);
@@ -567,9 +620,12 @@ private:
    void SplitVecRes_BUILD_VECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_CONCAT_VECTORS(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_EXTRACT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
+  void SplitVecRes_INSERT_SUBVECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_FPOWI(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_INSERT_VECTOR_ELT(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_LOAD(LoadSDNode *N, SDValue &Lo, SDValue &Hi);
+  void SplitVecRes_MLOAD(MaskedLoadSDNode *N, SDValue &Lo, SDValue &Hi);
+  void SplitVecRes_MGATHER(MaskedGatherSDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_SCALAR_TO_VECTOR(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_SIGN_EXTEND_INREG(SDNode *N, SDValue &Lo, SDValue &Hi);
    void SplitVecRes_SETCC(SDNode *N, SDValue &Lo, SDValue &Hi);
@@ -581,13 +637,16 @@ private:
    bool SplitVectorOperand(SDNode *N, unsigned OpNo);
    SDValue SplitVecOp_VSELECT(SDNode *N, unsigned OpNo);
    SDValue SplitVecOp_UnaryOp(SDNode *N);
+  SDValue SplitVecOp_TruncateHelper(SDNode *N);
  
    SDValue SplitVecOp_BITCAST(SDNode *N);
    SDValue SplitVecOp_EXTRACT_SUBVECTOR(SDNode *N);
    SDValue SplitVecOp_EXTRACT_VECTOR_ELT(SDNode *N);
    SDValue SplitVecOp_STORE(StoreSDNode *N, unsigned OpNo);
+  SDValue SplitVecOp_MSTORE(MaskedStoreSDNode *N, unsigned OpNo);
+  SDValue SplitVecOp_MSCATTER(MaskedScatterSDNode *N, unsigned OpNo);
+  SDValue SplitVecOp_MGATHER(MaskedGatherSDNode *N, unsigned OpNo);
    SDValue SplitVecOp_CONCAT_VECTORS(SDNode *N);
-  SDValue SplitVecOp_TRUNCATE(SDNode *N);
    SDValue SplitVecOp_VSETCC(SDNode *N);
    SDValue SplitVecOp_FP_ROUND(SDNode *N);
  
@@ -619,6 +678,7 @@ private:
    SDValue WidenVecRes_EXTRACT_SUBVECTOR(SDNode* N);
    SDValue WidenVecRes_INSERT_VECTOR_ELT(SDNode* N);
    SDValue WidenVecRes_LOAD(SDNode* N);
+  SDValue WidenVecRes_MLOAD(MaskedLoadSDNode* N);
    SDValue WidenVecRes_SCALAR_TO_VECTOR(SDNode* N);
    SDValue WidenVecRes_SIGN_EXTEND_INREG(SDNode* N);
    SDValue WidenVecRes_SELECT(SDNode* N);
@@ -630,6 +690,7 @@ private:
  
    SDValue WidenVecRes_Ternary(SDNode *N);
    SDValue WidenVecRes_Binary(SDNode *N);
+  SDValue WidenVecRes_BinaryCanTrap(SDNode *N);
    SDValue WidenVecRes_Convert(SDNode *N);
    SDValue WidenVecRes_POWI(SDNode *N);
    SDValue WidenVecRes_Shift(SDNode *N);
@@ -640,9 +701,11 @@ private:
    bool WidenVectorOperand(SDNode *N, unsigned OpNo);
    SDValue WidenVecOp_BITCAST(SDNode *N);
    SDValue WidenVecOp_CONCAT_VECTORS(SDNode *N);
+  SDValue WidenVecOp_EXTEND(SDNode *N);
    SDValue WidenVecOp_EXTRACT_VECTOR_ELT(SDNode *N);
    SDValue WidenVecOp_EXTRACT_SUBVECTOR(SDNode *N);
    SDValue WidenVecOp_STORE(SDNode* N);
+  SDValue WidenVecOp_MSTORE(SDNode* N, unsigned OpNo);
    SDValue WidenVecOp_SETCC(SDNode* N);
  
    SDValue WidenVecOp_Convert(SDNode *N);
@@ -667,13 +730,13 @@ private:
                                   LoadSDNode *LD, ISD::LoadExtType ExtType);
  
    /// Helper genWidenVectorStores - Helper function to generate a set of
-  /// stores to store a widen vector into non widen memory
+  /// stores to store a widen vector into non-widen memory
    ///   StChain: list of chains for the stores we have generated
    ///   ST:      store of a widen value
    void GenWidenVectorStores(SmallVectorImpl<SDValue> &StChain, StoreSDNode *ST);
  
    /// Helper genWidenVectorTruncStores - Helper function to generate a set of
-  /// stores to store a truncate widen vector into non widen memory
+  /// stores to store a truncate widen vector into non-widen memory
    ///   StChain: list of chains for the stores we have generated
    ///   ST:      store of a widen value
    void GenWidenVectorTruncStores(SmallVectorImpl<SDValue> &StChain,
@@ -701,10 +764,6 @@ private:
        GetExpandedFloat(Op, Lo, Hi);
    }
  
-  /// GetSplitDestVTs - Compute the VTs needed for the low/hi parts of a type
-  /// which is split (or expanded) into two not necessarily identical pieces.
-  void GetSplitDestVTs(EVT InVT, EVT &LoVT, EVT &HiVT);
-
    /// GetPairElements - Use ISD::EXTRACT_ELEMENT nodes to extract the low and
    /// high parts of the given value.
    void GetPairElements(SDValue Pair, SDValue &Lo, SDValue &Hi);
@@ -732,6 +791,12 @@ private:
        GetExpandedFloat(Op, Lo, Hi);
    }
  
+
+  /// This function will split the integer \p Op into \p NumElements
+  /// operations of type \p EltVT and store them in \p Ops.
+  void IntegerToVector(SDValue Op, unsigned NumElements,
+                       SmallVectorImpl<SDValue> &Ops, EVT EltVT);
+
    // Generic Result Expansion.
    void ExpandRes_MERGE_VALUES      (SDNode *N, unsigned ResNo,
                                      SDValue &Lo, SDValue &Hi);