c1032651cde0df7e954d3bdd7a5959d88d3fc8dc
[oota-llvm.git] / lib / CodeGen / SelectionDAG / TargetLowering.cpp
1 //===-- TargetLowering.cpp - Implement the TargetLowering class -----------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This implements the TargetLowering class.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "llvm/Target/TargetLowering.h"
15 #include "llvm/ADT/BitVector.h"
16 #include "llvm/ADT/STLExtras.h"
17 #include "llvm/CodeGen/Analysis.h"
18 #include "llvm/CodeGen/MachineFrameInfo.h"
19 #include "llvm/CodeGen/MachineFunction.h"
20 #include "llvm/CodeGen/MachineJumpTableInfo.h"
21 #include "llvm/CodeGen/SelectionDAG.h"
22 #include "llvm/IR/DataLayout.h"
23 #include "llvm/IR/DerivedTypes.h"
24 #include "llvm/IR/GlobalVariable.h"
25 #include "llvm/IR/LLVMContext.h"
26 #include "llvm/MC/MCAsmInfo.h"
27 #include "llvm/MC/MCExpr.h"
28 #include "llvm/Support/CommandLine.h"
29 #include "llvm/Support/ErrorHandling.h"
30 #include "llvm/Support/MathExtras.h"
31 #include "llvm/Target/TargetLoweringObjectFile.h"
32 #include "llvm/Target/TargetMachine.h"
33 #include "llvm/Target/TargetRegisterInfo.h"
34 #include "llvm/Target/TargetSubtargetInfo.h"
35 #include <cctype>
36 using namespace llvm;
37
38 /// NOTE: The TargetMachine owns TLOF.
39 TargetLowering::TargetLowering(const TargetMachine &tm)
40   : TargetLoweringBase(tm) {}
41
42 const char *TargetLowering::getTargetNodeName(unsigned Opcode) const {
43   return nullptr;
44 }
45
46 /// Check whether a given call node is in tail position within its function. If
47 /// so, it sets Chain to the input chain of the tail call.
48 bool TargetLowering::isInTailCallPosition(SelectionDAG &DAG, SDNode *Node,
49                                           SDValue &Chain) const {
50   const Function *F = DAG.getMachineFunction().getFunction();
51
52   // Conservatively require the attributes of the call to match those of
53   // the return. Ignore noalias because it doesn't affect the call sequence.
54   AttributeSet CallerAttrs = F->getAttributes();
55   if (AttrBuilder(CallerAttrs, AttributeSet::ReturnIndex)
56       .removeAttribute(Attribute::NoAlias).hasAttributes())
57     return false;
58
59   // It's not safe to eliminate the sign / zero extension of the return value.
60   if (CallerAttrs.hasAttribute(AttributeSet::ReturnIndex, Attribute::ZExt) ||
61       CallerAttrs.hasAttribute(AttributeSet::ReturnIndex, Attribute::SExt))
62     return false;
63
64   // Check if the only use is a function return node.
65   return isUsedByReturnOnly(Node, Chain);
66 }
67
68 /// \brief Set CallLoweringInfo attribute flags based on a call instruction
69 /// and called function attributes.
70 void TargetLowering::ArgListEntry::setAttributes(ImmutableCallSite *CS,
71                                                  unsigned AttrIdx) {
72   isSExt     = CS->paramHasAttr(AttrIdx, Attribute::SExt);
73   isZExt     = CS->paramHasAttr(AttrIdx, Attribute::ZExt);
74   isInReg    = CS->paramHasAttr(AttrIdx, Attribute::InReg);
75   isSRet     = CS->paramHasAttr(AttrIdx, Attribute::StructRet);
76   isNest     = CS->paramHasAttr(AttrIdx, Attribute::Nest);
77   isByVal    = CS->paramHasAttr(AttrIdx, Attribute::ByVal);
78   isInAlloca = CS->paramHasAttr(AttrIdx, Attribute::InAlloca);
79   isReturned = CS->paramHasAttr(AttrIdx, Attribute::Returned);
80   Alignment  = CS->getParamAlignment(AttrIdx);
81 }
82
83 /// Generate a libcall taking the given operands as arguments and returning a
84 /// result of type RetVT.
85 std::pair<SDValue, SDValue>
86 TargetLowering::makeLibCall(SelectionDAG &DAG,
87                             RTLIB::Libcall LC, EVT RetVT,
88                             ArrayRef<SDValue> Ops,
89                             bool isSigned, SDLoc dl,
90                             bool doesNotReturn,
91                             bool isReturnValueUsed) const {
92   TargetLowering::ArgListTy Args;
93   Args.reserve(Ops.size());
94
95   TargetLowering::ArgListEntry Entry;
96   for (SDValue Op : Ops) {
97     Entry.Node = Op;
98     Entry.Ty = Entry.Node.getValueType().getTypeForEVT(*DAG.getContext());
99     Entry.isSExt = shouldSignExtendTypeInLibCall(Op.getValueType(), isSigned);
100     Entry.isZExt = !shouldSignExtendTypeInLibCall(Op.getValueType(), isSigned);
101     Args.push_back(Entry);
102   }
103
104   if (LC == RTLIB::UNKNOWN_LIBCALL)
105     report_fatal_error("Unsupported library call operation!");
106   SDValue Callee = DAG.getExternalSymbol(getLibcallName(LC),
107                                          getPointerTy(DAG.getDataLayout()));
108
109   Type *RetTy = RetVT.getTypeForEVT(*DAG.getContext());
110   TargetLowering::CallLoweringInfo CLI(DAG);
111   bool signExtend = shouldSignExtendTypeInLibCall(RetVT, isSigned);
112   CLI.setDebugLoc(dl).setChain(DAG.getEntryNode())
113     .setCallee(getLibcallCallingConv(LC), RetTy, Callee, std::move(Args), 0)
114     .setNoReturn(doesNotReturn).setDiscardResult(!isReturnValueUsed)
115     .setSExtResult(signExtend).setZExtResult(!signExtend);
116   return LowerCallTo(CLI);
117 }
118
119 /// SoftenSetCCOperands - Soften the operands of a comparison.  This code is
120 /// shared among BR_CC, SELECT_CC, and SETCC handlers.
121 void TargetLowering::softenSetCCOperands(SelectionDAG &DAG, EVT VT,
122                                          SDValue &NewLHS, SDValue &NewRHS,
123                                          ISD::CondCode &CCCode,
124                                          SDLoc dl) const {
125   assert((VT == MVT::f32 || VT == MVT::f64 || VT == MVT::f128)
126          && "Unsupported setcc type!");
127
128   // Expand into one or more soft-fp libcall(s).
129   RTLIB::Libcall LC1 = RTLIB::UNKNOWN_LIBCALL, LC2 = RTLIB::UNKNOWN_LIBCALL;
130   bool ShouldInvertCC = false;
131   switch (CCCode) {
132   case ISD::SETEQ:
133   case ISD::SETOEQ:
134     LC1 = (VT == MVT::f32) ? RTLIB::OEQ_F32 :
135           (VT == MVT::f64) ? RTLIB::OEQ_F64 : RTLIB::OEQ_F128;
136     break;
137   case ISD::SETNE:
138   case ISD::SETUNE:
139     LC1 = (VT == MVT::f32) ? RTLIB::UNE_F32 :
140           (VT == MVT::f64) ? RTLIB::UNE_F64 : RTLIB::UNE_F128;
141     break;
142   case ISD::SETGE:
143   case ISD::SETOGE:
144     LC1 = (VT == MVT::f32) ? RTLIB::OGE_F32 :
145           (VT == MVT::f64) ? RTLIB::OGE_F64 : RTLIB::OGE_F128;
146     break;
147   case ISD::SETLT:
148   case ISD::SETOLT:
149     LC1 = (VT == MVT::f32) ? RTLIB::OLT_F32 :
150           (VT == MVT::f64) ? RTLIB::OLT_F64 : RTLIB::OLT_F128;
151     break;
152   case ISD::SETLE:
153   case ISD::SETOLE:
154     LC1 = (VT == MVT::f32) ? RTLIB::OLE_F32 :
155           (VT == MVT::f64) ? RTLIB::OLE_F64 : RTLIB::OLE_F128;
156     break;
157   case ISD::SETGT:
158   case ISD::SETOGT:
159     LC1 = (VT == MVT::f32) ? RTLIB::OGT_F32 :
160           (VT == MVT::f64) ? RTLIB::OGT_F64 : RTLIB::OGT_F128;
161     break;
162   case ISD::SETUO:
163     LC1 = (VT == MVT::f32) ? RTLIB::UO_F32 :
164           (VT == MVT::f64) ? RTLIB::UO_F64 : RTLIB::UO_F128;
165     break;
166   case ISD::SETO:
167     LC1 = (VT == MVT::f32) ? RTLIB::O_F32 :
168           (VT == MVT::f64) ? RTLIB::O_F64 : RTLIB::O_F128;
169     break;
170   case ISD::SETONE:
171     // SETONE = SETOLT | SETOGT
172     LC1 = (VT == MVT::f32) ? RTLIB::OLT_F32 :
173           (VT == MVT::f64) ? RTLIB::OLT_F64 : RTLIB::OLT_F128;
174     LC2 = (VT == MVT::f32) ? RTLIB::OGT_F32 :
175           (VT == MVT::f64) ? RTLIB::OGT_F64 : RTLIB::OGT_F128;
176     break;
177   case ISD::SETUEQ:
178     LC1 = (VT == MVT::f32) ? RTLIB::UO_F32 :
179           (VT == MVT::f64) ? RTLIB::UO_F64 : RTLIB::UO_F128;
180     LC2 = (VT == MVT::f32) ? RTLIB::OEQ_F32 :
181           (VT == MVT::f64) ? RTLIB::OEQ_F64 : RTLIB::OEQ_F128;
182     break;
183   default:
184     // Invert CC for unordered comparisons
185     ShouldInvertCC = true;
186     switch (CCCode) {
187     case ISD::SETULT:
188       LC1 = (VT == MVT::f32) ? RTLIB::OGE_F32 :
189             (VT == MVT::f64) ? RTLIB::OGE_F64 : RTLIB::OGE_F128;
190       break;
191     case ISD::SETULE:
192       LC1 = (VT == MVT::f32) ? RTLIB::OGT_F32 :
193             (VT == MVT::f64) ? RTLIB::OGT_F64 : RTLIB::OGT_F128;
194       break;
195     case ISD::SETUGT:
196       LC1 = (VT == MVT::f32) ? RTLIB::OLE_F32 :
197             (VT == MVT::f64) ? RTLIB::OLE_F64 : RTLIB::OLE_F128;
198       break;
199     case ISD::SETUGE:
200       LC1 = (VT == MVT::f32) ? RTLIB::OLT_F32 :
201             (VT == MVT::f64) ? RTLIB::OLT_F64 : RTLIB::OLT_F128;
202       break;
203     default: llvm_unreachable("Do not know how to soften this setcc!");
204     }
205   }
206
207   // Use the target specific return value for comparions lib calls.
208   EVT RetVT = getCmpLibcallReturnType();
209   SDValue Ops[2] = {NewLHS, NewRHS};
210   NewLHS = makeLibCall(DAG, LC1, RetVT, Ops, false /*sign irrelevant*/,
211                        dl).first;
212   NewRHS = DAG.getConstant(0, dl, RetVT);
213
214   CCCode = getCmpLibcallCC(LC1);
215   if (ShouldInvertCC)
216     CCCode = getSetCCInverse(CCCode, /*isInteger=*/true);
217
218   if (LC2 != RTLIB::UNKNOWN_LIBCALL) {
219     SDValue Tmp = DAG.getNode(
220         ISD::SETCC, dl,
221         getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), RetVT),
222         NewLHS, NewRHS, DAG.getCondCode(CCCode));
223     NewLHS = makeLibCall(DAG, LC2, RetVT, Ops, false/*sign irrelevant*/,
224                          dl).first;
225     NewLHS = DAG.getNode(
226         ISD::SETCC, dl,
227         getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), RetVT),
228         NewLHS, NewRHS, DAG.getCondCode(getCmpLibcallCC(LC2)));
229     NewLHS = DAG.getNode(ISD::OR, dl, Tmp.getValueType(), Tmp, NewLHS);
230     NewRHS = SDValue();
231   }
232 }
233
234 /// getJumpTableEncoding - Return the entry encoding for a jump table in the
235 /// current function.  The returned value is a member of the
236 /// MachineJumpTableInfo::JTEntryKind enum.
237 unsigned TargetLowering::getJumpTableEncoding() const {
238   // In non-pic modes, just use the address of a block.
239   if (getTargetMachine().getRelocationModel() != Reloc::PIC_)
240     return MachineJumpTableInfo::EK_BlockAddress;
241
242   // In PIC mode, if the target supports a GPRel32 directive, use it.
243   if (getTargetMachine().getMCAsmInfo()->getGPRel32Directive() != nullptr)
244     return MachineJumpTableInfo::EK_GPRel32BlockAddress;
245
246   // Otherwise, use a label difference.
247   return MachineJumpTableInfo::EK_LabelDifference32;
248 }
249
250 SDValue TargetLowering::getPICJumpTableRelocBase(SDValue Table,
251                                                  SelectionDAG &DAG) const {
252   // If our PIC model is GP relative, use the global offset table as the base.
253   unsigned JTEncoding = getJumpTableEncoding();
254
255   if ((JTEncoding == MachineJumpTableInfo::EK_GPRel64BlockAddress) ||
256       (JTEncoding == MachineJumpTableInfo::EK_GPRel32BlockAddress))
257     return DAG.getGLOBAL_OFFSET_TABLE(getPointerTy(DAG.getDataLayout()));
258
259   return Table;
260 }
261
262 /// getPICJumpTableRelocBaseExpr - This returns the relocation base for the
263 /// given PIC jumptable, the same as getPICJumpTableRelocBase, but as an
264 /// MCExpr.
265 const MCExpr *
266 TargetLowering::getPICJumpTableRelocBaseExpr(const MachineFunction *MF,
267                                              unsigned JTI,MCContext &Ctx) const{
268   // The normal PIC reloc base is the label at the start of the jump table.
269   return MCSymbolRefExpr::create(MF->getJTISymbol(JTI, Ctx), Ctx);
270 }
271
272 bool
273 TargetLowering::isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const {
274   // Assume that everything is safe in static mode.
275   if (getTargetMachine().getRelocationModel() == Reloc::Static)
276     return true;
277
278   // In dynamic-no-pic mode, assume that known defined values are safe.
279   if (getTargetMachine().getRelocationModel() == Reloc::DynamicNoPIC &&
280       GA && GA->getGlobal()->isStrongDefinitionForLinker())
281     return true;
282
283   // Otherwise assume nothing is safe.
284   return false;
285 }
286
287 //===----------------------------------------------------------------------===//
288 //  Optimization Methods
289 //===----------------------------------------------------------------------===//
290
291 /// ShrinkDemandedConstant - Check to see if the specified operand of the
292 /// specified instruction is a constant integer.  If so, check to see if there
293 /// are any bits set in the constant that are not demanded.  If so, shrink the
294 /// constant and return true.
295 bool TargetLowering::TargetLoweringOpt::ShrinkDemandedConstant(SDValue Op,
296                                                         const APInt &Demanded) {
297   SDLoc dl(Op);
298
299   // FIXME: ISD::SELECT, ISD::SELECT_CC
300   switch (Op.getOpcode()) {
301   default: break;
302   case ISD::XOR:
303   case ISD::AND:
304   case ISD::OR: {
305     ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op.getOperand(1));
306     if (!C) return false;
307
308     if (Op.getOpcode() == ISD::XOR &&
309         (C->getAPIntValue() | (~Demanded)).isAllOnesValue())
310       return false;
311
312     // if we can expand it to have all bits set, do it
313     if (C->getAPIntValue().intersects(~Demanded)) {
314       EVT VT = Op.getValueType();
315       SDValue New = DAG.getNode(Op.getOpcode(), dl, VT, Op.getOperand(0),
316                                 DAG.getConstant(Demanded &
317                                                 C->getAPIntValue(),
318                                                 dl, VT));
319       return CombineTo(Op, New);
320     }
321
322     break;
323   }
324   }
325
326   return false;
327 }
328
329 /// ShrinkDemandedOp - Convert x+y to (VT)((SmallVT)x+(SmallVT)y) if the
330 /// casts are free.  This uses isZExtFree and ZERO_EXTEND for the widening
331 /// cast, but it could be generalized for targets with other types of
332 /// implicit widening casts.
333 bool
334 TargetLowering::TargetLoweringOpt::ShrinkDemandedOp(SDValue Op,
335                                                     unsigned BitWidth,
336                                                     const APInt &Demanded,
337                                                     SDLoc dl) {
338   assert(Op.getNumOperands() == 2 &&
339          "ShrinkDemandedOp only supports binary operators!");
340   assert(Op.getNode()->getNumValues() == 1 &&
341          "ShrinkDemandedOp only supports nodes with one result!");
342
343   // Early return, as this function cannot handle vector types.
344   if (Op.getValueType().isVector())
345     return false;
346
347   // Don't do this if the node has another user, which may require the
348   // full value.
349   if (!Op.getNode()->hasOneUse())
350     return false;
351
352   // Search for the smallest integer type with free casts to and from
353   // Op's type. For expedience, just check power-of-2 integer types.
354   const TargetLowering &TLI = DAG.getTargetLoweringInfo();
355   unsigned DemandedSize = BitWidth - Demanded.countLeadingZeros();
356   unsigned SmallVTBits = DemandedSize;
357   if (!isPowerOf2_32(SmallVTBits))
358     SmallVTBits = NextPowerOf2(SmallVTBits);
359   for (; SmallVTBits < BitWidth; SmallVTBits = NextPowerOf2(SmallVTBits)) {
360     EVT SmallVT = EVT::getIntegerVT(*DAG.getContext(), SmallVTBits);
361     if (TLI.isTruncateFree(Op.getValueType(), SmallVT) &&
362         TLI.isZExtFree(SmallVT, Op.getValueType())) {
363       // We found a type with free casts.
364       SDValue X = DAG.getNode(Op.getOpcode(), dl, SmallVT,
365                               DAG.getNode(ISD::TRUNCATE, dl, SmallVT,
366                                           Op.getNode()->getOperand(0)),
367                               DAG.getNode(ISD::TRUNCATE, dl, SmallVT,
368                                           Op.getNode()->getOperand(1)));
369       bool NeedZext = DemandedSize > SmallVTBits;
370       SDValue Z = DAG.getNode(NeedZext ? ISD::ZERO_EXTEND : ISD::ANY_EXTEND,
371                               dl, Op.getValueType(), X);
372       return CombineTo(Op, Z);
373     }
374   }
375   return false;
376 }
377
378 /// SimplifyDemandedBits - Look at Op.  At this point, we know that only the
379 /// DemandedMask bits of the result of Op are ever used downstream.  If we can
380 /// use this information to simplify Op, create a new simplified DAG node and
381 /// return true, returning the original and new nodes in Old and New. Otherwise,
382 /// analyze the expression and return a mask of KnownOne and KnownZero bits for
383 /// the expression (used to simplify the caller).  The KnownZero/One bits may
384 /// only be accurate for those bits in the DemandedMask.
385 bool TargetLowering::SimplifyDemandedBits(SDValue Op,
386                                           const APInt &DemandedMask,
387                                           APInt &KnownZero,
388                                           APInt &KnownOne,
389                                           TargetLoweringOpt &TLO,
390                                           unsigned Depth) const {
391   unsigned BitWidth = DemandedMask.getBitWidth();
392   assert(Op.getValueType().getScalarType().getSizeInBits() == BitWidth &&
393          "Mask size mismatches value type size!");
394   APInt NewMask = DemandedMask;
395   SDLoc dl(Op);
396   auto &DL = TLO.DAG.getDataLayout();
397
398   // Don't know anything.
399   KnownZero = KnownOne = APInt(BitWidth, 0);
400
401   // Other users may use these bits.
402   if (!Op.getNode()->hasOneUse()) {
403     if (Depth != 0) {
404       // If not at the root, Just compute the KnownZero/KnownOne bits to
405       // simplify things downstream.
406       TLO.DAG.computeKnownBits(Op, KnownZero, KnownOne, Depth);
407       return false;
408     }
409     // If this is the root being simplified, allow it to have multiple uses,
410     // just set the NewMask to all bits.
411     NewMask = APInt::getAllOnesValue(BitWidth);
412   } else if (DemandedMask == 0) {
413     // Not demanding any bits from Op.
414     if (Op.getOpcode() != ISD::UNDEF)
415       return TLO.CombineTo(Op, TLO.DAG.getUNDEF(Op.getValueType()));
416     return false;
417   } else if (Depth == 6) {        // Limit search depth.
418     return false;
419   }
420
421   APInt KnownZero2, KnownOne2, KnownZeroOut, KnownOneOut;
422   switch (Op.getOpcode()) {
423   case ISD::Constant:
424     // We know all of the bits for a constant!
425     KnownOne = cast<ConstantSDNode>(Op)->getAPIntValue();
426     KnownZero = ~KnownOne;
427     return false;   // Don't fall through, will infinitely loop.
428   case ISD::AND:
429     // If the RHS is a constant, check to see if the LHS would be zero without
430     // using the bits from the RHS.  Below, we use knowledge about the RHS to
431     // simplify the LHS, here we're using information from the LHS to simplify
432     // the RHS.
433     if (ConstantSDNode *RHSC = dyn_cast<ConstantSDNode>(Op.getOperand(1))) {
434       APInt LHSZero, LHSOne;
435       // Do not increment Depth here; that can cause an infinite loop.
436       TLO.DAG.computeKnownBits(Op.getOperand(0), LHSZero, LHSOne, Depth);
437       // If the LHS already has zeros where RHSC does, this and is dead.
438       if ((LHSZero & NewMask) == (~RHSC->getAPIntValue() & NewMask))
439         return TLO.CombineTo(Op, Op.getOperand(0));
440       // If any of the set bits in the RHS are known zero on the LHS, shrink
441       // the constant.
442       if (TLO.ShrinkDemandedConstant(Op, ~LHSZero & NewMask))
443         return true;
444     }
445
446     if (SimplifyDemandedBits(Op.getOperand(1), NewMask, KnownZero,
447                              KnownOne, TLO, Depth+1))
448       return true;
449     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
450     if (SimplifyDemandedBits(Op.getOperand(0), ~KnownZero & NewMask,
451                              KnownZero2, KnownOne2, TLO, Depth+1))
452       return true;
453     assert((KnownZero2 & KnownOne2) == 0 && "Bits known to be one AND zero?");
454
455     // If all of the demanded bits are known one on one side, return the other.
456     // These bits cannot contribute to the result of the 'and'.
457     if ((NewMask & ~KnownZero2 & KnownOne) == (~KnownZero2 & NewMask))
458       return TLO.CombineTo(Op, Op.getOperand(0));
459     if ((NewMask & ~KnownZero & KnownOne2) == (~KnownZero & NewMask))
460       return TLO.CombineTo(Op, Op.getOperand(1));
461     // If all of the demanded bits in the inputs are known zeros, return zero.
462     if ((NewMask & (KnownZero|KnownZero2)) == NewMask)
463       return TLO.CombineTo(Op, TLO.DAG.getConstant(0, dl, Op.getValueType()));
464     // If the RHS is a constant, see if we can simplify it.
465     if (TLO.ShrinkDemandedConstant(Op, ~KnownZero2 & NewMask))
466       return true;
467     // If the operation can be done in a smaller type, do so.
468     if (TLO.ShrinkDemandedOp(Op, BitWidth, NewMask, dl))
469       return true;
470
471     // Output known-1 bits are only known if set in both the LHS & RHS.
472     KnownOne &= KnownOne2;
473     // Output known-0 are known to be clear if zero in either the LHS | RHS.
474     KnownZero |= KnownZero2;
475     break;
476   case ISD::OR:
477     if (SimplifyDemandedBits(Op.getOperand(1), NewMask, KnownZero,
478                              KnownOne, TLO, Depth+1))
479       return true;
480     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
481     if (SimplifyDemandedBits(Op.getOperand(0), ~KnownOne & NewMask,
482                              KnownZero2, KnownOne2, TLO, Depth+1))
483       return true;
484     assert((KnownZero2 & KnownOne2) == 0 && "Bits known to be one AND zero?");
485
486     // If all of the demanded bits are known zero on one side, return the other.
487     // These bits cannot contribute to the result of the 'or'.
488     if ((NewMask & ~KnownOne2 & KnownZero) == (~KnownOne2 & NewMask))
489       return TLO.CombineTo(Op, Op.getOperand(0));
490     if ((NewMask & ~KnownOne & KnownZero2) == (~KnownOne & NewMask))
491       return TLO.CombineTo(Op, Op.getOperand(1));
492     // If all of the potentially set bits on one side are known to be set on
493     // the other side, just use the 'other' side.
494     if ((NewMask & ~KnownZero & KnownOne2) == (~KnownZero & NewMask))
495       return TLO.CombineTo(Op, Op.getOperand(0));
496     if ((NewMask & ~KnownZero2 & KnownOne) == (~KnownZero2 & NewMask))
497       return TLO.CombineTo(Op, Op.getOperand(1));
498     // If the RHS is a constant, see if we can simplify it.
499     if (TLO.ShrinkDemandedConstant(Op, NewMask))
500       return true;
501     // If the operation can be done in a smaller type, do so.
502     if (TLO.ShrinkDemandedOp(Op, BitWidth, NewMask, dl))
503       return true;
504
505     // Output known-0 bits are only known if clear in both the LHS & RHS.
506     KnownZero &= KnownZero2;
507     // Output known-1 are known to be set if set in either the LHS | RHS.
508     KnownOne |= KnownOne2;
509     break;
510   case ISD::XOR:
511     if (SimplifyDemandedBits(Op.getOperand(1), NewMask, KnownZero,
512                              KnownOne, TLO, Depth+1))
513       return true;
514     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
515     if (SimplifyDemandedBits(Op.getOperand(0), NewMask, KnownZero2,
516                              KnownOne2, TLO, Depth+1))
517       return true;
518     assert((KnownZero2 & KnownOne2) == 0 && "Bits known to be one AND zero?");
519
520     // If all of the demanded bits are known zero on one side, return the other.
521     // These bits cannot contribute to the result of the 'xor'.
522     if ((KnownZero & NewMask) == NewMask)
523       return TLO.CombineTo(Op, Op.getOperand(0));
524     if ((KnownZero2 & NewMask) == NewMask)
525       return TLO.CombineTo(Op, Op.getOperand(1));
526     // If the operation can be done in a smaller type, do so.
527     if (TLO.ShrinkDemandedOp(Op, BitWidth, NewMask, dl))
528       return true;
529
530     // If all of the unknown bits are known to be zero on one side or the other
531     // (but not both) turn this into an *inclusive* or.
532     //    e.g. (A & C1)^(B & C2) -> (A & C1)|(B & C2) iff C1&C2 == 0
533     if ((NewMask & ~KnownZero & ~KnownZero2) == 0)
534       return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::OR, dl, Op.getValueType(),
535                                                Op.getOperand(0),
536                                                Op.getOperand(1)));
537
538     // Output known-0 bits are known if clear or set in both the LHS & RHS.
539     KnownZeroOut = (KnownZero & KnownZero2) | (KnownOne & KnownOne2);
540     // Output known-1 are known to be set if set in only one of the LHS, RHS.
541     KnownOneOut = (KnownZero & KnownOne2) | (KnownOne & KnownZero2);
542
543     // If all of the demanded bits on one side are known, and all of the set
544     // bits on that side are also known to be set on the other side, turn this
545     // into an AND, as we know the bits will be cleared.
546     //    e.g. (X | C1) ^ C2 --> (X | C1) & ~C2 iff (C1&C2) == C2
547     // NB: it is okay if more bits are known than are requested
548     if ((NewMask & (KnownZero|KnownOne)) == NewMask) { // all known on one side
549       if (KnownOne == KnownOne2) { // set bits are the same on both sides
550         EVT VT = Op.getValueType();
551         SDValue ANDC = TLO.DAG.getConstant(~KnownOne & NewMask, dl, VT);
552         return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::AND, dl, VT,
553                                                  Op.getOperand(0), ANDC));
554       }
555     }
556
557     // If the RHS is a constant, see if we can simplify it.
558     // for XOR, we prefer to force bits to 1 if they will make a -1.
559     // if we can't force bits, try to shrink constant
560     if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op.getOperand(1))) {
561       APInt Expanded = C->getAPIntValue() | (~NewMask);
562       // if we can expand it to have all bits set, do it
563       if (Expanded.isAllOnesValue()) {
564         if (Expanded != C->getAPIntValue()) {
565           EVT VT = Op.getValueType();
566           SDValue New = TLO.DAG.getNode(Op.getOpcode(), dl,VT, Op.getOperand(0),
567                                         TLO.DAG.getConstant(Expanded, dl, VT));
568           return TLO.CombineTo(Op, New);
569         }
570         // if it already has all the bits set, nothing to change
571         // but don't shrink either!
572       } else if (TLO.ShrinkDemandedConstant(Op, NewMask)) {
573         return true;
574       }
575     }
576
577     KnownZero = KnownZeroOut;
578     KnownOne  = KnownOneOut;
579     break;
580   case ISD::SELECT:
581     if (SimplifyDemandedBits(Op.getOperand(2), NewMask, KnownZero,
582                              KnownOne, TLO, Depth+1))
583       return true;
584     if (SimplifyDemandedBits(Op.getOperand(1), NewMask, KnownZero2,
585                              KnownOne2, TLO, Depth+1))
586       return true;
587     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
588     assert((KnownZero2 & KnownOne2) == 0 && "Bits known to be one AND zero?");
589
590     // If the operands are constants, see if we can simplify them.
591     if (TLO.ShrinkDemandedConstant(Op, NewMask))
592       return true;
593
594     // Only known if known in both the LHS and RHS.
595     KnownOne &= KnownOne2;
596     KnownZero &= KnownZero2;
597     break;
598   case ISD::SELECT_CC:
599     if (SimplifyDemandedBits(Op.getOperand(3), NewMask, KnownZero,
600                              KnownOne, TLO, Depth+1))
601       return true;
602     if (SimplifyDemandedBits(Op.getOperand(2), NewMask, KnownZero2,
603                              KnownOne2, TLO, Depth+1))
604       return true;
605     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
606     assert((KnownZero2 & KnownOne2) == 0 && "Bits known to be one AND zero?");
607
608     // If the operands are constants, see if we can simplify them.
609     if (TLO.ShrinkDemandedConstant(Op, NewMask))
610       return true;
611
612     // Only known if known in both the LHS and RHS.
613     KnownOne &= KnownOne2;
614     KnownZero &= KnownZero2;
615     break;
616   case ISD::SHL:
617     if (ConstantSDNode *SA = dyn_cast<ConstantSDNode>(Op.getOperand(1))) {
618       unsigned ShAmt = SA->getZExtValue();
619       SDValue InOp = Op.getOperand(0);
620
621       // If the shift count is an invalid immediate, don't do anything.
622       if (ShAmt >= BitWidth)
623         break;
624
625       // If this is ((X >>u C1) << ShAmt), see if we can simplify this into a
626       // single shift.  We can do this if the bottom bits (which are shifted
627       // out) are never demanded.
628       if (InOp.getOpcode() == ISD::SRL &&
629           isa<ConstantSDNode>(InOp.getOperand(1))) {
630         if (ShAmt && (NewMask & APInt::getLowBitsSet(BitWidth, ShAmt)) == 0) {
631           unsigned C1= cast<ConstantSDNode>(InOp.getOperand(1))->getZExtValue();
632           unsigned Opc = ISD::SHL;
633           int Diff = ShAmt-C1;
634           if (Diff < 0) {
635             Diff = -Diff;
636             Opc = ISD::SRL;
637           }
638
639           SDValue NewSA =
640             TLO.DAG.getConstant(Diff, dl, Op.getOperand(1).getValueType());
641           EVT VT = Op.getValueType();
642           return TLO.CombineTo(Op, TLO.DAG.getNode(Opc, dl, VT,
643                                                    InOp.getOperand(0), NewSA));
644         }
645       }
646
647       if (SimplifyDemandedBits(InOp, NewMask.lshr(ShAmt),
648                                KnownZero, KnownOne, TLO, Depth+1))
649         return true;
650
651       // Convert (shl (anyext x, c)) to (anyext (shl x, c)) if the high bits
652       // are not demanded. This will likely allow the anyext to be folded away.
653       if (InOp.getNode()->getOpcode() == ISD::ANY_EXTEND) {
654         SDValue InnerOp = InOp.getNode()->getOperand(0);
655         EVT InnerVT = InnerOp.getValueType();
656         unsigned InnerBits = InnerVT.getSizeInBits();
657         if (ShAmt < InnerBits && NewMask.lshr(InnerBits) == 0 &&
658             isTypeDesirableForOp(ISD::SHL, InnerVT)) {
659           EVT ShTy = getShiftAmountTy(InnerVT, DL);
660           if (!APInt(BitWidth, ShAmt).isIntN(ShTy.getSizeInBits()))
661             ShTy = InnerVT;
662           SDValue NarrowShl =
663             TLO.DAG.getNode(ISD::SHL, dl, InnerVT, InnerOp,
664                             TLO.DAG.getConstant(ShAmt, dl, ShTy));
665           return
666             TLO.CombineTo(Op,
667                           TLO.DAG.getNode(ISD::ANY_EXTEND, dl, Op.getValueType(),
668                                           NarrowShl));
669         }
670         // Repeat the SHL optimization above in cases where an extension
671         // intervenes: (shl (anyext (shr x, c1)), c2) to
672         // (shl (anyext x), c2-c1).  This requires that the bottom c1 bits
673         // aren't demanded (as above) and that the shifted upper c1 bits of
674         // x aren't demanded.
675         if (InOp.hasOneUse() &&
676             InnerOp.getOpcode() == ISD::SRL &&
677             InnerOp.hasOneUse() &&
678             isa<ConstantSDNode>(InnerOp.getOperand(1))) {
679           uint64_t InnerShAmt = cast<ConstantSDNode>(InnerOp.getOperand(1))
680             ->getZExtValue();
681           if (InnerShAmt < ShAmt &&
682               InnerShAmt < InnerBits &&
683               NewMask.lshr(InnerBits - InnerShAmt + ShAmt) == 0 &&
684               NewMask.trunc(ShAmt) == 0) {
685             SDValue NewSA =
686               TLO.DAG.getConstant(ShAmt - InnerShAmt, dl,
687                                   Op.getOperand(1).getValueType());
688             EVT VT = Op.getValueType();
689             SDValue NewExt = TLO.DAG.getNode(ISD::ANY_EXTEND, dl, VT,
690                                              InnerOp.getOperand(0));
691             return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::SHL, dl, VT,
692                                                      NewExt, NewSA));
693           }
694         }
695       }
696
697       KnownZero <<= SA->getZExtValue();
698       KnownOne  <<= SA->getZExtValue();
699       // low bits known zero.
700       KnownZero |= APInt::getLowBitsSet(BitWidth, SA->getZExtValue());
701     }
702     break;
703   case ISD::SRL:
704     if (ConstantSDNode *SA = dyn_cast<ConstantSDNode>(Op.getOperand(1))) {
705       EVT VT = Op.getValueType();
706       unsigned ShAmt = SA->getZExtValue();
707       unsigned VTSize = VT.getSizeInBits();
708       SDValue InOp = Op.getOperand(0);
709
710       // If the shift count is an invalid immediate, don't do anything.
711       if (ShAmt >= BitWidth)
712         break;
713
714       APInt InDemandedMask = (NewMask << ShAmt);
715
716       // If the shift is exact, then it does demand the low bits (and knows that
717       // they are zero).
718       if (cast<BinaryWithFlagsSDNode>(Op)->Flags.hasExact())
719         InDemandedMask |= APInt::getLowBitsSet(BitWidth, ShAmt);
720
721       // If this is ((X << C1) >>u ShAmt), see if we can simplify this into a
722       // single shift.  We can do this if the top bits (which are shifted out)
723       // are never demanded.
724       if (InOp.getOpcode() == ISD::SHL &&
725           isa<ConstantSDNode>(InOp.getOperand(1))) {
726         if (ShAmt && (NewMask & APInt::getHighBitsSet(VTSize, ShAmt)) == 0) {
727           unsigned C1= cast<ConstantSDNode>(InOp.getOperand(1))->getZExtValue();
728           unsigned Opc = ISD::SRL;
729           int Diff = ShAmt-C1;
730           if (Diff < 0) {
731             Diff = -Diff;
732             Opc = ISD::SHL;
733           }
734
735           SDValue NewSA =
736             TLO.DAG.getConstant(Diff, dl, Op.getOperand(1).getValueType());
737           return TLO.CombineTo(Op, TLO.DAG.getNode(Opc, dl, VT,
738                                                    InOp.getOperand(0), NewSA));
739         }
740       }
741
742       // Compute the new bits that are at the top now.
743       if (SimplifyDemandedBits(InOp, InDemandedMask,
744                                KnownZero, KnownOne, TLO, Depth+1))
745         return true;
746       assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
747       KnownZero = KnownZero.lshr(ShAmt);
748       KnownOne  = KnownOne.lshr(ShAmt);
749
750       APInt HighBits = APInt::getHighBitsSet(BitWidth, ShAmt);
751       KnownZero |= HighBits;  // High bits known zero.
752     }
753     break;
754   case ISD::SRA:
755     // If this is an arithmetic shift right and only the low-bit is set, we can
756     // always convert this into a logical shr, even if the shift amount is
757     // variable.  The low bit of the shift cannot be an input sign bit unless
758     // the shift amount is >= the size of the datatype, which is undefined.
759     if (NewMask == 1)
760       return TLO.CombineTo(Op,
761                            TLO.DAG.getNode(ISD::SRL, dl, Op.getValueType(),
762                                            Op.getOperand(0), Op.getOperand(1)));
763
764     if (ConstantSDNode *SA = dyn_cast<ConstantSDNode>(Op.getOperand(1))) {
765       EVT VT = Op.getValueType();
766       unsigned ShAmt = SA->getZExtValue();
767
768       // If the shift count is an invalid immediate, don't do anything.
769       if (ShAmt >= BitWidth)
770         break;
771
772       APInt InDemandedMask = (NewMask << ShAmt);
773
774       // If the shift is exact, then it does demand the low bits (and knows that
775       // they are zero).
776       if (cast<BinaryWithFlagsSDNode>(Op)->Flags.hasExact())
777         InDemandedMask |= APInt::getLowBitsSet(BitWidth, ShAmt);
778
779       // If any of the demanded bits are produced by the sign extension, we also
780       // demand the input sign bit.
781       APInt HighBits = APInt::getHighBitsSet(BitWidth, ShAmt);
782       if (HighBits.intersects(NewMask))
783         InDemandedMask |= APInt::getSignBit(VT.getScalarType().getSizeInBits());
784
785       if (SimplifyDemandedBits(Op.getOperand(0), InDemandedMask,
786                                KnownZero, KnownOne, TLO, Depth+1))
787         return true;
788       assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
789       KnownZero = KnownZero.lshr(ShAmt);
790       KnownOne  = KnownOne.lshr(ShAmt);
791
792       // Handle the sign bit, adjusted to where it is now in the mask.
793       APInt SignBit = APInt::getSignBit(BitWidth).lshr(ShAmt);
794
795       // If the input sign bit is known to be zero, or if none of the top bits
796       // are demanded, turn this into an unsigned shift right.
797       if (KnownZero.intersects(SignBit) || (HighBits & ~NewMask) == HighBits) {
798         SDNodeFlags Flags;
799         Flags.setExact(cast<BinaryWithFlagsSDNode>(Op)->Flags.hasExact());
800         return TLO.CombineTo(Op,
801                              TLO.DAG.getNode(ISD::SRL, dl, VT, Op.getOperand(0),
802                                              Op.getOperand(1), &Flags));
803       }
804
805       int Log2 = NewMask.exactLogBase2();
806       if (Log2 >= 0) {
807         // The bit must come from the sign.
808         SDValue NewSA =
809           TLO.DAG.getConstant(BitWidth - 1 - Log2, dl,
810                               Op.getOperand(1).getValueType());
811         return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::SRL, dl, VT,
812                                                  Op.getOperand(0), NewSA));
813       }
814
815       if (KnownOne.intersects(SignBit))
816         // New bits are known one.
817         KnownOne |= HighBits;
818     }
819     break;
820   case ISD::SIGN_EXTEND_INREG: {
821     EVT ExVT = cast<VTSDNode>(Op.getOperand(1))->getVT();
822
823     APInt MsbMask = APInt::getHighBitsSet(BitWidth, 1);
824     // If we only care about the highest bit, don't bother shifting right.
825     if (MsbMask == NewMask) {
826       unsigned ShAmt = ExVT.getScalarType().getSizeInBits();
827       SDValue InOp = Op.getOperand(0);
828       unsigned VTBits = Op->getValueType(0).getScalarType().getSizeInBits();
829       bool AlreadySignExtended =
830         TLO.DAG.ComputeNumSignBits(InOp) >= VTBits-ShAmt+1;
831       // However if the input is already sign extended we expect the sign
832       // extension to be dropped altogether later and do not simplify.
833       if (!AlreadySignExtended) {
834         // Compute the correct shift amount type, which must be getShiftAmountTy
835         // for scalar types after legalization.
836         EVT ShiftAmtTy = Op.getValueType();
837         if (TLO.LegalTypes() && !ShiftAmtTy.isVector())
838           ShiftAmtTy = getShiftAmountTy(ShiftAmtTy, DL);
839
840         SDValue ShiftAmt = TLO.DAG.getConstant(BitWidth - ShAmt, dl,
841                                                ShiftAmtTy);
842         return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::SHL, dl,
843                                                  Op.getValueType(), InOp,
844                                                  ShiftAmt));
845       }
846     }
847
848     // Sign extension.  Compute the demanded bits in the result that are not
849     // present in the input.
850     APInt NewBits =
851       APInt::getHighBitsSet(BitWidth,
852                             BitWidth - ExVT.getScalarType().getSizeInBits());
853
854     // If none of the extended bits are demanded, eliminate the sextinreg.
855     if ((NewBits & NewMask) == 0)
856       return TLO.CombineTo(Op, Op.getOperand(0));
857
858     APInt InSignBit =
859       APInt::getSignBit(ExVT.getScalarType().getSizeInBits()).zext(BitWidth);
860     APInt InputDemandedBits =
861       APInt::getLowBitsSet(BitWidth,
862                            ExVT.getScalarType().getSizeInBits()) &
863       NewMask;
864
865     // Since the sign extended bits are demanded, we know that the sign
866     // bit is demanded.
867     InputDemandedBits |= InSignBit;
868
869     if (SimplifyDemandedBits(Op.getOperand(0), InputDemandedBits,
870                              KnownZero, KnownOne, TLO, Depth+1))
871       return true;
872     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
873
874     // If the sign bit of the input is known set or clear, then we know the
875     // top bits of the result.
876
877     // If the input sign bit is known zero, convert this into a zero extension.
878     if (KnownZero.intersects(InSignBit))
879       return TLO.CombineTo(Op,
880                           TLO.DAG.getZeroExtendInReg(Op.getOperand(0),dl,ExVT));
881
882     if (KnownOne.intersects(InSignBit)) {    // Input sign bit known set
883       KnownOne |= NewBits;
884       KnownZero &= ~NewBits;
885     } else {                       // Input sign bit unknown
886       KnownZero &= ~NewBits;
887       KnownOne &= ~NewBits;
888     }
889     break;
890   }
891   case ISD::BUILD_PAIR: {
892     EVT HalfVT = Op.getOperand(0).getValueType();
893     unsigned HalfBitWidth = HalfVT.getScalarSizeInBits();
894
895     APInt MaskLo = NewMask.getLoBits(HalfBitWidth).trunc(HalfBitWidth);
896     APInt MaskHi = NewMask.getHiBits(HalfBitWidth).trunc(HalfBitWidth);
897
898     APInt KnownZeroLo, KnownOneLo;
899     APInt KnownZeroHi, KnownOneHi;
900
901     if (SimplifyDemandedBits(Op.getOperand(0), MaskLo, KnownZeroLo,
902                              KnownOneLo, TLO, Depth + 1))
903       return true;
904
905     if (SimplifyDemandedBits(Op.getOperand(1), MaskHi, KnownZeroHi,
906                              KnownOneHi, TLO, Depth + 1))
907       return true;
908
909     KnownZero = KnownZeroLo.zext(BitWidth) |
910                 KnownZeroHi.zext(BitWidth).shl(HalfBitWidth);
911
912     KnownOne = KnownOneLo.zext(BitWidth) |
913                KnownOneHi.zext(BitWidth).shl(HalfBitWidth);
914     break;
915   }
916   case ISD::ZERO_EXTEND: {
917     unsigned OperandBitWidth =
918       Op.getOperand(0).getValueType().getScalarType().getSizeInBits();
919     APInt InMask = NewMask.trunc(OperandBitWidth);
920
921     // If none of the top bits are demanded, convert this into an any_extend.
922     APInt NewBits =
923       APInt::getHighBitsSet(BitWidth, BitWidth - OperandBitWidth) & NewMask;
924     if (!NewBits.intersects(NewMask))
925       return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::ANY_EXTEND, dl,
926                                                Op.getValueType(),
927                                                Op.getOperand(0)));
928
929     if (SimplifyDemandedBits(Op.getOperand(0), InMask,
930                              KnownZero, KnownOne, TLO, Depth+1))
931       return true;
932     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
933     KnownZero = KnownZero.zext(BitWidth);
934     KnownOne = KnownOne.zext(BitWidth);
935     KnownZero |= NewBits;
936     break;
937   }
938   case ISD::SIGN_EXTEND: {
939     EVT InVT = Op.getOperand(0).getValueType();
940     unsigned InBits = InVT.getScalarType().getSizeInBits();
941     APInt InMask    = APInt::getLowBitsSet(BitWidth, InBits);
942     APInt InSignBit = APInt::getBitsSet(BitWidth, InBits - 1, InBits);
943     APInt NewBits   = ~InMask & NewMask;
944
945     // If none of the top bits are demanded, convert this into an any_extend.
946     if (NewBits == 0)
947       return TLO.CombineTo(Op,TLO.DAG.getNode(ISD::ANY_EXTEND, dl,
948                                               Op.getValueType(),
949                                               Op.getOperand(0)));
950
951     // Since some of the sign extended bits are demanded, we know that the sign
952     // bit is demanded.
953     APInt InDemandedBits = InMask & NewMask;
954     InDemandedBits |= InSignBit;
955     InDemandedBits = InDemandedBits.trunc(InBits);
956
957     if (SimplifyDemandedBits(Op.getOperand(0), InDemandedBits, KnownZero,
958                              KnownOne, TLO, Depth+1))
959       return true;
960     KnownZero = KnownZero.zext(BitWidth);
961     KnownOne = KnownOne.zext(BitWidth);
962
963     // If the sign bit is known zero, convert this to a zero extend.
964     if (KnownZero.intersects(InSignBit))
965       return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::ZERO_EXTEND, dl,
966                                                Op.getValueType(),
967                                                Op.getOperand(0)));
968
969     // If the sign bit is known one, the top bits match.
970     if (KnownOne.intersects(InSignBit)) {
971       KnownOne |= NewBits;
972       assert((KnownZero & NewBits) == 0);
973     } else {   // Otherwise, top bits aren't known.
974       assert((KnownOne & NewBits) == 0);
975       assert((KnownZero & NewBits) == 0);
976     }
977     break;
978   }
979   case ISD::ANY_EXTEND: {
980     unsigned OperandBitWidth =
981       Op.getOperand(0).getValueType().getScalarType().getSizeInBits();
982     APInt InMask = NewMask.trunc(OperandBitWidth);
983     if (SimplifyDemandedBits(Op.getOperand(0), InMask,
984                              KnownZero, KnownOne, TLO, Depth+1))
985       return true;
986     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
987     KnownZero = KnownZero.zext(BitWidth);
988     KnownOne = KnownOne.zext(BitWidth);
989     break;
990   }
991   case ISD::TRUNCATE: {
992     // Simplify the input, using demanded bit information, and compute the known
993     // zero/one bits live out.
994     unsigned OperandBitWidth =
995       Op.getOperand(0).getValueType().getScalarType().getSizeInBits();
996     APInt TruncMask = NewMask.zext(OperandBitWidth);
997     if (SimplifyDemandedBits(Op.getOperand(0), TruncMask,
998                              KnownZero, KnownOne, TLO, Depth+1))
999       return true;
1000     KnownZero = KnownZero.trunc(BitWidth);
1001     KnownOne = KnownOne.trunc(BitWidth);
1002
1003     // If the input is only used by this truncate, see if we can shrink it based
1004     // on the known demanded bits.
1005     if (Op.getOperand(0).getNode()->hasOneUse()) {
1006       SDValue In = Op.getOperand(0);
1007       switch (In.getOpcode()) {
1008       default: break;
1009       case ISD::SRL:
1010         // Shrink SRL by a constant if none of the high bits shifted in are
1011         // demanded.
1012         if (TLO.LegalTypes() &&
1013             !isTypeDesirableForOp(ISD::SRL, Op.getValueType()))
1014           // Do not turn (vt1 truncate (vt2 srl)) into (vt1 srl) if vt1 is
1015           // undesirable.
1016           break;
1017         ConstantSDNode *ShAmt = dyn_cast<ConstantSDNode>(In.getOperand(1));
1018         if (!ShAmt)
1019           break;
1020         SDValue Shift = In.getOperand(1);
1021         if (TLO.LegalTypes()) {
1022           uint64_t ShVal = ShAmt->getZExtValue();
1023           Shift = TLO.DAG.getConstant(ShVal, dl,
1024                                       getShiftAmountTy(Op.getValueType(), DL));
1025         }
1026
1027         APInt HighBits = APInt::getHighBitsSet(OperandBitWidth,
1028                                                OperandBitWidth - BitWidth);
1029         HighBits = HighBits.lshr(ShAmt->getZExtValue()).trunc(BitWidth);
1030
1031         if (ShAmt->getZExtValue() < BitWidth && !(HighBits & NewMask)) {
1032           // None of the shifted in bits are needed.  Add a truncate of the
1033           // shift input, then shift it.
1034           SDValue NewTrunc = TLO.DAG.getNode(ISD::TRUNCATE, dl,
1035                                              Op.getValueType(),
1036                                              In.getOperand(0));
1037           return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::SRL, dl,
1038                                                    Op.getValueType(),
1039                                                    NewTrunc,
1040                                                    Shift));
1041         }
1042         break;
1043       }
1044     }
1045
1046     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
1047     break;
1048   }
1049   case ISD::AssertZext: {
1050     // AssertZext demands all of the high bits, plus any of the low bits
1051     // demanded by its users.
1052     EVT VT = cast<VTSDNode>(Op.getOperand(1))->getVT();
1053     APInt InMask = APInt::getLowBitsSet(BitWidth,
1054                                         VT.getSizeInBits());
1055     if (SimplifyDemandedBits(Op.getOperand(0), ~InMask | NewMask,
1056                              KnownZero, KnownOne, TLO, Depth+1))
1057       return true;
1058     assert((KnownZero & KnownOne) == 0 && "Bits known to be one AND zero?");
1059
1060     KnownZero |= ~InMask & NewMask;
1061     break;
1062   }
1063   case ISD::BITCAST:
1064     // If this is an FP->Int bitcast and if the sign bit is the only
1065     // thing demanded, turn this into a FGETSIGN.
1066     if (!TLO.LegalOperations() &&
1067         !Op.getValueType().isVector() &&
1068         !Op.getOperand(0).getValueType().isVector() &&
1069         NewMask == APInt::getSignBit(Op.getValueType().getSizeInBits()) &&
1070         Op.getOperand(0).getValueType().isFloatingPoint()) {
1071       bool OpVTLegal = isOperationLegalOrCustom(ISD::FGETSIGN, Op.getValueType());
1072       bool i32Legal  = isOperationLegalOrCustom(ISD::FGETSIGN, MVT::i32);
1073       if ((OpVTLegal || i32Legal) && Op.getValueType().isSimple() &&
1074            Op.getOperand(0).getValueType() != MVT::f128) {
1075         // Cannot eliminate/lower SHL for f128 yet.
1076         EVT Ty = OpVTLegal ? Op.getValueType() : MVT::i32;
1077         // Make a FGETSIGN + SHL to move the sign bit into the appropriate
1078         // place.  We expect the SHL to be eliminated by other optimizations.
1079         SDValue Sign = TLO.DAG.getNode(ISD::FGETSIGN, dl, Ty, Op.getOperand(0));
1080         unsigned OpVTSizeInBits = Op.getValueType().getSizeInBits();
1081         if (!OpVTLegal && OpVTSizeInBits > 32)
1082           Sign = TLO.DAG.getNode(ISD::ZERO_EXTEND, dl, Op.getValueType(), Sign);
1083         unsigned ShVal = Op.getValueType().getSizeInBits()-1;
1084         SDValue ShAmt = TLO.DAG.getConstant(ShVal, dl, Op.getValueType());
1085         return TLO.CombineTo(Op, TLO.DAG.getNode(ISD::SHL, dl,
1086                                                  Op.getValueType(),
1087                                                  Sign, ShAmt));
1088       }
1089     }
1090     break;
1091   case ISD::ADD:
1092   case ISD::MUL:
1093   case ISD::SUB: {
1094     // Add, Sub, and Mul don't demand any bits in positions beyond that
1095     // of the highest bit demanded of them.
1096     APInt LoMask = APInt::getLowBitsSet(BitWidth,
1097                                         BitWidth - NewMask.countLeadingZeros());
1098     if (SimplifyDemandedBits(Op.getOperand(0), LoMask, KnownZero2,
1099                              KnownOne2, TLO, Depth+1))
1100       return true;
1101     if (SimplifyDemandedBits(Op.getOperand(1), LoMask, KnownZero2,
1102                              KnownOne2, TLO, Depth+1))
1103       return true;
1104     // See if the operation should be performed at a smaller bit width.
1105     if (TLO.ShrinkDemandedOp(Op, BitWidth, NewMask, dl))
1106       return true;
1107   }
1108   // FALL THROUGH
1109   default:
1110     // Just use computeKnownBits to compute output bits.
1111     TLO.DAG.computeKnownBits(Op, KnownZero, KnownOne, Depth);
1112     break;
1113   }
1114
1115   // If we know the value of all of the demanded bits, return this as a
1116   // constant.
1117   if ((NewMask & (KnownZero|KnownOne)) == NewMask) {
1118     // Avoid folding to a constant if any OpaqueConstant is involved.
1119     const SDNode *N = Op.getNode();
1120     for (SDNodeIterator I = SDNodeIterator::begin(N),
1121          E = SDNodeIterator::end(N); I != E; ++I) {
1122       SDNode *Op = *I;
1123       if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op))
1124         if (C->isOpaque())
1125           return false;
1126     }
1127     return TLO.CombineTo(Op,
1128                          TLO.DAG.getConstant(KnownOne, dl, Op.getValueType()));
1129   }
1130
1131   return false;
1132 }
1133
1134 /// computeKnownBitsForTargetNode - Determine which of the bits specified
1135 /// in Mask are known to be either zero or one and return them in the
1136 /// KnownZero/KnownOne bitsets.
1137 void TargetLowering::computeKnownBitsForTargetNode(const SDValue Op,
1138                                                    APInt &KnownZero,
1139                                                    APInt &KnownOne,
1140                                                    const SelectionDAG &DAG,
1141                                                    unsigned Depth) const {
1142   assert((Op.getOpcode() >= ISD::BUILTIN_OP_END ||
1143           Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN ||
1144           Op.getOpcode() == ISD::INTRINSIC_W_CHAIN ||
1145           Op.getOpcode() == ISD::INTRINSIC_VOID) &&
1146          "Should use MaskedValueIsZero if you don't know whether Op"
1147          " is a target node!");
1148   KnownZero = KnownOne = APInt(KnownOne.getBitWidth(), 0);
1149 }
1150
1151 /// ComputeNumSignBitsForTargetNode - This method can be implemented by
1152 /// targets that want to expose additional information about sign bits to the
1153 /// DAG Combiner.
1154 unsigned TargetLowering::ComputeNumSignBitsForTargetNode(SDValue Op,
1155                                                          const SelectionDAG &,
1156                                                          unsigned Depth) const {
1157   assert((Op.getOpcode() >= ISD::BUILTIN_OP_END ||
1158           Op.getOpcode() == ISD::INTRINSIC_WO_CHAIN ||
1159           Op.getOpcode() == ISD::INTRINSIC_W_CHAIN ||
1160           Op.getOpcode() == ISD::INTRINSIC_VOID) &&
1161          "Should use ComputeNumSignBits if you don't know whether Op"
1162          " is a target node!");
1163   return 1;
1164 }
1165
1166 /// ValueHasExactlyOneBitSet - Test if the given value is known to have exactly
1167 /// one bit set. This differs from computeKnownBits in that it doesn't need to
1168 /// determine which bit is set.
1169 ///
1170 static bool ValueHasExactlyOneBitSet(SDValue Val, const SelectionDAG &DAG) {
1171   // A left-shift of a constant one will have exactly one bit set, because
1172   // shifting the bit off the end is undefined.
1173   if (Val.getOpcode() == ISD::SHL)
1174     if (ConstantSDNode *C =
1175          dyn_cast<ConstantSDNode>(Val.getNode()->getOperand(0)))
1176       if (C->getAPIntValue() == 1)
1177         return true;
1178
1179   // Similarly, a right-shift of a constant sign-bit will have exactly
1180   // one bit set.
1181   if (Val.getOpcode() == ISD::SRL)
1182     if (ConstantSDNode *C =
1183          dyn_cast<ConstantSDNode>(Val.getNode()->getOperand(0)))
1184       if (C->getAPIntValue().isSignBit())
1185         return true;
1186
1187   // More could be done here, though the above checks are enough
1188   // to handle some common cases.
1189
1190   // Fall back to computeKnownBits to catch other known cases.
1191   EVT OpVT = Val.getValueType();
1192   unsigned BitWidth = OpVT.getScalarType().getSizeInBits();
1193   APInt KnownZero, KnownOne;
1194   DAG.computeKnownBits(Val, KnownZero, KnownOne);
1195   return (KnownZero.countPopulation() == BitWidth - 1) &&
1196          (KnownOne.countPopulation() == 1);
1197 }
1198
1199 bool TargetLowering::isConstTrueVal(const SDNode *N) const {
1200   if (!N)
1201     return false;
1202
1203   const ConstantSDNode *CN = dyn_cast<ConstantSDNode>(N);
1204   if (!CN) {
1205     const BuildVectorSDNode *BV = dyn_cast<BuildVectorSDNode>(N);
1206     if (!BV)
1207       return false;
1208
1209     BitVector UndefElements;
1210     CN = BV->getConstantSplatNode(&UndefElements);
1211     // Only interested in constant splats, and we don't try to handle undef
1212     // elements in identifying boolean constants.
1213     if (!CN || UndefElements.none())
1214       return false;
1215   }
1216
1217   switch (getBooleanContents(N->getValueType(0))) {
1218   case UndefinedBooleanContent:
1219     return CN->getAPIntValue()[0];
1220   case ZeroOrOneBooleanContent:
1221     return CN->isOne();
1222   case ZeroOrNegativeOneBooleanContent:
1223     return CN->isAllOnesValue();
1224   }
1225
1226   llvm_unreachable("Invalid boolean contents");
1227 }
1228
1229 bool TargetLowering::isConstFalseVal(const SDNode *N) const {
1230   if (!N)
1231     return false;
1232
1233   const ConstantSDNode *CN = dyn_cast<ConstantSDNode>(N);
1234   if (!CN) {
1235     const BuildVectorSDNode *BV = dyn_cast<BuildVectorSDNode>(N);
1236     if (!BV)
1237       return false;
1238
1239     BitVector UndefElements;
1240     CN = BV->getConstantSplatNode(&UndefElements);
1241     // Only interested in constant splats, and we don't try to handle undef
1242     // elements in identifying boolean constants.
1243     if (!CN || UndefElements.none())
1244       return false;
1245   }
1246
1247   if (getBooleanContents(N->getValueType(0)) == UndefinedBooleanContent)
1248     return !CN->getAPIntValue()[0];
1249
1250   return CN->isNullValue();
1251 }
1252
1253 /// SimplifySetCC - Try to simplify a setcc built with the specified operands
1254 /// and cc. If it is unable to simplify it, return a null SDValue.
1255 SDValue
1256 TargetLowering::SimplifySetCC(EVT VT, SDValue N0, SDValue N1,
1257                               ISD::CondCode Cond, bool foldBooleans,
1258                               DAGCombinerInfo &DCI, SDLoc dl) const {
1259   SelectionDAG &DAG = DCI.DAG;
1260
1261   // These setcc operations always fold.
1262   switch (Cond) {
1263   default: break;
1264   case ISD::SETFALSE:
1265   case ISD::SETFALSE2: return DAG.getConstant(0, dl, VT);
1266   case ISD::SETTRUE:
1267   case ISD::SETTRUE2: {
1268     TargetLowering::BooleanContent Cnt =
1269         getBooleanContents(N0->getValueType(0));
1270     return DAG.getConstant(
1271         Cnt == TargetLowering::ZeroOrNegativeOneBooleanContent ? -1ULL : 1, dl,
1272         VT);
1273   }
1274   }
1275
1276   // Ensure that the constant occurs on the RHS, and fold constant
1277   // comparisons.
1278   ISD::CondCode SwappedCC = ISD::getSetCCSwappedOperands(Cond);
1279   if (isa<ConstantSDNode>(N0.getNode()) &&
1280       (DCI.isBeforeLegalizeOps() ||
1281        isCondCodeLegal(SwappedCC, N0.getSimpleValueType())))
1282     return DAG.getSetCC(dl, VT, N1, N0, SwappedCC);
1283
1284   if (auto *N1C = dyn_cast<ConstantSDNode>(N1.getNode())) {
1285     const APInt &C1 = N1C->getAPIntValue();
1286
1287     // If the LHS is '(srl (ctlz x), 5)', the RHS is 0/1, and this is an
1288     // equality comparison, then we're just comparing whether X itself is
1289     // zero.
1290     if (N0.getOpcode() == ISD::SRL && (C1 == 0 || C1 == 1) &&
1291         N0.getOperand(0).getOpcode() == ISD::CTLZ &&
1292         N0.getOperand(1).getOpcode() == ISD::Constant) {
1293       const APInt &ShAmt
1294         = cast<ConstantSDNode>(N0.getOperand(1))->getAPIntValue();
1295       if ((Cond == ISD::SETEQ || Cond == ISD::SETNE) &&
1296           ShAmt == Log2_32(N0.getValueType().getSizeInBits())) {
1297         if ((C1 == 0) == (Cond == ISD::SETEQ)) {
1298           // (srl (ctlz x), 5) == 0  -> X != 0
1299           // (srl (ctlz x), 5) != 1  -> X != 0
1300           Cond = ISD::SETNE;
1301         } else {
1302           // (srl (ctlz x), 5) != 0  -> X == 0
1303           // (srl (ctlz x), 5) == 1  -> X == 0
1304           Cond = ISD::SETEQ;
1305         }
1306         SDValue Zero = DAG.getConstant(0, dl, N0.getValueType());
1307         return DAG.getSetCC(dl, VT, N0.getOperand(0).getOperand(0),
1308                             Zero, Cond);
1309       }
1310     }
1311
1312     SDValue CTPOP = N0;
1313     // Look through truncs that don't change the value of a ctpop.
1314     if (N0.hasOneUse() && N0.getOpcode() == ISD::TRUNCATE)
1315       CTPOP = N0.getOperand(0);
1316
1317     if (CTPOP.hasOneUse() && CTPOP.getOpcode() == ISD::CTPOP &&
1318         (N0 == CTPOP || N0.getValueType().getSizeInBits() >
1319                         Log2_32_Ceil(CTPOP.getValueType().getSizeInBits()))) {
1320       EVT CTVT = CTPOP.getValueType();
1321       SDValue CTOp = CTPOP.getOperand(0);
1322
1323       // (ctpop x) u< 2 -> (x & x-1) == 0
1324       // (ctpop x) u> 1 -> (x & x-1) != 0
1325       if ((Cond == ISD::SETULT && C1 == 2) || (Cond == ISD::SETUGT && C1 == 1)){
1326         SDValue Sub = DAG.getNode(ISD::SUB, dl, CTVT, CTOp,
1327                                   DAG.getConstant(1, dl, CTVT));
1328         SDValue And = DAG.getNode(ISD::AND, dl, CTVT, CTOp, Sub);
1329         ISD::CondCode CC = Cond == ISD::SETULT ? ISD::SETEQ : ISD::SETNE;
1330         return DAG.getSetCC(dl, VT, And, DAG.getConstant(0, dl, CTVT), CC);
1331       }
1332
1333       // TODO: (ctpop x) == 1 -> x && (x & x-1) == 0 iff ctpop is illegal.
1334     }
1335
1336     // (zext x) == C --> x == (trunc C)
1337     // (sext x) == C --> x == (trunc C)
1338     if ((Cond == ISD::SETEQ || Cond == ISD::SETNE) &&
1339         DCI.isBeforeLegalize() && N0->hasOneUse()) {
1340       unsigned MinBits = N0.getValueSizeInBits();
1341       SDValue PreExt;
1342       bool Signed = false;
1343       if (N0->getOpcode() == ISD::ZERO_EXTEND) {
1344         // ZExt
1345         MinBits = N0->getOperand(0).getValueSizeInBits();
1346         PreExt = N0->getOperand(0);
1347       } else if (N0->getOpcode() == ISD::AND) {
1348         // DAGCombine turns costly ZExts into ANDs
1349         if (auto *C = dyn_cast<ConstantSDNode>(N0->getOperand(1)))
1350           if ((C->getAPIntValue()+1).isPowerOf2()) {
1351             MinBits = C->getAPIntValue().countTrailingOnes();
1352             PreExt = N0->getOperand(0);
1353           }
1354       } else if (N0->getOpcode() == ISD::SIGN_EXTEND) {
1355         // SExt
1356         MinBits = N0->getOperand(0).getValueSizeInBits();
1357         PreExt = N0->getOperand(0);
1358         Signed = true;
1359       } else if (auto *LN0 = dyn_cast<LoadSDNode>(N0)) {
1360         // ZEXTLOAD / SEXTLOAD
1361         if (LN0->getExtensionType() == ISD::ZEXTLOAD) {
1362           MinBits = LN0->getMemoryVT().getSizeInBits();
1363           PreExt = N0;
1364         } else if (LN0->getExtensionType() == ISD::SEXTLOAD) {
1365           Signed = true;
1366           MinBits = LN0->getMemoryVT().getSizeInBits();
1367           PreExt = N0;
1368         }
1369       }
1370
1371       // Figure out how many bits we need to preserve this constant.
1372       unsigned ReqdBits = Signed ?
1373         C1.getBitWidth() - C1.getNumSignBits() + 1 :
1374         C1.getActiveBits();
1375
1376       // Make sure we're not losing bits from the constant.
1377       if (MinBits > 0 &&
1378           MinBits < C1.getBitWidth() &&
1379           MinBits >= ReqdBits) {
1380         EVT MinVT = EVT::getIntegerVT(*DAG.getContext(), MinBits);
1381         if (isTypeDesirableForOp(ISD::SETCC, MinVT)) {
1382           // Will get folded away.
1383           SDValue Trunc = DAG.getNode(ISD::TRUNCATE, dl, MinVT, PreExt);
1384           SDValue C = DAG.getConstant(C1.trunc(MinBits), dl, MinVT);
1385           return DAG.getSetCC(dl, VT, Trunc, C, Cond);
1386         }
1387       }
1388     }
1389
1390     // If the LHS is '(and load, const)', the RHS is 0,
1391     // the test is for equality or unsigned, and all 1 bits of the const are
1392     // in the same partial word, see if we can shorten the load.
1393     if (DCI.isBeforeLegalize() &&
1394         !ISD::isSignedIntSetCC(Cond) &&
1395         N0.getOpcode() == ISD::AND && C1 == 0 &&
1396         N0.getNode()->hasOneUse() &&
1397         isa<LoadSDNode>(N0.getOperand(0)) &&
1398         N0.getOperand(0).getNode()->hasOneUse() &&
1399         isa<ConstantSDNode>(N0.getOperand(1))) {
1400       LoadSDNode *Lod = cast<LoadSDNode>(N0.getOperand(0));
1401       APInt bestMask;
1402       unsigned bestWidth = 0, bestOffset = 0;
1403       if (!Lod->isVolatile() && Lod->isUnindexed()) {
1404         unsigned origWidth = N0.getValueType().getSizeInBits();
1405         unsigned maskWidth = origWidth;
1406         // We can narrow (e.g.) 16-bit extending loads on 32-bit target to
1407         // 8 bits, but have to be careful...
1408         if (Lod->getExtensionType() != ISD::NON_EXTLOAD)
1409           origWidth = Lod->getMemoryVT().getSizeInBits();
1410         const APInt &Mask =
1411           cast<ConstantSDNode>(N0.getOperand(1))->getAPIntValue();
1412         for (unsigned width = origWidth / 2; width>=8; width /= 2) {
1413           APInt newMask = APInt::getLowBitsSet(maskWidth, width);
1414           for (unsigned offset=0; offset<origWidth/width; offset++) {
1415             if ((newMask & Mask) == Mask) {
1416               if (!DAG.getDataLayout().isLittleEndian())
1417                 bestOffset = (origWidth/width - offset - 1) * (width/8);
1418               else
1419                 bestOffset = (uint64_t)offset * (width/8);
1420               bestMask = Mask.lshr(offset * (width/8) * 8);
1421               bestWidth = width;
1422               break;
1423             }
1424             newMask = newMask << width;
1425           }
1426         }
1427       }
1428       if (bestWidth) {
1429         EVT newVT = EVT::getIntegerVT(*DAG.getContext(), bestWidth);
1430         if (newVT.isRound()) {
1431           EVT PtrType = Lod->getOperand(1).getValueType();
1432           SDValue Ptr = Lod->getBasePtr();
1433           if (bestOffset != 0)
1434             Ptr = DAG.getNode(ISD::ADD, dl, PtrType, Lod->getBasePtr(),
1435                               DAG.getConstant(bestOffset, dl, PtrType));
1436           unsigned NewAlign = MinAlign(Lod->getAlignment(), bestOffset);
1437           SDValue NewLoad = DAG.getLoad(newVT, dl, Lod->getChain(), Ptr,
1438                                 Lod->getPointerInfo().getWithOffset(bestOffset),
1439                                         false, false, false, NewAlign);
1440           return DAG.getSetCC(dl, VT,
1441                               DAG.getNode(ISD::AND, dl, newVT, NewLoad,
1442                                       DAG.getConstant(bestMask.trunc(bestWidth),
1443                                                       dl, newVT)),
1444                               DAG.getConstant(0LL, dl, newVT), Cond);
1445         }
1446       }
1447     }
1448
1449     // If the LHS is a ZERO_EXTEND, perform the comparison on the input.
1450     if (N0.getOpcode() == ISD::ZERO_EXTEND) {
1451       unsigned InSize = N0.getOperand(0).getValueType().getSizeInBits();
1452
1453       // If the comparison constant has bits in the upper part, the
1454       // zero-extended value could never match.
1455       if (C1.intersects(APInt::getHighBitsSet(C1.getBitWidth(),
1456                                               C1.getBitWidth() - InSize))) {
1457         switch (Cond) {
1458         case ISD::SETUGT:
1459         case ISD::SETUGE:
1460         case ISD::SETEQ: return DAG.getConstant(0, dl, VT);
1461         case ISD::SETULT:
1462         case ISD::SETULE:
1463         case ISD::SETNE: return DAG.getConstant(1, dl, VT);
1464         case ISD::SETGT:
1465         case ISD::SETGE:
1466           // True if the sign bit of C1 is set.
1467           return DAG.getConstant(C1.isNegative(), dl, VT);
1468         case ISD::SETLT:
1469         case ISD::SETLE:
1470           // True if the sign bit of C1 isn't set.
1471           return DAG.getConstant(C1.isNonNegative(), dl, VT);
1472         default:
1473           break;
1474         }
1475       }
1476
1477       // Otherwise, we can perform the comparison with the low bits.
1478       switch (Cond) {
1479       case ISD::SETEQ:
1480       case ISD::SETNE:
1481       case ISD::SETUGT:
1482       case ISD::SETUGE:
1483       case ISD::SETULT:
1484       case ISD::SETULE: {
1485         EVT newVT = N0.getOperand(0).getValueType();
1486         if (DCI.isBeforeLegalizeOps() ||
1487             (isOperationLegal(ISD::SETCC, newVT) &&
1488              getCondCodeAction(Cond, newVT.getSimpleVT()) == Legal)) {
1489           EVT NewSetCCVT =
1490               getSetCCResultType(DAG.getDataLayout(), *DAG.getContext(), newVT);
1491           SDValue NewConst = DAG.getConstant(C1.trunc(InSize), dl, newVT);
1492
1493           SDValue NewSetCC = DAG.getSetCC(dl, NewSetCCVT, N0.getOperand(0),
1494                                           NewConst, Cond);
1495           return DAG.getBoolExtOrTrunc(NewSetCC, dl, VT, N0.getValueType());
1496         }
1497         break;
1498       }
1499       default:
1500         break;   // todo, be more careful with signed comparisons
1501       }
1502     } else if (N0.getOpcode() == ISD::SIGN_EXTEND_INREG &&
1503                (Cond == ISD::SETEQ || Cond == ISD::SETNE)) {
1504       EVT ExtSrcTy = cast<VTSDNode>(N0.getOperand(1))->getVT();
1505       unsigned ExtSrcTyBits = ExtSrcTy.getSizeInBits();
1506       EVT ExtDstTy = N0.getValueType();
1507       unsigned ExtDstTyBits = ExtDstTy.getSizeInBits();
1508
1509       // If the constant doesn't fit into the number of bits for the source of
1510       // the sign extension, it is impossible for both sides to be equal.
1511       if (C1.getMinSignedBits() > ExtSrcTyBits)
1512         return DAG.getConstant(Cond == ISD::SETNE, dl, VT);
1513
1514       SDValue ZextOp;
1515       EVT Op0Ty = N0.getOperand(0).getValueType();
1516       if (Op0Ty == ExtSrcTy) {
1517         ZextOp = N0.getOperand(0);
1518       } else {
1519         APInt Imm = APInt::getLowBitsSet(ExtDstTyBits, ExtSrcTyBits);
1520         ZextOp = DAG.getNode(ISD::AND, dl, Op0Ty, N0.getOperand(0),
1521                               DAG.getConstant(Imm, dl, Op0Ty));
1522       }
1523       if (!DCI.isCalledByLegalizer())
1524         DCI.AddToWorklist(ZextOp.getNode());
1525       // Otherwise, make this a use of a zext.
1526       return DAG.getSetCC(dl, VT, ZextOp,
1527                           DAG.getConstant(C1 & APInt::getLowBitsSet(
1528                                                               ExtDstTyBits,
1529                                                               ExtSrcTyBits),
1530                                           dl, ExtDstTy),
1531                           Cond);
1532     } else if ((N1C->isNullValue() || N1C->getAPIntValue() == 1) &&
1533                 (Cond == ISD::SETEQ || Cond == ISD::SETNE)) {
1534       // SETCC (SETCC), [0|1], [EQ|NE]  -> SETCC
1535       if (N0.getOpcode() == ISD::SETCC &&
1536           isTypeLegal(VT) && VT.bitsLE(N0.getValueType())) {
1537         bool TrueWhenTrue = (Cond == ISD::SETEQ) ^ (N1C->getAPIntValue() != 1);
1538         if (TrueWhenTrue)
1539           return DAG.getNode(ISD::TRUNCATE, dl, VT, N0);
1540         // Invert the condition.
1541         ISD::CondCode CC = cast<CondCodeSDNode>(N0.getOperand(2))->get();
1542         CC = ISD::getSetCCInverse(CC,
1543                                   N0.getOperand(0).getValueType().isInteger());
1544         if (DCI.isBeforeLegalizeOps() ||
1545             isCondCodeLegal(CC, N0.getOperand(0).getSimpleValueType()))
1546           return DAG.getSetCC(dl, VT, N0.getOperand(0), N0.getOperand(1), CC);
1547       }
1548
1549       if ((N0.getOpcode() == ISD::XOR ||
1550            (N0.getOpcode() == ISD::AND &&
1551             N0.getOperand(0).getOpcode() == ISD::XOR &&
1552             N0.getOperand(1) == N0.getOperand(0).getOperand(1))) &&
1553           isa<ConstantSDNode>(N0.getOperand(1)) &&
1554           cast<ConstantSDNode>(N0.getOperand(1))->getAPIntValue() == 1) {
1555         // If this is (X^1) == 0/1, swap the RHS and eliminate the xor.  We
1556         // can only do this if the top bits are known zero.
1557         unsigned BitWidth = N0.getValueSizeInBits();
1558         if (DAG.MaskedValueIsZero(N0,
1559                                   APInt::getHighBitsSet(BitWidth,
1560                                                         BitWidth-1))) {
1561           // Okay, get the un-inverted input value.
1562           SDValue Val;
1563           if (N0.getOpcode() == ISD::XOR)
1564             Val = N0.getOperand(0);
1565           else {
1566             assert(N0.getOpcode() == ISD::AND &&
1567                     N0.getOperand(0).getOpcode() == ISD::XOR);
1568             // ((X^1)&1)^1 -> X & 1
1569             Val = DAG.getNode(ISD::AND, dl, N0.getValueType(),
1570                               N0.getOperand(0).getOperand(0),
1571                               N0.getOperand(1));
1572           }
1573
1574           return DAG.getSetCC(dl, VT, Val, N1,
1575                               Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);
1576         }
1577       } else if (N1C->getAPIntValue() == 1 &&
1578                  (VT == MVT::i1 ||
1579                   getBooleanContents(N0->getValueType(0)) ==
1580                       ZeroOrOneBooleanContent)) {
1581         SDValue Op0 = N0;
1582         if (Op0.getOpcode() == ISD::TRUNCATE)
1583           Op0 = Op0.getOperand(0);
1584
1585         if ((Op0.getOpcode() == ISD::XOR) &&
1586             Op0.getOperand(0).getOpcode() == ISD::SETCC &&
1587             Op0.getOperand(1).getOpcode() == ISD::SETCC) {
1588           // (xor (setcc), (setcc)) == / != 1 -> (setcc) != / == (setcc)
1589           Cond = (Cond == ISD::SETEQ) ? ISD::SETNE : ISD::SETEQ;
1590           return DAG.getSetCC(dl, VT, Op0.getOperand(0), Op0.getOperand(1),
1591                               Cond);
1592         }
1593         if (Op0.getOpcode() == ISD::AND &&
1594             isa<ConstantSDNode>(Op0.getOperand(1)) &&
1595             cast<ConstantSDNode>(Op0.getOperand(1))->getAPIntValue() == 1) {
1596           // If this is (X&1) == / != 1, normalize it to (X&1) != / == 0.
1597           if (Op0.getValueType().bitsGT(VT))
1598             Op0 = DAG.getNode(ISD::AND, dl, VT,
1599                           DAG.getNode(ISD::TRUNCATE, dl, VT, Op0.getOperand(0)),
1600                           DAG.getConstant(1, dl, VT));
1601           else if (Op0.getValueType().bitsLT(VT))
1602             Op0 = DAG.getNode(ISD::AND, dl, VT,
1603                         DAG.getNode(ISD::ANY_EXTEND, dl, VT, Op0.getOperand(0)),
1604                         DAG.getConstant(1, dl, VT));
1605
1606           return DAG.getSetCC(dl, VT, Op0,
1607                               DAG.getConstant(0, dl, Op0.getValueType()),
1608                               Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);
1609         }
1610         if (Op0.getOpcode() == ISD::AssertZext &&
1611             cast<VTSDNode>(Op0.getOperand(1))->getVT() == MVT::i1)
1612           return DAG.getSetCC(dl, VT, Op0,
1613                               DAG.getConstant(0, dl, Op0.getValueType()),
1614                               Cond == ISD::SETEQ ? ISD::SETNE : ISD::SETEQ);
1615       }
1616     }
1617
1618     APInt MinVal, MaxVal;
1619     unsigned OperandBitSize = N1C->getValueType(0).getSizeInBits();
1620     if (ISD::isSignedIntSetCC(Cond)) {
1621       MinVal = APInt::getSignedMinValue(OperandBitSize);
1622       MaxVal = APInt::getSignedMaxValue(OperandBitSize);
1623     } else {
1624       MinVal = APInt::getMinValue(OperandBitSize);
1625       MaxVal = APInt::getMaxValue(OperandBitSize);
1626     }
1627
1628     // Canonicalize GE/LE comparisons to use GT/LT comparisons.
1629     if (Cond == ISD::SETGE || Cond == ISD::SETUGE) {
1630       if (C1 == MinVal) return DAG.getConstant(1, dl, VT);  // X >= MIN --> true
1631       // X >= C0 --> X > (C0 - 1)
1632       APInt C = C1 - 1;
1633       ISD::CondCode NewCC = (Cond == ISD::SETGE) ? ISD::SETGT : ISD::SETUGT;
1634       if ((DCI.isBeforeLegalizeOps() ||
1635            isCondCodeLegal(NewCC, VT.getSimpleVT())) &&
1636           (!N1C->isOpaque() || (N1C->isOpaque() && C.getBitWidth() <= 64 &&
1637                                 isLegalICmpImmediate(C.getSExtValue())))) {
1638         return DAG.getSetCC(dl, VT, N0,
1639                             DAG.getConstant(C, dl, N1.getValueType()),
1640                             NewCC);
1641       }
1642     }
1643
1644     if (Cond == ISD::SETLE || Cond == ISD::SETULE) {
1645       if (C1 == MaxVal) return DAG.getConstant(1, dl, VT);  // X <= MAX --> true
1646       // X <= C0 --> X < (C0 + 1)
1647       APInt C = C1 + 1;
1648       ISD::CondCode NewCC = (Cond == ISD::SETLE) ? ISD::SETLT : ISD::SETULT;
1649       if ((DCI.isBeforeLegalizeOps() ||
1650            isCondCodeLegal(NewCC, VT.getSimpleVT())) &&
1651           (!N1C->isOpaque() || (N1C->isOpaque() && C.getBitWidth() <= 64 &&
1652                                 isLegalICmpImmediate(C.getSExtValue())))) {
1653         return DAG.getSetCC(dl, VT, N0,
1654                             DAG.getConstant(C, dl, N1.getValueType()),
1655                             NewCC);
1656       }
1657     }
1658
1659     if ((Cond == ISD::SETLT || Cond == ISD::SETULT) && C1 == MinVal)
1660       return DAG.getConstant(0, dl, VT);      // X < MIN --> false
1661     if ((Cond == ISD::SETGE || Cond == ISD::SETUGE) && C1 == MinVal)
1662       return DAG.getConstant(1, dl, VT);      // X >= MIN --> true
1663     if ((Cond == ISD::SETGT || Cond == ISD::SETUGT) && C1 == MaxVal)
1664       return DAG.getConstant(0, dl, VT);      // X > MAX --> false
1665     if ((Cond == ISD::SETLE || Cond == ISD::SETULE) && C1 == MaxVal)
1666       return DAG.getConstant(1, dl, VT);      // X <= MAX --> true
1667
1668     // Canonicalize setgt X, Min --> setne X, Min
1669     if ((Cond == ISD::SETGT || Cond == ISD::SETUGT) && C1 == MinVal)
1670       return DAG.getSetCC(dl, VT, N0, N1, ISD::SETNE);
1671     // Canonicalize setlt X, Max --> setne X, Max
1672     if ((Cond == ISD::SETLT || Cond == ISD::SETULT) && C1 == MaxVal)
1673       return DAG.getSetCC(dl, VT, N0, N1, ISD::SETNE);
1674
1675     // If we have setult X, 1, turn it into seteq X, 0
1676     if ((Cond == ISD::SETLT || Cond == ISD::SETULT) && C1 == MinVal+1)
1677       return DAG.getSetCC(dl, VT, N0,
1678                           DAG.getConstant(MinVal, dl, N0.getValueType()),
1679                           ISD::SETEQ);
1680     // If we have setugt X, Max-1, turn it into seteq X, Max
1681     if ((Cond == ISD::SETGT || Cond == ISD::SETUGT) && C1 == MaxVal-1)
1682       return DAG.getSetCC(dl, VT, N0,
1683                           DAG.getConstant(MaxVal, dl, N0.getValueType()),
1684                           ISD::SETEQ);
1685
1686     // If we have "setcc X, C0", check to see if we can shrink the immediate
1687     // by changing cc.
1688
1689     // SETUGT X, SINTMAX  -> SETLT X, 0
1690     if (Cond == ISD::SETUGT &&
1691         C1 == APInt::getSignedMaxValue(OperandBitSize))
1692       return DAG.getSetCC(dl, VT, N0,
1693                           DAG.getConstant(0, dl, N1.getValueType()),
1694                           ISD::SETLT);
1695
1696     // SETULT X, SINTMIN  -> SETGT X, -1
1697     if (Cond == ISD::SETULT &&
1698         C1 == APInt::getSignedMinValue(OperandBitSize)) {
1699       SDValue ConstMinusOne =
1700           DAG.getConstant(APInt::getAllOnesValue(OperandBitSize), dl,
1701                           N1.getValueType());
1702       return DAG.getSetCC(dl, VT, N0, ConstMinusOne, ISD::SETGT);
1703     }
1704
1705     // Fold bit comparisons when we can.
1706     if ((Cond == ISD::SETEQ || Cond == ISD::SETNE) &&
1707         (VT == N0.getValueType() ||
1708          (isTypeLegal(VT) && VT.bitsLE(N0.getValueType()))) &&
1709         N0.getOpcode() == ISD::AND) {
1710       auto &DL = DAG.getDataLayout();
1711       if (auto *AndRHS = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {
1712         EVT ShiftTy = DCI.isBeforeLegalize()
1713                           ? getPointerTy(DL)
1714                           : getShiftAmountTy(N0.getValueType(), DL);
1715         if (Cond == ISD::SETNE && C1 == 0) {// (X & 8) != 0  -->  (X & 8) >> 3
1716           // Perform the xform if the AND RHS is a single bit.
1717           if (AndRHS->getAPIntValue().isPowerOf2()) {
1718             return DAG.getNode(ISD::TRUNCATE, dl, VT,
1719                               DAG.getNode(ISD::SRL, dl, N0.getValueType(), N0,
1720                    DAG.getConstant(AndRHS->getAPIntValue().logBase2(), dl,
1721                                    ShiftTy)));
1722           }
1723         } else if (Cond == ISD::SETEQ && C1 == AndRHS->getAPIntValue()) {
1724           // (X & 8) == 8  -->  (X & 8) >> 3
1725           // Perform the xform if C1 is a single bit.
1726           if (C1.isPowerOf2()) {
1727             return DAG.getNode(ISD::TRUNCATE, dl, VT,
1728                                DAG.getNode(ISD::SRL, dl, N0.getValueType(), N0,
1729                                       DAG.getConstant(C1.logBase2(), dl,
1730                                                       ShiftTy)));
1731           }
1732         }
1733       }
1734     }
1735
1736     if (C1.getMinSignedBits() <= 64 &&
1737         !isLegalICmpImmediate(C1.getSExtValue())) {
1738       // (X & -256) == 256 -> (X >> 8) == 1
1739       if ((Cond == ISD::SETEQ || Cond == ISD::SETNE) &&
1740           N0.getOpcode() == ISD::AND && N0.hasOneUse()) {
1741         if (auto *AndRHS = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {
1742           const APInt &AndRHSC = AndRHS->getAPIntValue();
1743           if ((-AndRHSC).isPowerOf2() && (AndRHSC & C1) == C1) {
1744             unsigned ShiftBits = AndRHSC.countTrailingZeros();
1745             auto &DL = DAG.getDataLayout();
1746             EVT ShiftTy = DCI.isBeforeLegalize()
1747                               ? getPointerTy(DL)
1748                               : getShiftAmountTy(N0.getValueType(), DL);
1749             EVT CmpTy = N0.getValueType();
1750             SDValue Shift = DAG.getNode(ISD::SRL, dl, CmpTy, N0.getOperand(0),
1751                                         DAG.getConstant(ShiftBits, dl,
1752                                                         ShiftTy));
1753             SDValue CmpRHS = DAG.getConstant(C1.lshr(ShiftBits), dl, CmpTy);
1754             return DAG.getSetCC(dl, VT, Shift, CmpRHS, Cond);
1755           }
1756         }
1757       } else if (Cond == ISD::SETULT || Cond == ISD::SETUGE ||
1758                  Cond == ISD::SETULE || Cond == ISD::SETUGT) {
1759         bool AdjOne = (Cond == ISD::SETULE || Cond == ISD::SETUGT);
1760         // X <  0x100000000 -> (X >> 32) <  1
1761         // X >= 0x100000000 -> (X >> 32) >= 1
1762         // X <= 0x0ffffffff -> (X >> 32) <  1
1763         // X >  0x0ffffffff -> (X >> 32) >= 1
1764         unsigned ShiftBits;
1765         APInt NewC = C1;
1766         ISD::CondCode NewCond = Cond;
1767         if (AdjOne) {
1768           ShiftBits = C1.countTrailingOnes();
1769           NewC = NewC + 1;
1770           NewCond = (Cond == ISD::SETULE) ? ISD::SETULT : ISD::SETUGE;
1771         } else {
1772           ShiftBits = C1.countTrailingZeros();
1773         }
1774         NewC = NewC.lshr(ShiftBits);
1775         if (ShiftBits && NewC.getMinSignedBits() <= 64 &&
1776           isLegalICmpImmediate(NewC.getSExtValue())) {
1777           auto &DL = DAG.getDataLayout();
1778           EVT ShiftTy = DCI.isBeforeLegalize()
1779                             ? getPointerTy(DL)
1780                             : getShiftAmountTy(N0.getValueType(), DL);
1781           EVT CmpTy = N0.getValueType();
1782           SDValue Shift = DAG.getNode(ISD::SRL, dl, CmpTy, N0,
1783                                       DAG.getConstant(ShiftBits, dl, ShiftTy));
1784           SDValue CmpRHS = DAG.getConstant(NewC, dl, CmpTy);
1785           return DAG.getSetCC(dl, VT, Shift, CmpRHS, NewCond);
1786         }
1787       }
1788     }
1789   }
1790
1791   if (isa<ConstantFPSDNode>(N0.getNode())) {
1792     // Constant fold or commute setcc.
1793     SDValue O = DAG.FoldSetCC(VT, N0, N1, Cond, dl);
1794     if (O.getNode()) return O;
1795   } else if (auto *CFP = dyn_cast<ConstantFPSDNode>(N1.getNode())) {
1796     // If the RHS of an FP comparison is a constant, simplify it away in
1797     // some cases.
1798     if (CFP->getValueAPF().isNaN()) {
1799       // If an operand is known to be a nan, we can fold it.
1800       switch (ISD::getUnorderedFlavor(Cond)) {
1801       default: llvm_unreachable("Unknown flavor!");
1802       case 0:  // Known false.
1803         return DAG.getConstant(0, dl, VT);
1804       case 1:  // Known true.
1805         return DAG.getConstant(1, dl, VT);
1806       case 2:  // Undefined.
1807         return DAG.getUNDEF(VT);
1808       }
1809     }
1810
1811     // Otherwise, we know the RHS is not a NaN.  Simplify the node to drop the
1812     // constant if knowing that the operand is non-nan is enough.  We prefer to
1813     // have SETO(x,x) instead of SETO(x, 0.0) because this avoids having to
1814     // materialize 0.0.
1815     if (Cond == ISD::SETO || Cond == ISD::SETUO)
1816       return DAG.getSetCC(dl, VT, N0, N0, Cond);
1817
1818     // If the condition is not legal, see if we can find an equivalent one
1819     // which is legal.
1820     if (!isCondCodeLegal(Cond, N0.getSimpleValueType())) {
1821       // If the comparison was an awkward floating-point == or != and one of
1822       // the comparison operands is infinity or negative infinity, convert the
1823       // condition to a less-awkward <= or >=.
1824       if (CFP->getValueAPF().isInfinity()) {
1825         if (CFP->getValueAPF().isNegative()) {
1826           if (Cond == ISD::SETOEQ &&
1827               isCondCodeLegal(ISD::SETOLE, N0.getSimpleValueType()))
1828             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETOLE);
1829           if (Cond == ISD::SETUEQ &&
1830               isCondCodeLegal(ISD::SETOLE, N0.getSimpleValueType()))
1831             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETULE);
1832           if (Cond == ISD::SETUNE &&
1833               isCondCodeLegal(ISD::SETUGT, N0.getSimpleValueType()))
1834             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETUGT);
1835           if (Cond == ISD::SETONE &&
1836               isCondCodeLegal(ISD::SETUGT, N0.getSimpleValueType()))
1837             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETOGT);
1838         } else {
1839           if (Cond == ISD::SETOEQ &&
1840               isCondCodeLegal(ISD::SETOGE, N0.getSimpleValueType()))
1841             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETOGE);
1842           if (Cond == ISD::SETUEQ &&
1843               isCondCodeLegal(ISD::SETOGE, N0.getSimpleValueType()))
1844             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETUGE);
1845           if (Cond == ISD::SETUNE &&
1846               isCondCodeLegal(ISD::SETULT, N0.getSimpleValueType()))
1847             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETULT);
1848           if (Cond == ISD::SETONE &&
1849               isCondCodeLegal(ISD::SETULT, N0.getSimpleValueType()))
1850             return DAG.getSetCC(dl, VT, N0, N1, ISD::SETOLT);
1851         }
1852       }
1853     }
1854   }
1855
1856   if (N0 == N1) {
1857     // The sext(setcc()) => setcc() optimization relies on the appropriate
1858     // constant being emitted.
1859     uint64_t EqVal = 0;
1860     switch (getBooleanContents(N0.getValueType())) {
1861     case UndefinedBooleanContent:
1862     case ZeroOrOneBooleanContent:
1863       EqVal = ISD::isTrueWhenEqual(Cond);
1864       break;
1865     case ZeroOrNegativeOneBooleanContent:
1866       EqVal = ISD::isTrueWhenEqual(Cond) ? -1 : 0;
1867       break;
1868     }
1869
1870     // We can always fold X == X for integer setcc's.
1871     if (N0.getValueType().isInteger()) {
1872       return DAG.getConstant(EqVal, dl, VT);
1873     }
1874     unsigned UOF = ISD::getUnorderedFlavor(Cond);
1875     if (UOF == 2)   // FP operators that are undefined on NaNs.
1876       return DAG.getConstant(EqVal, dl, VT);
1877     if (UOF == unsigned(ISD::isTrueWhenEqual(Cond)))
1878       return DAG.getConstant(EqVal, dl, VT);
1879     // Otherwise, we can't fold it.  However, we can simplify it to SETUO/SETO
1880     // if it is not already.
1881     ISD::CondCode NewCond = UOF == 0 ? ISD::SETO : ISD::SETUO;
1882     if (NewCond != Cond && (DCI.isBeforeLegalizeOps() ||
1883           getCondCodeAction(NewCond, N0.getSimpleValueType()) == Legal))
1884       return DAG.getSetCC(dl, VT, N0, N1, NewCond);
1885   }
1886
1887   if ((Cond == ISD::SETEQ || Cond == ISD::SETNE) &&
1888       N0.getValueType().isInteger()) {
1889     if (N0.getOpcode() == ISD::ADD || N0.getOpcode() == ISD::SUB ||
1890         N0.getOpcode() == ISD::XOR) {
1891       // Simplify (X+Y) == (X+Z) -->  Y == Z
1892       if (N0.getOpcode() == N1.getOpcode()) {
1893         if (N0.getOperand(0) == N1.getOperand(0))
1894           return DAG.getSetCC(dl, VT, N0.getOperand(1), N1.getOperand(1), Cond);
1895         if (N0.getOperand(1) == N1.getOperand(1))
1896           return DAG.getSetCC(dl, VT, N0.getOperand(0), N1.getOperand(0), Cond);
1897         if (DAG.isCommutativeBinOp(N0.getOpcode())) {
1898           // If X op Y == Y op X, try other combinations.
1899           if (N0.getOperand(0) == N1.getOperand(1))
1900             return DAG.getSetCC(dl, VT, N0.getOperand(1), N1.getOperand(0),
1901                                 Cond);
1902           if (N0.getOperand(1) == N1.getOperand(0))
1903             return DAG.getSetCC(dl, VT, N0.getOperand(0), N1.getOperand(1),
1904                                 Cond);
1905         }
1906       }
1907
1908       // If RHS is a legal immediate value for a compare instruction, we need
1909       // to be careful about increasing register pressure needlessly.
1910       bool LegalRHSImm = false;
1911
1912       if (auto *RHSC = dyn_cast<ConstantSDNode>(N1)) {
1913         if (auto *LHSR = dyn_cast<ConstantSDNode>(N0.getOperand(1))) {
1914           // Turn (X+C1) == C2 --> X == C2-C1
1915           if (N0.getOpcode() == ISD::ADD && N0.getNode()->hasOneUse()) {
1916             return DAG.getSetCC(dl, VT, N0.getOperand(0),
1917                                 DAG.getConstant(RHSC->getAPIntValue()-
1918                                                 LHSR->getAPIntValue(),
1919                                 dl, N0.getValueType()), Cond);
1920           }
1921
1922           // Turn (X^C1) == C2 into X == C1^C2 iff X&~C1 = 0.
1923           if (N0.getOpcode() == ISD::XOR)
1924             // If we know that all of the inverted bits are zero, don't bother
1925             // performing the inversion.
1926             if (DAG.MaskedValueIsZero(N0.getOperand(0), ~LHSR->getAPIntValue()))
1927               return
1928                 DAG.getSetCC(dl, VT, N0.getOperand(0),
1929                              DAG.getConstant(LHSR->getAPIntValue() ^
1930                                                RHSC->getAPIntValue(),
1931                                              dl, N0.getValueType()),
1932                              Cond);
1933         }
1934
1935         // Turn (C1-X) == C2 --> X == C1-C2
1936         if (auto *SUBC = dyn_cast<ConstantSDNode>(N0.getOperand(0))) {
1937           if (N0.getOpcode() == ISD::SUB && N0.getNode()->hasOneUse()) {
1938             return
1939               DAG.getSetCC(dl, VT, N0.getOperand(1),
1940                            DAG.getConstant(SUBC->getAPIntValue() -
1941                                              RHSC->getAPIntValue(),
1942                                            dl, N0.getValueType()),
1943                            Cond);
1944           }
1945         }
1946
1947         // Could RHSC fold directly into a compare?
1948         if (RHSC->getValueType(0).getSizeInBits() <= 64)
1949           LegalRHSImm = isLegalICmpImmediate(RHSC->getSExtValue());
1950       }
1951
1952       // Simplify (X+Z) == X -->  Z == 0
1953       // Don't do this if X is an immediate that can fold into a cmp
1954       // instruction and X+Z has other uses. It could be an induction variable
1955       // chain, and the transform would increase register pressure.
1956       if (!LegalRHSImm || N0.getNode()->hasOneUse()) {
1957         if (N0.getOperand(0) == N1)
1958           return DAG.getSetCC(dl, VT, N0.getOperand(1),
1959                               DAG.getConstant(0, dl, N0.getValueType()), Cond);
1960         if (N0.getOperand(1) == N1) {
1961           if (DAG.isCommutativeBinOp(N0.getOpcode()))
1962             return DAG.getSetCC(dl, VT, N0.getOperand(0),
1963                                 DAG.getConstant(0, dl, N0.getValueType()),
1964                                 Cond);
1965           if (N0.getNode()->hasOneUse()) {
1966             assert(N0.getOpcode() == ISD::SUB && "Unexpected operation!");
1967             auto &DL = DAG.getDataLayout();
1968             // (Z-X) == X  --> Z == X<<1
1969             SDValue SH = DAG.getNode(
1970                 ISD::SHL, dl, N1.getValueType(), N1,
1971                 DAG.getConstant(1, dl,
1972                                 getShiftAmountTy(N1.getValueType(), DL)));
1973             if (!DCI.isCalledByLegalizer())
1974               DCI.AddToWorklist(SH.getNode());
1975             return DAG.getSetCC(dl, VT, N0.getOperand(0), SH, Cond);
1976           }
1977         }
1978       }
1979     }
1980
1981     if (N1.getOpcode() == ISD::ADD || N1.getOpcode() == ISD::SUB ||
1982         N1.getOpcode() == ISD::XOR) {
1983       // Simplify  X == (X+Z) -->  Z == 0
1984       if (N1.getOperand(0) == N0)
1985         return DAG.getSetCC(dl, VT, N1.getOperand(1),
1986                         DAG.getConstant(0, dl, N1.getValueType()), Cond);
1987       if (N1.getOperand(1) == N0) {
1988         if (DAG.isCommutativeBinOp(N1.getOpcode()))
1989           return DAG.getSetCC(dl, VT, N1.getOperand(0),
1990                           DAG.getConstant(0, dl, N1.getValueType()), Cond);
1991         if (N1.getNode()->hasOneUse()) {
1992           assert(N1.getOpcode() == ISD::SUB && "Unexpected operation!");
1993           auto &DL = DAG.getDataLayout();
1994           // X == (Z-X)  --> X<<1 == Z
1995           SDValue SH = DAG.getNode(
1996               ISD::SHL, dl, N1.getValueType(), N0,
1997               DAG.getConstant(1, dl, getShiftAmountTy(N0.getValueType(), DL)));
1998           if (!DCI.isCalledByLegalizer())
1999             DCI.AddToWorklist(SH.getNode());
2000           return DAG.getSetCC(dl, VT, SH, N1.getOperand(0), Cond);
2001         }
2002       }
2003     }
2004
2005     // Simplify x&y == y to x&y != 0 if y has exactly one bit set.
2006     // Note that where y is variable and is known to have at most
2007     // one bit set (for example, if it is z&1) we cannot do this;
2008     // the expressions are not equivalent when y==0.
2009     if (N0.getOpcode() == ISD::AND)
2010       if (N0.getOperand(0) == N1 || N0.getOperand(1) == N1) {
2011         if (ValueHasExactlyOneBitSet(N1, DAG)) {
2012           Cond = ISD::getSetCCInverse(Cond, /*isInteger=*/true);
2013           if (DCI.isBeforeLegalizeOps() ||
2014               isCondCodeLegal(Cond, N0.getSimpleValueType())) {
2015             SDValue Zero = DAG.getConstant(0, dl, N1.getValueType());
2016             return DAG.getSetCC(dl, VT, N0, Zero, Cond);
2017           }
2018         }
2019       }
2020     if (N1.getOpcode() == ISD::AND)
2021       if (N1.getOperand(0) == N0 || N1.getOperand(1) == N0) {
2022         if (ValueHasExactlyOneBitSet(N0, DAG)) {
2023           Cond = ISD::getSetCCInverse(Cond, /*isInteger=*/true);
2024           if (DCI.isBeforeLegalizeOps() ||
2025               isCondCodeLegal(Cond, N1.getSimpleValueType())) {
2026             SDValue Zero = DAG.getConstant(0, dl, N0.getValueType());
2027             return DAG.getSetCC(dl, VT, N1, Zero, Cond);
2028           }
2029         }
2030       }
2031   }
2032
2033   // Fold away ALL boolean setcc's.
2034   SDValue Temp;
2035   if (N0.getValueType() == MVT::i1 && foldBooleans) {
2036     switch (Cond) {
2037     default: llvm_unreachable("Unknown integer setcc!");
2038     case ISD::SETEQ:  // X == Y  -> ~(X^Y)
2039       Temp = DAG.getNode(ISD::XOR, dl, MVT::i1, N0, N1);
2040       N0 = DAG.getNOT(dl, Temp, MVT::i1);
2041       if (!DCI.isCalledByLegalizer())
2042         DCI.AddToWorklist(Temp.getNode());
2043       break;
2044     case ISD::SETNE:  // X != Y   -->  (X^Y)
2045       N0 = DAG.getNode(ISD::XOR, dl, MVT::i1, N0, N1);
2046       break;
2047     case ISD::SETGT:  // X >s Y   -->  X == 0 & Y == 1  -->  ~X & Y
2048     case ISD::SETULT: // X <u Y   -->  X == 0 & Y == 1  -->  ~X & Y
2049       Temp = DAG.getNOT(dl, N0, MVT::i1);
2050       N0 = DAG.getNode(ISD::AND, dl, MVT::i1, N1, Temp);
2051       if (!DCI.isCalledByLegalizer())
2052         DCI.AddToWorklist(Temp.getNode());
2053       break;
2054     case ISD::SETLT:  // X <s Y   --> X == 1 & Y == 0  -->  ~Y & X
2055     case ISD::SETUGT: // X >u Y   --> X == 1 & Y == 0  -->  ~Y & X
2056       Temp = DAG.getNOT(dl, N1, MVT::i1);
2057       N0 = DAG.getNode(ISD::AND, dl, MVT::i1, N0, Temp);
2058       if (!DCI.isCalledByLegalizer())
2059         DCI.AddToWorklist(Temp.getNode());
2060       break;
2061     case ISD::SETULE: // X <=u Y  --> X == 0 | Y == 1  -->  ~X | Y
2062     case ISD::SETGE:  // X >=s Y  --> X == 0 | Y == 1  -->  ~X | Y
2063       Temp = DAG.getNOT(dl, N0, MVT::i1);
2064       N0 = DAG.getNode(ISD::OR, dl, MVT::i1, N1, Temp);
2065       if (!DCI.isCalledByLegalizer())
2066         DCI.AddToWorklist(Temp.getNode());
2067       break;
2068     case ISD::SETUGE: // X >=u Y  --> X == 1 | Y == 0  -->  ~Y | X
2069     case ISD::SETLE:  // X <=s Y  --> X == 1 | Y == 0  -->  ~Y | X
2070       Temp = DAG.getNOT(dl, N1, MVT::i1);
2071       N0 = DAG.getNode(ISD::OR, dl, MVT::i1, N0, Temp);
2072       break;
2073     }
2074     if (VT != MVT::i1) {
2075       if (!DCI.isCalledByLegalizer())
2076         DCI.AddToWorklist(N0.getNode());
2077       // FIXME: If running after legalize, we probably can't do this.
2078       N0 = DAG.getNode(ISD::ZERO_EXTEND, dl, VT, N0);
2079     }
2080     return N0;
2081   }
2082
2083   // Could not fold it.
2084   return SDValue();
2085 }
2086
2087 /// isGAPlusOffset - Returns true (and the GlobalValue and the offset) if the
2088 /// node is a GlobalAddress + offset.
2089 bool TargetLowering::isGAPlusOffset(SDNode *N, const GlobalValue *&GA,
2090                                     int64_t &Offset) const {
2091   if (auto *GASD = dyn_cast<GlobalAddressSDNode>(N)) {
2092     GA = GASD->getGlobal();
2093     Offset += GASD->getOffset();
2094     return true;
2095   }
2096
2097   if (N->getOpcode() == ISD::ADD) {
2098     SDValue N1 = N->getOperand(0);
2099     SDValue N2 = N->getOperand(1);
2100     if (isGAPlusOffset(N1.getNode(), GA, Offset)) {
2101       if (auto *V = dyn_cast<ConstantSDNode>(N2)) {
2102         Offset += V->getSExtValue();
2103         return true;
2104       }
2105     } else if (isGAPlusOffset(N2.getNode(), GA, Offset)) {
2106       if (auto *V = dyn_cast<ConstantSDNode>(N1)) {
2107         Offset += V->getSExtValue();
2108         return true;
2109       }
2110     }
2111   }
2112
2113   return false;
2114 }
2115
2116 SDValue TargetLowering::PerformDAGCombine(SDNode *N,
2117                                           DAGCombinerInfo &DCI) const {
2118   // Default implementation: no optimization.
2119   return SDValue();
2120 }
2121
2122 //===----------------------------------------------------------------------===//
2123 //  Inline Assembler Implementation Methods
2124 //===----------------------------------------------------------------------===//
2125
2126 TargetLowering::ConstraintType
2127 TargetLowering::getConstraintType(StringRef Constraint) const {
2128   unsigned S = Constraint.size();
2129
2130   if (S == 1) {
2131     switch (Constraint[0]) {
2132     default: break;
2133     case 'r': return C_RegisterClass;
2134     case 'm':    // memory
2135     case 'o':    // offsetable
2136     case 'V':    // not offsetable
2137       return C_Memory;
2138     case 'i':    // Simple Integer or Relocatable Constant
2139     case 'n':    // Simple Integer
2140     case 'E':    // Floating Point Constant
2141     case 'F':    // Floating Point Constant
2142     case 's':    // Relocatable Constant
2143     case 'p':    // Address.
2144     case 'X':    // Allow ANY value.
2145     case 'I':    // Target registers.
2146     case 'J':
2147     case 'K':
2148     case 'L':
2149     case 'M':
2150     case 'N':
2151     case 'O':
2152     case 'P':
2153     case '<':
2154     case '>':
2155       return C_Other;
2156     }
2157   }
2158
2159   if (S > 1 && Constraint[0] == '{' && Constraint[S-1] == '}') {
2160     if (S == 8 && Constraint.substr(1, 6) == "memory") // "{memory}"
2161       return C_Memory;
2162     return C_Register;
2163   }
2164   return C_Unknown;
2165 }
2166
2167 /// LowerXConstraint - try to replace an X constraint, which matches anything,
2168 /// with another that has more specific requirements based on the type of the
2169 /// corresponding operand.
2170 const char *TargetLowering::LowerXConstraint(EVT ConstraintVT) const{
2171   if (ConstraintVT.isInteger())
2172     return "r";
2173   if (ConstraintVT.isFloatingPoint())
2174     return "f";      // works for many targets
2175   return nullptr;
2176 }
2177
2178 /// LowerAsmOperandForConstraint - Lower the specified operand into the Ops
2179 /// vector.  If it is invalid, don't add anything to Ops.
2180 void TargetLowering::LowerAsmOperandForConstraint(SDValue Op,
2181                                                   std::string &Constraint,
2182                                                   std::vector<SDValue> &Ops,
2183                                                   SelectionDAG &DAG) const {
2184
2185   if (Constraint.length() > 1) return;
2186
2187   char ConstraintLetter = Constraint[0];
2188   switch (ConstraintLetter) {
2189   default: break;
2190   case 'X':     // Allows any operand; labels (basic block) use this.
2191     if (Op.getOpcode() == ISD::BasicBlock) {
2192       Ops.push_back(Op);
2193       return;
2194     }
2195     // fall through
2196   case 'i':    // Simple Integer or Relocatable Constant
2197   case 'n':    // Simple Integer
2198   case 's': {  // Relocatable Constant
2199     // These operands are interested in values of the form (GV+C), where C may
2200     // be folded in as an offset of GV, or it may be explicitly added.  Also, it
2201     // is possible and fine if either GV or C are missing.
2202     ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op);
2203     GlobalAddressSDNode *GA = dyn_cast<GlobalAddressSDNode>(Op);
2204
2205     // If we have "(add GV, C)", pull out GV/C
2206     if (Op.getOpcode() == ISD::ADD) {
2207       C = dyn_cast<ConstantSDNode>(Op.getOperand(1));
2208       GA = dyn_cast<GlobalAddressSDNode>(Op.getOperand(0));
2209       if (!C || !GA) {
2210         C = dyn_cast<ConstantSDNode>(Op.getOperand(0));
2211         GA = dyn_cast<GlobalAddressSDNode>(Op.getOperand(1));
2212       }
2213       if (!C || !GA)
2214         C = nullptr, GA = nullptr;
2215     }
2216
2217     // If we find a valid operand, map to the TargetXXX version so that the
2218     // value itself doesn't get selected.
2219     if (GA) {   // Either &GV   or   &GV+C
2220       if (ConstraintLetter != 'n') {
2221         int64_t Offs = GA->getOffset();
2222         if (C) Offs += C->getZExtValue();
2223         Ops.push_back(DAG.getTargetGlobalAddress(GA->getGlobal(),
2224                                                  C ? SDLoc(C) : SDLoc(),
2225                                                  Op.getValueType(), Offs));
2226       }
2227       return;
2228     }
2229     if (C) {   // just C, no GV.
2230       // Simple constants are not allowed for 's'.
2231       if (ConstraintLetter != 's') {
2232         // gcc prints these as sign extended.  Sign extend value to 64 bits
2233         // now; without this it would get ZExt'd later in
2234         // ScheduleDAGSDNodes::EmitNode, which is very generic.
2235         Ops.push_back(DAG.getTargetConstant(C->getAPIntValue().getSExtValue(),
2236                                             SDLoc(C), MVT::i64));
2237       }
2238       return;
2239     }
2240     break;
2241   }
2242   }
2243 }
2244
2245 std::pair<unsigned, const TargetRegisterClass *>
2246 TargetLowering::getRegForInlineAsmConstraint(const TargetRegisterInfo *RI,
2247                                              StringRef Constraint,
2248                                              MVT VT) const {
2249   if (Constraint.empty() || Constraint[0] != '{')
2250     return std::make_pair(0u, static_cast<TargetRegisterClass*>(nullptr));
2251   assert(*(Constraint.end()-1) == '}' && "Not a brace enclosed constraint?");
2252
2253   // Remove the braces from around the name.
2254   StringRef RegName(Constraint.data()+1, Constraint.size()-2);
2255
2256   std::pair<unsigned, const TargetRegisterClass*> R =
2257     std::make_pair(0u, static_cast<const TargetRegisterClass*>(nullptr));
2258
2259   // Figure out which register class contains this reg.
2260   for (TargetRegisterInfo::regclass_iterator RCI = RI->regclass_begin(),
2261        E = RI->regclass_end(); RCI != E; ++RCI) {
2262     const TargetRegisterClass *RC = *RCI;
2263
2264     // If none of the value types for this register class are valid, we
2265     // can't use it.  For example, 64-bit reg classes on 32-bit targets.
2266     if (!isLegalRC(RC))
2267       continue;
2268
2269     for (TargetRegisterClass::iterator I = RC->begin(), E = RC->end();
2270          I != E; ++I) {
2271       if (RegName.equals_lower(RI->getName(*I))) {
2272         std::pair<unsigned, const TargetRegisterClass*> S =
2273           std::make_pair(*I, RC);
2274
2275         // If this register class has the requested value type, return it,
2276         // otherwise keep searching and return the first class found
2277         // if no other is found which explicitly has the requested type.
2278         if (RC->hasType(VT))
2279           return S;
2280         else if (!R.second)
2281           R = S;
2282       }
2283     }
2284   }
2285
2286   return R;
2287 }
2288
2289 //===----------------------------------------------------------------------===//
2290 // Constraint Selection.
2291
2292 /// isMatchingInputConstraint - Return true of this is an input operand that is
2293 /// a matching constraint like "4".
2294 bool TargetLowering::AsmOperandInfo::isMatchingInputConstraint() const {
2295   assert(!ConstraintCode.empty() && "No known constraint!");
2296   return isdigit(static_cast<unsigned char>(ConstraintCode[0]));
2297 }
2298
2299 /// getMatchedOperand - If this is an input matching constraint, this method
2300 /// returns the output operand it matches.
2301 unsigned TargetLowering::AsmOperandInfo::getMatchedOperand() const {
2302   assert(!ConstraintCode.empty() && "No known constraint!");
2303   return atoi(ConstraintCode.c_str());
2304 }
2305
2306 /// ParseConstraints - Split up the constraint string from the inline
2307 /// assembly value into the specific constraints and their prefixes,
2308 /// and also tie in the associated operand values.
2309 /// If this returns an empty vector, and if the constraint string itself
2310 /// isn't empty, there was an error parsing.
2311 TargetLowering::AsmOperandInfoVector
2312 TargetLowering::ParseConstraints(const DataLayout &DL,
2313                                  const TargetRegisterInfo *TRI,
2314                                  ImmutableCallSite CS) const {
2315   /// ConstraintOperands - Information about all of the constraints.
2316   AsmOperandInfoVector ConstraintOperands;
2317   const InlineAsm *IA = cast<InlineAsm>(CS.getCalledValue());
2318   unsigned maCount = 0; // Largest number of multiple alternative constraints.
2319
2320   // Do a prepass over the constraints, canonicalizing them, and building up the
2321   // ConstraintOperands list.
2322   unsigned ArgNo = 0;   // ArgNo - The argument of the CallInst.
2323   unsigned ResNo = 0;   // ResNo - The result number of the next output.
2324
2325   for (InlineAsm::ConstraintInfo &CI : IA->ParseConstraints()) {
2326     ConstraintOperands.emplace_back(std::move(CI));
2327     AsmOperandInfo &OpInfo = ConstraintOperands.back();
2328
2329     // Update multiple alternative constraint count.
2330     if (OpInfo.multipleAlternatives.size() > maCount)
2331       maCount = OpInfo.multipleAlternatives.size();
2332
2333     OpInfo.ConstraintVT = MVT::Other;
2334
2335     // Compute the value type for each operand.
2336     switch (OpInfo.Type) {
2337     case InlineAsm::isOutput:
2338       // Indirect outputs just consume an argument.
2339       if (OpInfo.isIndirect) {
2340         OpInfo.CallOperandVal = const_cast<Value *>(CS.getArgument(ArgNo++));
2341         break;
2342       }
2343
2344       // The return value of the call is this value.  As such, there is no
2345       // corresponding argument.
2346       assert(!CS.getType()->isVoidTy() &&
2347              "Bad inline asm!");
2348       if (StructType *STy = dyn_cast<StructType>(CS.getType())) {
2349         OpInfo.ConstraintVT =
2350             getSimpleValueType(DL, STy->getElementType(ResNo));
2351       } else {
2352         assert(ResNo == 0 && "Asm only has one result!");
2353         OpInfo.ConstraintVT = getSimpleValueType(DL, CS.getType());
2354       }
2355       ++ResNo;
2356       break;
2357     case InlineAsm::isInput:
2358       OpInfo.CallOperandVal = const_cast<Value *>(CS.getArgument(ArgNo++));
2359       break;
2360     case InlineAsm::isClobber:
2361       // Nothing to do.
2362       break;
2363     }
2364
2365     if (OpInfo.CallOperandVal) {
2366       llvm::Type *OpTy = OpInfo.CallOperandVal->getType();
2367       if (OpInfo.isIndirect) {
2368         llvm::PointerType *PtrTy = dyn_cast<PointerType>(OpTy);
2369         if (!PtrTy)
2370           report_fatal_error("Indirect operand for inline asm not a pointer!");
2371         OpTy = PtrTy->getElementType();
2372       }
2373
2374       // Look for vector wrapped in a struct. e.g. { <16 x i8> }.
2375       if (StructType *STy = dyn_cast<StructType>(OpTy))
2376         if (STy->getNumElements() == 1)
2377           OpTy = STy->getElementType(0);
2378
2379       // If OpTy is not a single value, it may be a struct/union that we
2380       // can tile with integers.
2381       if (!OpTy->isSingleValueType() && OpTy->isSized()) {
2382         unsigned BitSize = DL.getTypeSizeInBits(OpTy);
2383         switch (BitSize) {
2384         default: break;
2385         case 1:
2386         case 8:
2387         case 16:
2388         case 32:
2389         case 64:
2390         case 128:
2391           OpInfo.ConstraintVT =
2392             MVT::getVT(IntegerType::get(OpTy->getContext(), BitSize), true);
2393           break;
2394         }
2395       } else if (PointerType *PT = dyn_cast<PointerType>(OpTy)) {
2396         unsigned PtrSize = DL.getPointerSizeInBits(PT->getAddressSpace());
2397         OpInfo.ConstraintVT = MVT::getIntegerVT(PtrSize);
2398       } else {
2399         OpInfo.ConstraintVT = MVT::getVT(OpTy, true);
2400       }
2401     }
2402   }
2403
2404   // If we have multiple alternative constraints, select the best alternative.
2405   if (!ConstraintOperands.empty()) {
2406     if (maCount) {
2407       unsigned bestMAIndex = 0;
2408       int bestWeight = -1;
2409       // weight:  -1 = invalid match, and 0 = so-so match to 5 = good match.
2410       int weight = -1;
2411       unsigned maIndex;
2412       // Compute the sums of the weights for each alternative, keeping track
2413       // of the best (highest weight) one so far.
2414       for (maIndex = 0; maIndex < maCount; ++maIndex) {
2415         int weightSum = 0;
2416         for (unsigned cIndex = 0, eIndex = ConstraintOperands.size();
2417             cIndex != eIndex; ++cIndex) {
2418           AsmOperandInfo& OpInfo = ConstraintOperands[cIndex];
2419           if (OpInfo.Type == InlineAsm::isClobber)
2420             continue;
2421
2422           // If this is an output operand with a matching input operand,
2423           // look up the matching input. If their types mismatch, e.g. one
2424           // is an integer, the other is floating point, or their sizes are
2425           // different, flag it as an maCantMatch.
2426           if (OpInfo.hasMatchingInput()) {
2427             AsmOperandInfo &Input = ConstraintOperands[OpInfo.MatchingInput];
2428             if (OpInfo.ConstraintVT != Input.ConstraintVT) {
2429               if ((OpInfo.ConstraintVT.isInteger() !=
2430                    Input.ConstraintVT.isInteger()) ||
2431                   (OpInfo.ConstraintVT.getSizeInBits() !=
2432                    Input.ConstraintVT.getSizeInBits())) {
2433                 weightSum = -1;  // Can't match.
2434                 break;
2435               }
2436             }
2437           }
2438           weight = getMultipleConstraintMatchWeight(OpInfo, maIndex);
2439           if (weight == -1) {
2440             weightSum = -1;
2441             break;
2442           }
2443           weightSum += weight;
2444         }
2445         // Update best.
2446         if (weightSum > bestWeight) {
2447           bestWeight = weightSum;
2448           bestMAIndex = maIndex;
2449         }
2450       }
2451
2452       // Now select chosen alternative in each constraint.
2453       for (unsigned cIndex = 0, eIndex = ConstraintOperands.size();
2454           cIndex != eIndex; ++cIndex) {
2455         AsmOperandInfo& cInfo = ConstraintOperands[cIndex];
2456         if (cInfo.Type == InlineAsm::isClobber)
2457           continue;
2458         cInfo.selectAlternative(bestMAIndex);
2459       }
2460     }
2461   }
2462
2463   // Check and hook up tied operands, choose constraint code to use.
2464   for (unsigned cIndex = 0, eIndex = ConstraintOperands.size();
2465       cIndex != eIndex; ++cIndex) {
2466     AsmOperandInfo& OpInfo = ConstraintOperands[cIndex];
2467
2468     // If this is an output operand with a matching input operand, look up the
2469     // matching input. If their types mismatch, e.g. one is an integer, the
2470     // other is floating point, or their sizes are different, flag it as an
2471     // error.
2472     if (OpInfo.hasMatchingInput()) {
2473       AsmOperandInfo &Input = ConstraintOperands[OpInfo.MatchingInput];
2474
2475       if (OpInfo.ConstraintVT != Input.ConstraintVT) {
2476         std::pair<unsigned, const TargetRegisterClass *> MatchRC =
2477             getRegForInlineAsmConstraint(TRI, OpInfo.ConstraintCode,
2478                                          OpInfo.ConstraintVT);
2479         std::pair<unsigned, const TargetRegisterClass *> InputRC =
2480             getRegForInlineAsmConstraint(TRI, Input.ConstraintCode,
2481                                          Input.ConstraintVT);
2482         if ((OpInfo.ConstraintVT.isInteger() !=
2483              Input.ConstraintVT.isInteger()) ||
2484             (MatchRC.second != InputRC.second)) {
2485           report_fatal_error("Unsupported asm: input constraint"
2486                              " with a matching output constraint of"
2487                              " incompatible type!");
2488         }
2489       }
2490     }
2491   }
2492
2493   return ConstraintOperands;
2494 }
2495
2496 /// getConstraintGenerality - Return an integer indicating how general CT
2497 /// is.
2498 static unsigned getConstraintGenerality(TargetLowering::ConstraintType CT) {
2499   switch (CT) {
2500   case TargetLowering::C_Other:
2501   case TargetLowering::C_Unknown:
2502     return 0;
2503   case TargetLowering::C_Register:
2504     return 1;
2505   case TargetLowering::C_RegisterClass:
2506     return 2;
2507   case TargetLowering::C_Memory:
2508     return 3;
2509   }
2510   llvm_unreachable("Invalid constraint type");
2511 }
2512
2513 /// Examine constraint type and operand type and determine a weight value.
2514 /// This object must already have been set up with the operand type
2515 /// and the current alternative constraint selected.
2516 TargetLowering::ConstraintWeight
2517   TargetLowering::getMultipleConstraintMatchWeight(
2518     AsmOperandInfo &info, int maIndex) const {
2519   InlineAsm::ConstraintCodeVector *rCodes;
2520   if (maIndex >= (int)info.multipleAlternatives.size())
2521     rCodes = &info.Codes;
2522   else
2523     rCodes = &info.multipleAlternatives[maIndex].Codes;
2524   ConstraintWeight BestWeight = CW_Invalid;
2525
2526   // Loop over the options, keeping track of the most general one.
2527   for (unsigned i = 0, e = rCodes->size(); i != e; ++i) {
2528     ConstraintWeight weight =
2529       getSingleConstraintMatchWeight(info, (*rCodes)[i].c_str());
2530     if (weight > BestWeight)
2531       BestWeight = weight;
2532   }
2533
2534   return BestWeight;
2535 }
2536
2537 /// Examine constraint type and operand type and determine a weight value.
2538 /// This object must already have been set up with the operand type
2539 /// and the current alternative constraint selected.
2540 TargetLowering::ConstraintWeight
2541   TargetLowering::getSingleConstraintMatchWeight(
2542     AsmOperandInfo &info, const char *constraint) const {
2543   ConstraintWeight weight = CW_Invalid;
2544   Value *CallOperandVal = info.CallOperandVal;
2545     // If we don't have a value, we can't do a match,
2546     // but allow it at the lowest weight.
2547   if (!CallOperandVal)
2548     return CW_Default;
2549   // Look at the constraint type.
2550   switch (*constraint) {
2551     case 'i': // immediate integer.
2552     case 'n': // immediate integer with a known value.
2553       if (isa<ConstantInt>(CallOperandVal))
2554         weight = CW_Constant;
2555       break;
2556     case 's': // non-explicit intregal immediate.
2557       if (isa<GlobalValue>(CallOperandVal))
2558         weight = CW_Constant;
2559       break;
2560     case 'E': // immediate float if host format.
2561     case 'F': // immediate float.
2562       if (isa<ConstantFP>(CallOperandVal))
2563         weight = CW_Constant;
2564       break;
2565     case '<': // memory operand with autodecrement.
2566     case '>': // memory operand with autoincrement.
2567     case 'm': // memory operand.
2568     case 'o': // offsettable memory operand
2569     case 'V': // non-offsettable memory operand
2570       weight = CW_Memory;
2571       break;
2572     case 'r': // general register.
2573     case 'g': // general register, memory operand or immediate integer.
2574               // note: Clang converts "g" to "imr".
2575       if (CallOperandVal->getType()->isIntegerTy())
2576         weight = CW_Register;
2577       break;
2578     case 'X': // any operand.
2579     default:
2580       weight = CW_Default;
2581       break;
2582   }
2583   return weight;
2584 }
2585
2586 /// ChooseConstraint - If there are multiple different constraints that we
2587 /// could pick for this operand (e.g. "imr") try to pick the 'best' one.
2588 /// This is somewhat tricky: constraints fall into four classes:
2589 ///    Other         -> immediates and magic values
2590 ///    Register      -> one specific register
2591 ///    RegisterClass -> a group of regs
2592 ///    Memory        -> memory
2593 /// Ideally, we would pick the most specific constraint possible: if we have
2594 /// something that fits into a register, we would pick it.  The problem here
2595 /// is that if we have something that could either be in a register or in
2596 /// memory that use of the register could cause selection of *other*
2597 /// operands to fail: they might only succeed if we pick memory.  Because of
2598 /// this the heuristic we use is:
2599 ///
2600 ///  1) If there is an 'other' constraint, and if the operand is valid for
2601 ///     that constraint, use it.  This makes us take advantage of 'i'
2602 ///     constraints when available.
2603 ///  2) Otherwise, pick the most general constraint present.  This prefers
2604 ///     'm' over 'r', for example.
2605 ///
2606 static void ChooseConstraint(TargetLowering::AsmOperandInfo &OpInfo,
2607                              const TargetLowering &TLI,
2608                              SDValue Op, SelectionDAG *DAG) {
2609   assert(OpInfo.Codes.size() > 1 && "Doesn't have multiple constraint options");
2610   unsigned BestIdx = 0;
2611   TargetLowering::ConstraintType BestType = TargetLowering::C_Unknown;
2612   int BestGenerality = -1;
2613
2614   // Loop over the options, keeping track of the most general one.
2615   for (unsigned i = 0, e = OpInfo.Codes.size(); i != e; ++i) {
2616     TargetLowering::ConstraintType CType =
2617       TLI.getConstraintType(OpInfo.Codes[i]);
2618
2619     // If this is an 'other' constraint, see if the operand is valid for it.
2620     // For example, on X86 we might have an 'rI' constraint.  If the operand
2621     // is an integer in the range [0..31] we want to use I (saving a load
2622     // of a register), otherwise we must use 'r'.
2623     if (CType == TargetLowering::C_Other && Op.getNode()) {
2624       assert(OpInfo.Codes[i].size() == 1 &&
2625              "Unhandled multi-letter 'other' constraint");
2626       std::vector<SDValue> ResultOps;
2627       TLI.LowerAsmOperandForConstraint(Op, OpInfo.Codes[i],
2628                                        ResultOps, *DAG);
2629       if (!ResultOps.empty()) {
2630         BestType = CType;
2631         BestIdx = i;
2632         break;
2633       }
2634     }
2635
2636     // Things with matching constraints can only be registers, per gcc
2637     // documentation.  This mainly affects "g" constraints.
2638     if (CType == TargetLowering::C_Memory && OpInfo.hasMatchingInput())
2639       continue;
2640
2641     // This constraint letter is more general than the previous one, use it.
2642     int Generality = getConstraintGenerality(CType);
2643     if (Generality > BestGenerality) {
2644       BestType = CType;
2645       BestIdx = i;
2646       BestGenerality = Generality;
2647     }
2648   }
2649
2650   OpInfo.ConstraintCode = OpInfo.Codes[BestIdx];
2651   OpInfo.ConstraintType = BestType;
2652 }
2653
2654 /// ComputeConstraintToUse - Determines the constraint code and constraint
2655 /// type to use for the specific AsmOperandInfo, setting
2656 /// OpInfo.ConstraintCode and OpInfo.ConstraintType.
2657 void TargetLowering::ComputeConstraintToUse(AsmOperandInfo &OpInfo,
2658                                             SDValue Op,
2659                                             SelectionDAG *DAG) const {
2660   assert(!OpInfo.Codes.empty() && "Must have at least one constraint");
2661
2662   // Single-letter constraints ('r') are very common.
2663   if (OpInfo.Codes.size() == 1) {
2664     OpInfo.ConstraintCode = OpInfo.Codes[0];
2665     OpInfo.ConstraintType = getConstraintType(OpInfo.ConstraintCode);
2666   } else {
2667     ChooseConstraint(OpInfo, *this, Op, DAG);
2668   }
2669
2670   // 'X' matches anything.
2671   if (OpInfo.ConstraintCode == "X" && OpInfo.CallOperandVal) {
2672     // Labels and constants are handled elsewhere ('X' is the only thing
2673     // that matches labels).  For Functions, the type here is the type of
2674     // the result, which is not what we want to look at; leave them alone.
2675     Value *v = OpInfo.CallOperandVal;
2676     if (isa<BasicBlock>(v) || isa<ConstantInt>(v) || isa<Function>(v)) {
2677       OpInfo.CallOperandVal = v;
2678       return;
2679     }
2680
2681     // Otherwise, try to resolve it to something we know about by looking at
2682     // the actual operand type.
2683     if (const char *Repl = LowerXConstraint(OpInfo.ConstraintVT)) {
2684       OpInfo.ConstraintCode = Repl;
2685       OpInfo.ConstraintType = getConstraintType(OpInfo.ConstraintCode);
2686     }
2687   }
2688 }
2689
2690 /// \brief Given an exact SDIV by a constant, create a multiplication
2691 /// with the multiplicative inverse of the constant.
2692 static SDValue BuildExactSDIV(const TargetLowering &TLI, SDValue Op1, APInt d,
2693                               SDLoc dl, SelectionDAG &DAG,
2694                               std::vector<SDNode *> &Created) {
2695   assert(d != 0 && "Division by zero!");
2696
2697   // Shift the value upfront if it is even, so the LSB is one.
2698   unsigned ShAmt = d.countTrailingZeros();
2699   if (ShAmt) {
2700     // TODO: For UDIV use SRL instead of SRA.
2701     SDValue Amt =
2702         DAG.getConstant(ShAmt, dl, TLI.getShiftAmountTy(Op1.getValueType(),
2703                                                         DAG.getDataLayout()));
2704     SDNodeFlags Flags;
2705     Flags.setExact(true);
2706     Op1 = DAG.getNode(ISD::SRA, dl, Op1.getValueType(), Op1, Amt, &Flags);
2707     Created.push_back(Op1.getNode());
2708     d = d.ashr(ShAmt);
2709   }
2710
2711   // Calculate the multiplicative inverse, using Newton's method.
2712   APInt t, xn = d;
2713   while ((t = d*xn) != 1)
2714     xn *= APInt(d.getBitWidth(), 2) - t;
2715
2716   SDValue Op2 = DAG.getConstant(xn, dl, Op1.getValueType());
2717   SDValue Mul = DAG.getNode(ISD::MUL, dl, Op1.getValueType(), Op1, Op2);
2718   Created.push_back(Mul.getNode());
2719   return Mul;
2720 }
2721
2722 SDValue TargetLowering::BuildSDIVPow2(SDNode *N, const APInt &Divisor,
2723                                       SelectionDAG &DAG,
2724                                       std::vector<SDNode *> *Created) const {
2725   AttributeSet Attr = DAG.getMachineFunction().getFunction()->getAttributes();
2726   const TargetLowering &TLI = DAG.getTargetLoweringInfo();
2727   if (TLI.isIntDivCheap(N->getValueType(0), Attr))
2728     return SDValue(N,0); // Lower SDIV as SDIV
2729   return SDValue();
2730 }
2731
2732 /// \brief Given an ISD::SDIV node expressing a divide by constant,
2733 /// return a DAG expression to select that will generate the same value by
2734 /// multiplying by a magic number.
2735 /// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".
2736 SDValue TargetLowering::BuildSDIV(SDNode *N, const APInt &Divisor,
2737                                   SelectionDAG &DAG, bool IsAfterLegalization,
2738                                   std::vector<SDNode *> *Created) const {
2739   assert(Created && "No vector to hold sdiv ops.");
2740
2741   EVT VT = N->getValueType(0);
2742   SDLoc dl(N);
2743
2744   // Check to see if we can do this.
2745   // FIXME: We should be more aggressive here.
2746   if (!isTypeLegal(VT))
2747     return SDValue();
2748
2749   // If the sdiv has an 'exact' bit we can use a simpler lowering.
2750   if (cast<BinaryWithFlagsSDNode>(N)->Flags.hasExact())
2751     return BuildExactSDIV(*this, N->getOperand(0), Divisor, dl, DAG, *Created);
2752
2753   APInt::ms magics = Divisor.magic();
2754
2755   // Multiply the numerator (operand 0) by the magic value
2756   // FIXME: We should support doing a MUL in a wider type
2757   SDValue Q;
2758   if (IsAfterLegalization ? isOperationLegal(ISD::MULHS, VT) :
2759                             isOperationLegalOrCustom(ISD::MULHS, VT))
2760     Q = DAG.getNode(ISD::MULHS, dl, VT, N->getOperand(0),
2761                     DAG.getConstant(magics.m, dl, VT));
2762   else if (IsAfterLegalization ? isOperationLegal(ISD::SMUL_LOHI, VT) :
2763                                  isOperationLegalOrCustom(ISD::SMUL_LOHI, VT))
2764     Q = SDValue(DAG.getNode(ISD::SMUL_LOHI, dl, DAG.getVTList(VT, VT),
2765                               N->getOperand(0),
2766                               DAG.getConstant(magics.m, dl, VT)).getNode(), 1);
2767   else
2768     return SDValue();       // No mulhs or equvialent
2769   // If d > 0 and m < 0, add the numerator
2770   if (Divisor.isStrictlyPositive() && magics.m.isNegative()) {
2771     Q = DAG.getNode(ISD::ADD, dl, VT, Q, N->getOperand(0));
2772     Created->push_back(Q.getNode());
2773   }
2774   // If d < 0 and m > 0, subtract the numerator.
2775   if (Divisor.isNegative() && magics.m.isStrictlyPositive()) {
2776     Q = DAG.getNode(ISD::SUB, dl, VT, Q, N->getOperand(0));
2777     Created->push_back(Q.getNode());
2778   }
2779   auto &DL = DAG.getDataLayout();
2780   // Shift right algebraic if shift value is nonzero
2781   if (magics.s > 0) {
2782     Q = DAG.getNode(
2783         ISD::SRA, dl, VT, Q,
2784         DAG.getConstant(magics.s, dl, getShiftAmountTy(Q.getValueType(), DL)));
2785     Created->push_back(Q.getNode());
2786   }
2787   // Extract the sign bit and add it to the quotient
2788   SDValue T =
2789       DAG.getNode(ISD::SRL, dl, VT, Q,
2790                   DAG.getConstant(VT.getScalarSizeInBits() - 1, dl,
2791                                   getShiftAmountTy(Q.getValueType(), DL)));
2792   Created->push_back(T.getNode());
2793   return DAG.getNode(ISD::ADD, dl, VT, Q, T);
2794 }
2795
2796 /// \brief Given an ISD::UDIV node expressing a divide by constant,
2797 /// return a DAG expression to select that will generate the same value by
2798 /// multiplying by a magic number.
2799 /// Ref: "Hacker's Delight" or "The PowerPC Compiler Writer's Guide".
2800 SDValue TargetLowering::BuildUDIV(SDNode *N, const APInt &Divisor,
2801                                   SelectionDAG &DAG, bool IsAfterLegalization,
2802                                   std::vector<SDNode *> *Created) const {
2803   assert(Created && "No vector to hold udiv ops.");
2804
2805   EVT VT = N->getValueType(0);
2806   SDLoc dl(N);
2807   auto &DL = DAG.getDataLayout();
2808
2809   // Check to see if we can do this.
2810   // FIXME: We should be more aggressive here.
2811   if (!isTypeLegal(VT))
2812     return SDValue();
2813
2814   // FIXME: We should use a narrower constant when the upper
2815   // bits are known to be zero.
2816   APInt::mu magics = Divisor.magicu();
2817
2818   SDValue Q = N->getOperand(0);
2819
2820   // If the divisor is even, we can avoid using the expensive fixup by shifting
2821   // the divided value upfront.
2822   if (magics.a != 0 && !Divisor[0]) {
2823     unsigned Shift = Divisor.countTrailingZeros();
2824     Q = DAG.getNode(
2825         ISD::SRL, dl, VT, Q,
2826         DAG.getConstant(Shift, dl, getShiftAmountTy(Q.getValueType(), DL)));
2827     Created->push_back(Q.getNode());
2828
2829     // Get magic number for the shifted divisor.
2830     magics = Divisor.lshr(Shift).magicu(Shift);
2831     assert(magics.a == 0 && "Should use cheap fixup now");
2832   }
2833
2834   // Multiply the numerator (operand 0) by the magic value
2835   // FIXME: We should support doing a MUL in a wider type
2836   if (IsAfterLegalization ? isOperationLegal(ISD::MULHU, VT) :
2837                             isOperationLegalOrCustom(ISD::MULHU, VT))
2838     Q = DAG.getNode(ISD::MULHU, dl, VT, Q, DAG.getConstant(magics.m, dl, VT));
2839   else if (IsAfterLegalization ? isOperationLegal(ISD::UMUL_LOHI, VT) :
2840                                  isOperationLegalOrCustom(ISD::UMUL_LOHI, VT))
2841     Q = SDValue(DAG.getNode(ISD::UMUL_LOHI, dl, DAG.getVTList(VT, VT), Q,
2842                             DAG.getConstant(magics.m, dl, VT)).getNode(), 1);
2843   else
2844     return SDValue();       // No mulhu or equvialent
2845
2846   Created->push_back(Q.getNode());
2847
2848   if (magics.a == 0) {
2849     assert(magics.s < Divisor.getBitWidth() &&
2850            "We shouldn't generate an undefined shift!");
2851     return DAG.getNode(
2852         ISD::SRL, dl, VT, Q,
2853         DAG.getConstant(magics.s, dl, getShiftAmountTy(Q.getValueType(), DL)));
2854   } else {
2855     SDValue NPQ = DAG.getNode(ISD::SUB, dl, VT, N->getOperand(0), Q);
2856     Created->push_back(NPQ.getNode());
2857     NPQ = DAG.getNode(
2858         ISD::SRL, dl, VT, NPQ,
2859         DAG.getConstant(1, dl, getShiftAmountTy(NPQ.getValueType(), DL)));
2860     Created->push_back(NPQ.getNode());
2861     NPQ = DAG.getNode(ISD::ADD, dl, VT, NPQ, Q);
2862     Created->push_back(NPQ.getNode());
2863     return DAG.getNode(
2864         ISD::SRL, dl, VT, NPQ,
2865         DAG.getConstant(magics.s - 1, dl,
2866                         getShiftAmountTy(NPQ.getValueType(), DL)));
2867   }
2868 }
2869
2870 bool TargetLowering::
2871 verifyReturnAddressArgumentIsConstant(SDValue Op, SelectionDAG &DAG) const {
2872   if (!isa<ConstantSDNode>(Op.getOperand(0))) {
2873     DAG.getContext()->emitError("argument to '__builtin_return_address' must "
2874                                 "be a constant integer");
2875     return true;
2876   }
2877
2878   return false;
2879 }
2880
2881 //===----------------------------------------------------------------------===//
2882 // Legalization Utilities
2883 //===----------------------------------------------------------------------===//
2884
2885 bool TargetLowering::expandMUL(SDNode *N, SDValue &Lo, SDValue &Hi, EVT HiLoVT,
2886                                SelectionDAG &DAG, SDValue LL, SDValue LH,
2887                                SDValue RL, SDValue RH) const {
2888   EVT VT = N->getValueType(0);
2889   SDLoc dl(N);
2890
2891   bool HasMULHS = isOperationLegalOrCustom(ISD::MULHS, HiLoVT);
2892   bool HasMULHU = isOperationLegalOrCustom(ISD::MULHU, HiLoVT);
2893   bool HasSMUL_LOHI = isOperationLegalOrCustom(ISD::SMUL_LOHI, HiLoVT);
2894   bool HasUMUL_LOHI = isOperationLegalOrCustom(ISD::UMUL_LOHI, HiLoVT);
2895   if (HasMULHU || HasMULHS || HasUMUL_LOHI || HasSMUL_LOHI) {
2896     unsigned OuterBitSize = VT.getSizeInBits();
2897     unsigned InnerBitSize = HiLoVT.getSizeInBits();
2898     unsigned LHSSB = DAG.ComputeNumSignBits(N->getOperand(0));
2899     unsigned RHSSB = DAG.ComputeNumSignBits(N->getOperand(1));
2900
2901     // LL, LH, RL, and RH must be either all NULL or all set to a value.
2902     assert((LL.getNode() && LH.getNode() && RL.getNode() && RH.getNode()) ||
2903            (!LL.getNode() && !LH.getNode() && !RL.getNode() && !RH.getNode()));
2904
2905     if (!LL.getNode() && !RL.getNode() &&
2906         isOperationLegalOrCustom(ISD::TRUNCATE, HiLoVT)) {
2907       LL = DAG.getNode(ISD::TRUNCATE, dl, HiLoVT, N->getOperand(0));
2908       RL = DAG.getNode(ISD::TRUNCATE, dl, HiLoVT, N->getOperand(1));
2909     }
2910
2911     if (!LL.getNode())
2912       return false;
2913
2914     APInt HighMask = APInt::getHighBitsSet(OuterBitSize, InnerBitSize);
2915     if (DAG.MaskedValueIsZero(N->getOperand(0), HighMask) &&
2916         DAG.MaskedValueIsZero(N->getOperand(1), HighMask)) {
2917       // The inputs are both zero-extended.
2918       if (HasUMUL_LOHI) {
2919         // We can emit a umul_lohi.
2920         Lo = DAG.getNode(ISD::UMUL_LOHI, dl, DAG.getVTList(HiLoVT, HiLoVT), LL,
2921                          RL);
2922         Hi = SDValue(Lo.getNode(), 1);
2923         return true;
2924       }
2925       if (HasMULHU) {
2926         // We can emit a mulhu+mul.
2927         Lo = DAG.getNode(ISD::MUL, dl, HiLoVT, LL, RL);
2928         Hi = DAG.getNode(ISD::MULHU, dl, HiLoVT, LL, RL);
2929         return true;
2930       }
2931     }
2932     if (LHSSB > InnerBitSize && RHSSB > InnerBitSize) {
2933       // The input values are both sign-extended.
2934       if (HasSMUL_LOHI) {
2935         // We can emit a smul_lohi.
2936         Lo = DAG.getNode(ISD::SMUL_LOHI, dl, DAG.getVTList(HiLoVT, HiLoVT), LL,
2937                          RL);
2938         Hi = SDValue(Lo.getNode(), 1);
2939         return true;
2940       }
2941       if (HasMULHS) {
2942         // We can emit a mulhs+mul.
2943         Lo = DAG.getNode(ISD::MUL, dl, HiLoVT, LL, RL);
2944         Hi = DAG.getNode(ISD::MULHS, dl, HiLoVT, LL, RL);
2945         return true;
2946       }
2947     }
2948
2949     if (!LH.getNode() && !RH.getNode() &&
2950         isOperationLegalOrCustom(ISD::SRL, VT) &&
2951         isOperationLegalOrCustom(ISD::TRUNCATE, HiLoVT)) {
2952       auto &DL = DAG.getDataLayout();
2953       unsigned ShiftAmt = VT.getSizeInBits() - HiLoVT.getSizeInBits();
2954       SDValue Shift = DAG.getConstant(ShiftAmt, dl, getShiftAmountTy(VT, DL));
2955       LH = DAG.getNode(ISD::SRL, dl, VT, N->getOperand(0), Shift);
2956       LH = DAG.getNode(ISD::TRUNCATE, dl, HiLoVT, LH);
2957       RH = DAG.getNode(ISD::SRL, dl, VT, N->getOperand(1), Shift);
2958       RH = DAG.getNode(ISD::TRUNCATE, dl, HiLoVT, RH);
2959     }
2960
2961     if (!LH.getNode())
2962       return false;
2963
2964     if (HasUMUL_LOHI) {
2965       // Lo,Hi = umul LHS, RHS.
2966       SDValue UMulLOHI = DAG.getNode(ISD::UMUL_LOHI, dl,
2967                                      DAG.getVTList(HiLoVT, HiLoVT), LL, RL);
2968       Lo = UMulLOHI;
2969       Hi = UMulLOHI.getValue(1);
2970       RH = DAG.getNode(ISD::MUL, dl, HiLoVT, LL, RH);
2971       LH = DAG.getNode(ISD::MUL, dl, HiLoVT, LH, RL);
2972       Hi = DAG.getNode(ISD::ADD, dl, HiLoVT, Hi, RH);
2973       Hi = DAG.getNode(ISD::ADD, dl, HiLoVT, Hi, LH);
2974       return true;
2975     }
2976     if (HasMULHU) {
2977       Lo = DAG.getNode(ISD::MUL, dl, HiLoVT, LL, RL);
2978       Hi = DAG.getNode(ISD::MULHU, dl, HiLoVT, LL, RL);
2979       RH = DAG.getNode(ISD::MUL, dl, HiLoVT, LL, RH);
2980       LH = DAG.getNode(ISD::MUL, dl, HiLoVT, LH, RL);
2981       Hi = DAG.getNode(ISD::ADD, dl, HiLoVT, Hi, RH);
2982       Hi = DAG.getNode(ISD::ADD, dl, HiLoVT, Hi, LH);
2983       return true;
2984     }
2985   }
2986   return false;
2987 }
2988
2989 bool TargetLowering::expandFP_TO_SINT(SDNode *Node, SDValue &Result,
2990                                SelectionDAG &DAG) const {
2991   EVT VT = Node->getOperand(0).getValueType();
2992   EVT NVT = Node->getValueType(0);
2993   SDLoc dl(SDValue(Node, 0));
2994
2995   // FIXME: Only f32 to i64 conversions are supported.
2996   if (VT != MVT::f32 || NVT != MVT::i64)
2997     return false;
2998
2999   // Expand f32 -> i64 conversion
3000   // This algorithm comes from compiler-rt's implementation of fixsfdi:
3001   // https://github.com/llvm-mirror/compiler-rt/blob/master/lib/builtins/fixsfdi.c
3002   EVT IntVT = EVT::getIntegerVT(*DAG.getContext(),
3003                                 VT.getSizeInBits());
3004   SDValue ExponentMask = DAG.getConstant(0x7F800000, dl, IntVT);
3005   SDValue ExponentLoBit = DAG.getConstant(23, dl, IntVT);
3006   SDValue Bias = DAG.getConstant(127, dl, IntVT);
3007   SDValue SignMask = DAG.getConstant(APInt::getSignBit(VT.getSizeInBits()), dl,
3008                                      IntVT);
3009   SDValue SignLowBit = DAG.getConstant(VT.getSizeInBits() - 1, dl, IntVT);
3010   SDValue MantissaMask = DAG.getConstant(0x007FFFFF, dl, IntVT);
3011
3012   SDValue Bits = DAG.getNode(ISD::BITCAST, dl, IntVT, Node->getOperand(0));
3013
3014   auto &DL = DAG.getDataLayout();
3015   SDValue ExponentBits = DAG.getNode(
3016       ISD::SRL, dl, IntVT, DAG.getNode(ISD::AND, dl, IntVT, Bits, ExponentMask),
3017       DAG.getZExtOrTrunc(ExponentLoBit, dl, getShiftAmountTy(IntVT, DL)));
3018   SDValue Exponent = DAG.getNode(ISD::SUB, dl, IntVT, ExponentBits, Bias);
3019
3020   SDValue Sign = DAG.getNode(
3021       ISD::SRA, dl, IntVT, DAG.getNode(ISD::AND, dl, IntVT, Bits, SignMask),
3022       DAG.getZExtOrTrunc(SignLowBit, dl, getShiftAmountTy(IntVT, DL)));
3023   Sign = DAG.getSExtOrTrunc(Sign, dl, NVT);
3024
3025   SDValue R = DAG.getNode(ISD::OR, dl, IntVT,
3026       DAG.getNode(ISD::AND, dl, IntVT, Bits, MantissaMask),
3027       DAG.getConstant(0x00800000, dl, IntVT));
3028
3029   R = DAG.getZExtOrTrunc(R, dl, NVT);
3030
3031   R = DAG.getSelectCC(
3032       dl, Exponent, ExponentLoBit,
3033       DAG.getNode(ISD::SHL, dl, NVT, R,
3034                   DAG.getZExtOrTrunc(
3035                       DAG.getNode(ISD::SUB, dl, IntVT, Exponent, ExponentLoBit),
3036                       dl, getShiftAmountTy(IntVT, DL))),
3037       DAG.getNode(ISD::SRL, dl, NVT, R,
3038                   DAG.getZExtOrTrunc(
3039                       DAG.getNode(ISD::SUB, dl, IntVT, ExponentLoBit, Exponent),
3040                       dl, getShiftAmountTy(IntVT, DL))),
3041       ISD::SETGT);
3042
3043   SDValue Ret = DAG.getNode(ISD::SUB, dl, NVT,
3044       DAG.getNode(ISD::XOR, dl, NVT, R, Sign),
3045       Sign);
3046
3047   Result = DAG.getSelectCC(dl, Exponent, DAG.getConstant(0, dl, IntVT),
3048       DAG.getConstant(0, dl, NVT), Ret, ISD::SETLT);
3049   return true;
3050 }
3051
3052 //===----------------------------------------------------------------------===//
3053 // Implementation of Emulated TLS Model
3054 //===----------------------------------------------------------------------===//
3055
3056 SDValue TargetLowering::LowerToTLSEmulatedModel(const GlobalAddressSDNode *GA,
3057                                                 SelectionDAG &DAG) const {
3058   // Access to address of TLS varialbe xyz is lowered to a function call:
3059   //   __emutls_get_address( address of global variable named "__emutls_v.xyz" )
3060   EVT PtrVT = getPointerTy(DAG.getDataLayout());
3061   PointerType *VoidPtrType = Type::getInt8PtrTy(*DAG.getContext());
3062   SDLoc dl(GA);
3063
3064   ArgListTy Args;
3065   ArgListEntry Entry;
3066   std::string NameString = ("__emutls_v." + GA->getGlobal()->getName()).str();
3067   Module *VariableModule = const_cast<Module*>(GA->getGlobal()->getParent());
3068   StringRef EmuTlsVarName(NameString);
3069   GlobalVariable *EmuTlsVar = VariableModule->getNamedGlobal(EmuTlsVarName);
3070   if (!EmuTlsVar)
3071     EmuTlsVar = dyn_cast_or_null<GlobalVariable>(
3072         VariableModule->getOrInsertGlobal(EmuTlsVarName, VoidPtrType));
3073   Entry.Node = DAG.getGlobalAddress(EmuTlsVar, dl, PtrVT);
3074   Entry.Ty = VoidPtrType;
3075   Args.push_back(Entry);
3076
3077   SDValue EmuTlsGetAddr = DAG.getExternalSymbol("__emutls_get_address", PtrVT);
3078
3079   TargetLowering::CallLoweringInfo CLI(DAG);
3080   CLI.setDebugLoc(dl).setChain(DAG.getEntryNode());
3081   CLI.setCallee(CallingConv::C, VoidPtrType, EmuTlsGetAddr, std::move(Args), 0);
3082   std::pair<SDValue, SDValue> CallResult = LowerCallTo(CLI);
3083
3084   // TLSADDR will be codegen'ed as call. Inform MFI that function has calls.
3085   // At last for X86 targets, maybe good for other targets too?
3086   MachineFrameInfo *MFI = DAG.getMachineFunction().getFrameInfo();
3087   MFI->setAdjustsStack(true);  // Is this only for X86 target?
3088   MFI->setHasCalls(true);
3089
3090   assert((GA->getOffset() == 0) &&
3091          "Emulated TLS must have zero offset in GlobalAddressSDNode");
3092   return CallResult.first;
3093 }