AVX-512: Added mask and rounding mode for scalar arithmetics
[oota-llvm.git] / lib / Target / Mips / MipsSEISelDAGToDAG.cpp
1 //===-- MipsSEISelDAGToDAG.cpp - A Dag to Dag Inst Selector for MipsSE ----===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // Subclass of MipsDAGToDAGISel specialized for mips32/64.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "MipsSEISelDAGToDAG.h"
15 #include "MCTargetDesc/MipsBaseInfo.h"
16 #include "Mips.h"
17 #include "MipsAnalyzeImmediate.h"
18 #include "MipsMachineFunction.h"
19 #include "MipsRegisterInfo.h"
20 #include "llvm/CodeGen/MachineConstantPool.h"
21 #include "llvm/CodeGen/MachineFrameInfo.h"
22 #include "llvm/CodeGen/MachineFunction.h"
23 #include "llvm/CodeGen/MachineInstrBuilder.h"
24 #include "llvm/CodeGen/MachineRegisterInfo.h"
25 #include "llvm/CodeGen/SelectionDAGNodes.h"
26 #include "llvm/IR/CFG.h"
27 #include "llvm/IR/GlobalValue.h"
28 #include "llvm/IR/Instructions.h"
29 #include "llvm/IR/Intrinsics.h"
30 #include "llvm/IR/Type.h"
31 #include "llvm/Support/Debug.h"
32 #include "llvm/Support/ErrorHandling.h"
33 #include "llvm/Support/raw_ostream.h"
34 #include "llvm/Target/TargetMachine.h"
35 using namespace llvm;
36
37 #define DEBUG_TYPE "mips-isel"
38
39 bool MipsSEDAGToDAGISel::runOnMachineFunction(MachineFunction &MF) {
40   Subtarget = &static_cast<const MipsSubtarget &>(MF.getSubtarget());
41   if (Subtarget->inMips16Mode())
42     return false;
43   return MipsDAGToDAGISel::runOnMachineFunction(MF);
44 }
45
46 void MipsSEDAGToDAGISel::addDSPCtrlRegOperands(bool IsDef, MachineInstr &MI,
47                                                MachineFunction &MF) {
48   MachineInstrBuilder MIB(MF, &MI);
49   unsigned Mask = MI.getOperand(1).getImm();
50   unsigned Flag = IsDef ? RegState::ImplicitDefine : RegState::Implicit;
51
52   if (Mask & 1)
53     MIB.addReg(Mips::DSPPos, Flag);
54
55   if (Mask & 2)
56     MIB.addReg(Mips::DSPSCount, Flag);
57
58   if (Mask & 4)
59     MIB.addReg(Mips::DSPCarry, Flag);
60
61   if (Mask & 8)
62     MIB.addReg(Mips::DSPOutFlag, Flag);
63
64   if (Mask & 16)
65     MIB.addReg(Mips::DSPCCond, Flag);
66
67   if (Mask & 32)
68     MIB.addReg(Mips::DSPEFI, Flag);
69 }
70
71 unsigned MipsSEDAGToDAGISel::getMSACtrlReg(const SDValue RegIdx) const {
72   switch (cast<ConstantSDNode>(RegIdx)->getZExtValue()) {
73   default:
74     llvm_unreachable("Could not map int to register");
75   case 0: return Mips::MSAIR;
76   case 1: return Mips::MSACSR;
77   case 2: return Mips::MSAAccess;
78   case 3: return Mips::MSASave;
79   case 4: return Mips::MSAModify;
80   case 5: return Mips::MSARequest;
81   case 6: return Mips::MSAMap;
82   case 7: return Mips::MSAUnmap;
83   }
84 }
85
86 bool MipsSEDAGToDAGISel::replaceUsesWithZeroReg(MachineRegisterInfo *MRI,
87                                                 const MachineInstr& MI) {
88   unsigned DstReg = 0, ZeroReg = 0;
89
90   // Check if MI is "addiu $dst, $zero, 0" or "daddiu $dst, $zero, 0".
91   if ((MI.getOpcode() == Mips::ADDiu) &&
92       (MI.getOperand(1).getReg() == Mips::ZERO) &&
93       (MI.getOperand(2).getImm() == 0)) {
94     DstReg = MI.getOperand(0).getReg();
95     ZeroReg = Mips::ZERO;
96   } else if ((MI.getOpcode() == Mips::DADDiu) &&
97              (MI.getOperand(1).getReg() == Mips::ZERO_64) &&
98              (MI.getOperand(2).getImm() == 0)) {
99     DstReg = MI.getOperand(0).getReg();
100     ZeroReg = Mips::ZERO_64;
101   }
102
103   if (!DstReg)
104     return false;
105
106   // Replace uses with ZeroReg.
107   for (MachineRegisterInfo::use_iterator U = MRI->use_begin(DstReg),
108        E = MRI->use_end(); U != E;) {
109     MachineOperand &MO = *U;
110     unsigned OpNo = U.getOperandNo();
111     MachineInstr *MI = MO.getParent();
112     ++U;
113
114     // Do not replace if it is a phi's operand or is tied to def operand.
115     if (MI->isPHI() || MI->isRegTiedToDefOperand(OpNo) || MI->isPseudo())
116       continue;
117
118     MO.setReg(ZeroReg);
119   }
120
121   return true;
122 }
123
124 void MipsSEDAGToDAGISel::initGlobalBaseReg(MachineFunction &MF) {
125   MipsFunctionInfo *MipsFI = MF.getInfo<MipsFunctionInfo>();
126
127   if (!MipsFI->globalBaseRegSet())
128     return;
129
130   MachineBasicBlock &MBB = MF.front();
131   MachineBasicBlock::iterator I = MBB.begin();
132   MachineRegisterInfo &RegInfo = MF.getRegInfo();
133   const TargetInstrInfo &TII = *Subtarget->getInstrInfo();
134   DebugLoc DL = I != MBB.end() ? I->getDebugLoc() : DebugLoc();
135   unsigned V0, V1, GlobalBaseReg = MipsFI->getGlobalBaseReg();
136   const TargetRegisterClass *RC;
137   const MipsABIInfo &ABI = static_cast<const MipsTargetMachine &>(TM).getABI();
138   RC = (ABI.IsN64()) ? &Mips::GPR64RegClass : &Mips::GPR32RegClass;
139
140   V0 = RegInfo.createVirtualRegister(RC);
141   V1 = RegInfo.createVirtualRegister(RC);
142
143   if (ABI.IsN64()) {
144     MF.getRegInfo().addLiveIn(Mips::T9_64);
145     MBB.addLiveIn(Mips::T9_64);
146
147     // lui $v0, %hi(%neg(%gp_rel(fname)))
148     // daddu $v1, $v0, $t9
149     // daddiu $globalbasereg, $v1, %lo(%neg(%gp_rel(fname)))
150     const GlobalValue *FName = MF.getFunction();
151     BuildMI(MBB, I, DL, TII.get(Mips::LUi64), V0)
152       .addGlobalAddress(FName, 0, MipsII::MO_GPOFF_HI);
153     BuildMI(MBB, I, DL, TII.get(Mips::DADDu), V1).addReg(V0)
154       .addReg(Mips::T9_64);
155     BuildMI(MBB, I, DL, TII.get(Mips::DADDiu), GlobalBaseReg).addReg(V1)
156       .addGlobalAddress(FName, 0, MipsII::MO_GPOFF_LO);
157     return;
158   }
159
160   if (MF.getTarget().getRelocationModel() == Reloc::Static) {
161     // Set global register to __gnu_local_gp.
162     //
163     // lui   $v0, %hi(__gnu_local_gp)
164     // addiu $globalbasereg, $v0, %lo(__gnu_local_gp)
165     BuildMI(MBB, I, DL, TII.get(Mips::LUi), V0)
166       .addExternalSymbol("__gnu_local_gp", MipsII::MO_ABS_HI);
167     BuildMI(MBB, I, DL, TII.get(Mips::ADDiu), GlobalBaseReg).addReg(V0)
168       .addExternalSymbol("__gnu_local_gp", MipsII::MO_ABS_LO);
169     return;
170   }
171
172   MF.getRegInfo().addLiveIn(Mips::T9);
173   MBB.addLiveIn(Mips::T9);
174
175   if (ABI.IsN32()) {
176     // lui $v0, %hi(%neg(%gp_rel(fname)))
177     // addu $v1, $v0, $t9
178     // addiu $globalbasereg, $v1, %lo(%neg(%gp_rel(fname)))
179     const GlobalValue *FName = MF.getFunction();
180     BuildMI(MBB, I, DL, TII.get(Mips::LUi), V0)
181       .addGlobalAddress(FName, 0, MipsII::MO_GPOFF_HI);
182     BuildMI(MBB, I, DL, TII.get(Mips::ADDu), V1).addReg(V0).addReg(Mips::T9);
183     BuildMI(MBB, I, DL, TII.get(Mips::ADDiu), GlobalBaseReg).addReg(V1)
184       .addGlobalAddress(FName, 0, MipsII::MO_GPOFF_LO);
185     return;
186   }
187
188   assert(ABI.IsO32());
189
190   // For O32 ABI, the following instruction sequence is emitted to initialize
191   // the global base register:
192   //
193   //  0. lui   $2, %hi(_gp_disp)
194   //  1. addiu $2, $2, %lo(_gp_disp)
195   //  2. addu  $globalbasereg, $2, $t9
196   //
197   // We emit only the last instruction here.
198   //
199   // GNU linker requires that the first two instructions appear at the beginning
200   // of a function and no instructions be inserted before or between them.
201   // The two instructions are emitted during lowering to MC layer in order to
202   // avoid any reordering.
203   //
204   // Register $2 (Mips::V0) is added to the list of live-in registers to ensure
205   // the value instruction 1 (addiu) defines is valid when instruction 2 (addu)
206   // reads it.
207   MF.getRegInfo().addLiveIn(Mips::V0);
208   MBB.addLiveIn(Mips::V0);
209   BuildMI(MBB, I, DL, TII.get(Mips::ADDu), GlobalBaseReg)
210     .addReg(Mips::V0).addReg(Mips::T9);
211 }
212
213 void MipsSEDAGToDAGISel::processFunctionAfterISel(MachineFunction &MF) {
214   initGlobalBaseReg(MF);
215
216   MachineRegisterInfo *MRI = &MF.getRegInfo();
217
218   for (MachineFunction::iterator MFI = MF.begin(), MFE = MF.end(); MFI != MFE;
219        ++MFI)
220     for (MachineBasicBlock::iterator I = MFI->begin(); I != MFI->end(); ++I) {
221       if (I->getOpcode() == Mips::RDDSP)
222         addDSPCtrlRegOperands(false, *I, MF);
223       else if (I->getOpcode() == Mips::WRDSP)
224         addDSPCtrlRegOperands(true, *I, MF);
225       else
226         replaceUsesWithZeroReg(MRI, *I);
227     }
228 }
229
230 SDNode *MipsSEDAGToDAGISel::selectAddESubE(unsigned MOp, SDValue InFlag,
231                                            SDValue CmpLHS, SDLoc DL,
232                                            SDNode *Node) const {
233   unsigned Opc = InFlag.getOpcode(); (void)Opc;
234
235   assert(((Opc == ISD::ADDC || Opc == ISD::ADDE) ||
236           (Opc == ISD::SUBC || Opc == ISD::SUBE)) &&
237          "(ADD|SUB)E flag operand must come from (ADD|SUB)C/E insn");
238
239   unsigned SLTuOp = Mips::SLTu, ADDuOp = Mips::ADDu;
240   if (Subtarget->isGP64bit()) {
241     SLTuOp = Mips::SLTu64;
242     ADDuOp = Mips::DADDu;
243   }
244
245   SDValue Ops[] = { CmpLHS, InFlag.getOperand(1) };
246   SDValue LHS = Node->getOperand(0), RHS = Node->getOperand(1);
247   EVT VT = LHS.getValueType();
248
249   SDNode *Carry = CurDAG->getMachineNode(SLTuOp, DL, VT, Ops);
250
251   if (Subtarget->isGP64bit()) {
252     // On 64-bit targets, sltu produces an i64 but our backend currently says
253     // that SLTu64 produces an i32. We need to fix this in the long run but for
254     // now, just make the DAG type-correct by asserting the upper bits are zero.
255     Carry = CurDAG->getMachineNode(Mips::SUBREG_TO_REG, DL, VT,
256                                    CurDAG->getTargetConstant(0, VT),
257                                    SDValue(Carry, 0),
258                                    CurDAG->getTargetConstant(Mips::sub_32, VT));
259   }
260
261   // Generate a second addition only if we know that RHS is not a
262   // constant-zero node.
263   SDNode *AddCarry = Carry;
264   ConstantSDNode *C = dyn_cast<ConstantSDNode>(RHS);
265   if (!C || C->getZExtValue())
266     AddCarry = CurDAG->getMachineNode(ADDuOp, DL, VT, SDValue(Carry, 0), RHS);
267
268   return CurDAG->SelectNodeTo(Node, MOp, VT, MVT::Glue, LHS,
269                               SDValue(AddCarry, 0));
270 }
271
272 /// Match frameindex
273 bool MipsSEDAGToDAGISel::selectAddrFrameIndex(SDValue Addr, SDValue &Base,
274                                               SDValue &Offset) const {
275   if (FrameIndexSDNode *FIN = dyn_cast<FrameIndexSDNode>(Addr)) {
276     EVT ValTy = Addr.getValueType();
277
278     Base   = CurDAG->getTargetFrameIndex(FIN->getIndex(), ValTy);
279     Offset = CurDAG->getTargetConstant(0, ValTy);
280     return true;
281   }
282   return false;
283 }
284
285 /// Match frameindex+offset and frameindex|offset
286 bool MipsSEDAGToDAGISel::selectAddrFrameIndexOffset(SDValue Addr, SDValue &Base,
287                                                     SDValue &Offset,
288                                                     unsigned OffsetBits) const {
289   if (CurDAG->isBaseWithConstantOffset(Addr)) {
290     ConstantSDNode *CN = dyn_cast<ConstantSDNode>(Addr.getOperand(1));
291     if (isIntN(OffsetBits, CN->getSExtValue())) {
292       EVT ValTy = Addr.getValueType();
293
294       // If the first operand is a FI, get the TargetFI Node
295       if (FrameIndexSDNode *FIN = dyn_cast<FrameIndexSDNode>
296                                   (Addr.getOperand(0)))
297         Base = CurDAG->getTargetFrameIndex(FIN->getIndex(), ValTy);
298       else
299         Base = Addr.getOperand(0);
300
301       Offset = CurDAG->getTargetConstant(CN->getZExtValue(), ValTy);
302       return true;
303     }
304   }
305   return false;
306 }
307
308 /// ComplexPattern used on MipsInstrInfo
309 /// Used on Mips Load/Store instructions
310 bool MipsSEDAGToDAGISel::selectAddrRegImm(SDValue Addr, SDValue &Base,
311                                           SDValue &Offset) const {
312   // if Address is FI, get the TargetFrameIndex.
313   if (selectAddrFrameIndex(Addr, Base, Offset))
314     return true;
315
316   // on PIC code Load GA
317   if (Addr.getOpcode() == MipsISD::Wrapper) {
318     Base   = Addr.getOperand(0);
319     Offset = Addr.getOperand(1);
320     return true;
321   }
322
323   if (TM.getRelocationModel() != Reloc::PIC_) {
324     if ((Addr.getOpcode() == ISD::TargetExternalSymbol ||
325         Addr.getOpcode() == ISD::TargetGlobalAddress))
326       return false;
327   }
328
329   // Addresses of the form FI+const or FI|const
330   if (selectAddrFrameIndexOffset(Addr, Base, Offset, 16))
331     return true;
332
333   // Operand is a result from an ADD.
334   if (Addr.getOpcode() == ISD::ADD) {
335     // When loading from constant pools, load the lower address part in
336     // the instruction itself. Example, instead of:
337     //  lui $2, %hi($CPI1_0)
338     //  addiu $2, $2, %lo($CPI1_0)
339     //  lwc1 $f0, 0($2)
340     // Generate:
341     //  lui $2, %hi($CPI1_0)
342     //  lwc1 $f0, %lo($CPI1_0)($2)
343     if (Addr.getOperand(1).getOpcode() == MipsISD::Lo ||
344         Addr.getOperand(1).getOpcode() == MipsISD::GPRel) {
345       SDValue Opnd0 = Addr.getOperand(1).getOperand(0);
346       if (isa<ConstantPoolSDNode>(Opnd0) || isa<GlobalAddressSDNode>(Opnd0) ||
347           isa<JumpTableSDNode>(Opnd0)) {
348         Base = Addr.getOperand(0);
349         Offset = Opnd0;
350         return true;
351       }
352     }
353   }
354
355   return false;
356 }
357
358 /// ComplexPattern used on MipsInstrInfo
359 /// Used on Mips Load/Store instructions
360 bool MipsSEDAGToDAGISel::selectAddrRegReg(SDValue Addr, SDValue &Base,
361                                           SDValue &Offset) const {
362   // Operand is a result from an ADD.
363   if (Addr.getOpcode() == ISD::ADD) {
364     Base = Addr.getOperand(0);
365     Offset = Addr.getOperand(1);
366     return true;
367   }
368
369   return false;
370 }
371
372 bool MipsSEDAGToDAGISel::selectAddrDefault(SDValue Addr, SDValue &Base,
373                                            SDValue &Offset) const {
374   Base = Addr;
375   Offset = CurDAG->getTargetConstant(0, Addr.getValueType());
376   return true;
377 }
378
379 bool MipsSEDAGToDAGISel::selectIntAddr(SDValue Addr, SDValue &Base,
380                                        SDValue &Offset) const {
381   return selectAddrRegImm(Addr, Base, Offset) ||
382     selectAddrDefault(Addr, Base, Offset);
383 }
384
385 bool MipsSEDAGToDAGISel::selectAddrRegImm10(SDValue Addr, SDValue &Base,
386                                             SDValue &Offset) const {
387   if (selectAddrFrameIndex(Addr, Base, Offset))
388     return true;
389
390   if (selectAddrFrameIndexOffset(Addr, Base, Offset, 10))
391     return true;
392
393   return false;
394 }
395
396 /// Used on microMIPS Load/Store unaligned instructions (12-bit offset)
397 bool MipsSEDAGToDAGISel::selectAddrRegImm12(SDValue Addr, SDValue &Base,
398                                             SDValue &Offset) const {
399   if (selectAddrFrameIndex(Addr, Base, Offset))
400     return true;
401
402   if (selectAddrFrameIndexOffset(Addr, Base, Offset, 12))
403     return true;
404
405   return false;
406 }
407
408 bool MipsSEDAGToDAGISel::selectIntAddrMM(SDValue Addr, SDValue &Base,
409                                          SDValue &Offset) const {
410   return selectAddrRegImm12(Addr, Base, Offset) ||
411     selectAddrDefault(Addr, Base, Offset);
412 }
413
414 bool MipsSEDAGToDAGISel::selectIntAddrLSL2MM(SDValue Addr, SDValue &Base,
415                                              SDValue &Offset) const {
416   if (selectAddrFrameIndexOffset(Addr, Base, Offset, 7)) {
417     if (isa<FrameIndexSDNode>(Base))
418       return false;
419
420     if (ConstantSDNode *CN = dyn_cast<ConstantSDNode>(Offset)) {
421       unsigned CnstOff = CN->getZExtValue();
422       return (CnstOff == (CnstOff & 0x3c));
423     }
424
425     return false;
426   }
427
428   // For all other cases where "lw" would be selected, don't select "lw16"
429   // because it would result in additional instructions to prepare operands.
430   if (selectAddrRegImm(Addr, Base, Offset))
431     return false;
432
433   return selectAddrDefault(Addr, Base, Offset);
434 }
435
436 bool MipsSEDAGToDAGISel::selectIntAddrMSA(SDValue Addr, SDValue &Base,
437                                           SDValue &Offset) const {
438   if (selectAddrRegImm10(Addr, Base, Offset))
439     return true;
440
441   if (selectAddrDefault(Addr, Base, Offset))
442     return true;
443
444   return false;
445 }
446
447 // Select constant vector splats.
448 //
449 // Returns true and sets Imm if:
450 // * MSA is enabled
451 // * N is a ISD::BUILD_VECTOR representing a constant splat
452 bool MipsSEDAGToDAGISel::selectVSplat(SDNode *N, APInt &Imm) const {
453   if (!Subtarget->hasMSA())
454     return false;
455
456   BuildVectorSDNode *Node = dyn_cast<BuildVectorSDNode>(N);
457
458   if (!Node)
459     return false;
460
461   APInt SplatValue, SplatUndef;
462   unsigned SplatBitSize;
463   bool HasAnyUndefs;
464
465   if (!Node->isConstantSplat(SplatValue, SplatUndef, SplatBitSize,
466                              HasAnyUndefs, 8,
467                              !Subtarget->isLittle()))
468     return false;
469
470   Imm = SplatValue;
471
472   return true;
473 }
474
475 // Select constant vector splats.
476 //
477 // In addition to the requirements of selectVSplat(), this function returns
478 // true and sets Imm if:
479 // * The splat value is the same width as the elements of the vector
480 // * The splat value fits in an integer with the specified signed-ness and
481 //   width.
482 //
483 // This function looks through ISD::BITCAST nodes.
484 // TODO: This might not be appropriate for big-endian MSA since BITCAST is
485 //       sometimes a shuffle in big-endian mode.
486 //
487 // It's worth noting that this function is not used as part of the selection
488 // of ldi.[bhwd] since it does not permit using the wrong-typed ldi.[bhwd]
489 // instruction to achieve the desired bit pattern. ldi.[bhwd] is selected in
490 // MipsSEDAGToDAGISel::selectNode.
491 bool MipsSEDAGToDAGISel::
492 selectVSplatCommon(SDValue N, SDValue &Imm, bool Signed,
493                    unsigned ImmBitSize) const {
494   APInt ImmValue;
495   EVT EltTy = N->getValueType(0).getVectorElementType();
496
497   if (N->getOpcode() == ISD::BITCAST)
498     N = N->getOperand(0);
499
500   if (selectVSplat (N.getNode(), ImmValue) &&
501       ImmValue.getBitWidth() == EltTy.getSizeInBits()) {
502     if (( Signed && ImmValue.isSignedIntN(ImmBitSize)) ||
503         (!Signed && ImmValue.isIntN(ImmBitSize))) {
504       Imm = CurDAG->getTargetConstant(ImmValue, EltTy);
505       return true;
506     }
507   }
508
509   return false;
510 }
511
512 // Select constant vector splats.
513 bool MipsSEDAGToDAGISel::
514 selectVSplatUimm1(SDValue N, SDValue &Imm) const {
515   return selectVSplatCommon(N, Imm, false, 1);
516 }
517
518 bool MipsSEDAGToDAGISel::
519 selectVSplatUimm2(SDValue N, SDValue &Imm) const {
520   return selectVSplatCommon(N, Imm, false, 2);
521 }
522
523 bool MipsSEDAGToDAGISel::
524 selectVSplatUimm3(SDValue N, SDValue &Imm) const {
525   return selectVSplatCommon(N, Imm, false, 3);
526 }
527
528 // Select constant vector splats.
529 bool MipsSEDAGToDAGISel::
530 selectVSplatUimm4(SDValue N, SDValue &Imm) const {
531   return selectVSplatCommon(N, Imm, false, 4);
532 }
533
534 // Select constant vector splats.
535 bool MipsSEDAGToDAGISel::
536 selectVSplatUimm5(SDValue N, SDValue &Imm) const {
537   return selectVSplatCommon(N, Imm, false, 5);
538 }
539
540 // Select constant vector splats.
541 bool MipsSEDAGToDAGISel::
542 selectVSplatUimm6(SDValue N, SDValue &Imm) const {
543   return selectVSplatCommon(N, Imm, false, 6);
544 }
545
546 // Select constant vector splats.
547 bool MipsSEDAGToDAGISel::
548 selectVSplatUimm8(SDValue N, SDValue &Imm) const {
549   return selectVSplatCommon(N, Imm, false, 8);
550 }
551
552 // Select constant vector splats.
553 bool MipsSEDAGToDAGISel::
554 selectVSplatSimm5(SDValue N, SDValue &Imm) const {
555   return selectVSplatCommon(N, Imm, true, 5);
556 }
557
558 // Select constant vector splats whose value is a power of 2.
559 //
560 // In addition to the requirements of selectVSplat(), this function returns
561 // true and sets Imm if:
562 // * The splat value is the same width as the elements of the vector
563 // * The splat value is a power of two.
564 //
565 // This function looks through ISD::BITCAST nodes.
566 // TODO: This might not be appropriate for big-endian MSA since BITCAST is
567 //       sometimes a shuffle in big-endian mode.
568 bool MipsSEDAGToDAGISel::selectVSplatUimmPow2(SDValue N, SDValue &Imm) const {
569   APInt ImmValue;
570   EVT EltTy = N->getValueType(0).getVectorElementType();
571
572   if (N->getOpcode() == ISD::BITCAST)
573     N = N->getOperand(0);
574
575   if (selectVSplat (N.getNode(), ImmValue) &&
576       ImmValue.getBitWidth() == EltTy.getSizeInBits()) {
577     int32_t Log2 = ImmValue.exactLogBase2();
578
579     if (Log2 != -1) {
580       Imm = CurDAG->getTargetConstant(Log2, EltTy);
581       return true;
582     }
583   }
584
585   return false;
586 }
587
588 // Select constant vector splats whose value only has a consecutive sequence
589 // of left-most bits set (e.g. 0b11...1100...00).
590 //
591 // In addition to the requirements of selectVSplat(), this function returns
592 // true and sets Imm if:
593 // * The splat value is the same width as the elements of the vector
594 // * The splat value is a consecutive sequence of left-most bits.
595 //
596 // This function looks through ISD::BITCAST nodes.
597 // TODO: This might not be appropriate for big-endian MSA since BITCAST is
598 //       sometimes a shuffle in big-endian mode.
599 bool MipsSEDAGToDAGISel::selectVSplatMaskL(SDValue N, SDValue &Imm) const {
600   APInt ImmValue;
601   EVT EltTy = N->getValueType(0).getVectorElementType();
602
603   if (N->getOpcode() == ISD::BITCAST)
604     N = N->getOperand(0);
605
606   if (selectVSplat(N.getNode(), ImmValue) &&
607       ImmValue.getBitWidth() == EltTy.getSizeInBits()) {
608     // Extract the run of set bits starting with bit zero from the bitwise
609     // inverse of ImmValue, and test that the inverse of this is the same
610     // as the original value.
611     if (ImmValue == ~(~ImmValue & ~(~ImmValue + 1))) {
612
613       Imm = CurDAG->getTargetConstant(ImmValue.countPopulation(), EltTy);
614       return true;
615     }
616   }
617
618   return false;
619 }
620
621 // Select constant vector splats whose value only has a consecutive sequence
622 // of right-most bits set (e.g. 0b00...0011...11).
623 //
624 // In addition to the requirements of selectVSplat(), this function returns
625 // true and sets Imm if:
626 // * The splat value is the same width as the elements of the vector
627 // * The splat value is a consecutive sequence of right-most bits.
628 //
629 // This function looks through ISD::BITCAST nodes.
630 // TODO: This might not be appropriate for big-endian MSA since BITCAST is
631 //       sometimes a shuffle in big-endian mode.
632 bool MipsSEDAGToDAGISel::selectVSplatMaskR(SDValue N, SDValue &Imm) const {
633   APInt ImmValue;
634   EVT EltTy = N->getValueType(0).getVectorElementType();
635
636   if (N->getOpcode() == ISD::BITCAST)
637     N = N->getOperand(0);
638
639   if (selectVSplat(N.getNode(), ImmValue) &&
640       ImmValue.getBitWidth() == EltTy.getSizeInBits()) {
641     // Extract the run of set bits starting with bit zero, and test that the
642     // result is the same as the original value
643     if (ImmValue == (ImmValue & ~(ImmValue + 1))) {
644       Imm = CurDAG->getTargetConstant(ImmValue.countPopulation(), EltTy);
645       return true;
646     }
647   }
648
649   return false;
650 }
651
652 bool MipsSEDAGToDAGISel::selectVSplatUimmInvPow2(SDValue N,
653                                                  SDValue &Imm) const {
654   APInt ImmValue;
655   EVT EltTy = N->getValueType(0).getVectorElementType();
656
657   if (N->getOpcode() == ISD::BITCAST)
658     N = N->getOperand(0);
659
660   if (selectVSplat(N.getNode(), ImmValue) &&
661       ImmValue.getBitWidth() == EltTy.getSizeInBits()) {
662     int32_t Log2 = (~ImmValue).exactLogBase2();
663
664     if (Log2 != -1) {
665       Imm = CurDAG->getTargetConstant(Log2, EltTy);
666       return true;
667     }
668   }
669
670   return false;
671 }
672
673 std::pair<bool, SDNode*> MipsSEDAGToDAGISel::selectNode(SDNode *Node) {
674   unsigned Opcode = Node->getOpcode();
675   SDLoc DL(Node);
676
677   ///
678   // Instruction Selection not handled by the auto-generated
679   // tablegen selection should be handled here.
680   ///
681   SDNode *Result;
682
683   switch(Opcode) {
684   default: break;
685
686   case ISD::SUBE: {
687     SDValue InFlag = Node->getOperand(2);
688     unsigned Opc = Subtarget->isGP64bit() ? Mips::DSUBu : Mips::SUBu;
689     Result = selectAddESubE(Opc, InFlag, InFlag.getOperand(0), DL, Node);
690     return std::make_pair(true, Result);
691   }
692
693   case ISD::ADDE: {
694     if (Subtarget->hasDSP()) // Select DSP instructions, ADDSC and ADDWC.
695       break;
696     SDValue InFlag = Node->getOperand(2);
697     unsigned Opc = Subtarget->isGP64bit() ? Mips::DADDu : Mips::ADDu;
698     Result = selectAddESubE(Opc, InFlag, InFlag.getValue(0), DL, Node);
699     return std::make_pair(true, Result);
700   }
701
702   case ISD::ConstantFP: {
703     ConstantFPSDNode *CN = dyn_cast<ConstantFPSDNode>(Node);
704     if (Node->getValueType(0) == MVT::f64 && CN->isExactlyValue(+0.0)) {
705       if (Subtarget->isGP64bit()) {
706         SDValue Zero = CurDAG->getCopyFromReg(CurDAG->getEntryNode(), DL,
707                                               Mips::ZERO_64, MVT::i64);
708         Result = CurDAG->getMachineNode(Mips::DMTC1, DL, MVT::f64, Zero);
709       } else if (Subtarget->isFP64bit()) {
710         SDValue Zero = CurDAG->getCopyFromReg(CurDAG->getEntryNode(), DL,
711                                               Mips::ZERO, MVT::i32);
712         Result = CurDAG->getMachineNode(Mips::BuildPairF64_64, DL, MVT::f64,
713                                         Zero, Zero);
714       } else {
715         SDValue Zero = CurDAG->getCopyFromReg(CurDAG->getEntryNode(), DL,
716                                               Mips::ZERO, MVT::i32);
717         Result = CurDAG->getMachineNode(Mips::BuildPairF64, DL, MVT::f64, Zero,
718                                         Zero);
719       }
720
721       return std::make_pair(true, Result);
722     }
723     break;
724   }
725
726   case ISD::Constant: {
727     const ConstantSDNode *CN = dyn_cast<ConstantSDNode>(Node);
728     unsigned Size = CN->getValueSizeInBits(0);
729
730     if (Size == 32)
731       break;
732
733     MipsAnalyzeImmediate AnalyzeImm;
734     int64_t Imm = CN->getSExtValue();
735
736     const MipsAnalyzeImmediate::InstSeq &Seq =
737       AnalyzeImm.Analyze(Imm, Size, false);
738
739     MipsAnalyzeImmediate::InstSeq::const_iterator Inst = Seq.begin();
740     SDLoc DL(CN);
741     SDNode *RegOpnd;
742     SDValue ImmOpnd = CurDAG->getTargetConstant(SignExtend64<16>(Inst->ImmOpnd),
743                                                 MVT::i64);
744
745     // The first instruction can be a LUi which is different from other
746     // instructions (ADDiu, ORI and SLL) in that it does not have a register
747     // operand.
748     if (Inst->Opc == Mips::LUi64)
749       RegOpnd = CurDAG->getMachineNode(Inst->Opc, DL, MVT::i64, ImmOpnd);
750     else
751       RegOpnd =
752         CurDAG->getMachineNode(Inst->Opc, DL, MVT::i64,
753                                CurDAG->getRegister(Mips::ZERO_64, MVT::i64),
754                                ImmOpnd);
755
756     // The remaining instructions in the sequence are handled here.
757     for (++Inst; Inst != Seq.end(); ++Inst) {
758       ImmOpnd = CurDAG->getTargetConstant(SignExtend64<16>(Inst->ImmOpnd),
759                                           MVT::i64);
760       RegOpnd = CurDAG->getMachineNode(Inst->Opc, DL, MVT::i64,
761                                        SDValue(RegOpnd, 0), ImmOpnd);
762     }
763
764     return std::make_pair(true, RegOpnd);
765   }
766
767   case ISD::INTRINSIC_W_CHAIN: {
768     switch (cast<ConstantSDNode>(Node->getOperand(1))->getZExtValue()) {
769     default:
770       break;
771
772     case Intrinsic::mips_cfcmsa: {
773       SDValue ChainIn = Node->getOperand(0);
774       SDValue RegIdx = Node->getOperand(2);
775       SDValue Reg = CurDAG->getCopyFromReg(ChainIn, DL,
776                                            getMSACtrlReg(RegIdx), MVT::i32);
777       return std::make_pair(true, Reg.getNode());
778     }
779     }
780     break;
781   }
782
783   case ISD::INTRINSIC_WO_CHAIN: {
784     switch (cast<ConstantSDNode>(Node->getOperand(0))->getZExtValue()) {
785     default:
786       break;
787
788     case Intrinsic::mips_move_v:
789       // Like an assignment but will always produce a move.v even if
790       // unnecessary.
791       return std::make_pair(true,
792                             CurDAG->getMachineNode(Mips::MOVE_V, DL,
793                                                    Node->getValueType(0),
794                                                    Node->getOperand(1)));
795     }
796     break;
797   }
798
799   case ISD::INTRINSIC_VOID: {
800     switch (cast<ConstantSDNode>(Node->getOperand(1))->getZExtValue()) {
801     default:
802       break;
803
804     case Intrinsic::mips_ctcmsa: {
805       SDValue ChainIn = Node->getOperand(0);
806       SDValue RegIdx  = Node->getOperand(2);
807       SDValue Value   = Node->getOperand(3);
808       SDValue ChainOut = CurDAG->getCopyToReg(ChainIn, DL,
809                                               getMSACtrlReg(RegIdx), Value);
810       return std::make_pair(true, ChainOut.getNode());
811     }
812     }
813     break;
814   }
815
816   case MipsISD::ThreadPointer: {
817     EVT PtrVT = getTargetLowering()->getPointerTy();
818     unsigned RdhwrOpc, DestReg;
819
820     if (PtrVT == MVT::i32) {
821       RdhwrOpc = Mips::RDHWR;
822       DestReg = Mips::V1;
823     } else {
824       RdhwrOpc = Mips::RDHWR64;
825       DestReg = Mips::V1_64;
826     }
827
828     SDNode *Rdhwr =
829       CurDAG->getMachineNode(RdhwrOpc, SDLoc(Node),
830                              Node->getValueType(0),
831                              CurDAG->getRegister(Mips::HWR29, MVT::i32));
832     SDValue Chain = CurDAG->getCopyToReg(CurDAG->getEntryNode(), DL, DestReg,
833                                          SDValue(Rdhwr, 0));
834     SDValue ResNode = CurDAG->getCopyFromReg(Chain, DL, DestReg, PtrVT);
835     ReplaceUses(SDValue(Node, 0), ResNode);
836     return std::make_pair(true, ResNode.getNode());
837   }
838
839   case ISD::BUILD_VECTOR: {
840     // Select appropriate ldi.[bhwd] instructions for constant splats of
841     // 128-bit when MSA is enabled. Fixup any register class mismatches that
842     // occur as a result.
843     //
844     // This allows the compiler to use a wider range of immediates than would
845     // otherwise be allowed. If, for example, v4i32 could only use ldi.h then
846     // it would not be possible to load { 0x01010101, 0x01010101, 0x01010101,
847     // 0x01010101 } without using a constant pool. This would be sub-optimal
848     // when // 'ldi.b wd, 1' is capable of producing that bit-pattern in the
849     // same set/ of registers. Similarly, ldi.h isn't capable of producing {
850     // 0x00000000, 0x00000001, 0x00000000, 0x00000001 } but 'ldi.d wd, 1' can.
851
852     BuildVectorSDNode *BVN = cast<BuildVectorSDNode>(Node);
853     APInt SplatValue, SplatUndef;
854     unsigned SplatBitSize;
855     bool HasAnyUndefs;
856     unsigned LdiOp;
857     EVT ResVecTy = BVN->getValueType(0);
858     EVT ViaVecTy;
859
860     if (!Subtarget->hasMSA() || !BVN->getValueType(0).is128BitVector())
861       return std::make_pair(false, nullptr);
862
863     if (!BVN->isConstantSplat(SplatValue, SplatUndef, SplatBitSize,
864                               HasAnyUndefs, 8,
865                               !Subtarget->isLittle()))
866       return std::make_pair(false, nullptr);
867
868     switch (SplatBitSize) {
869     default:
870       return std::make_pair(false, nullptr);
871     case 8:
872       LdiOp = Mips::LDI_B;
873       ViaVecTy = MVT::v16i8;
874       break;
875     case 16:
876       LdiOp = Mips::LDI_H;
877       ViaVecTy = MVT::v8i16;
878       break;
879     case 32:
880       LdiOp = Mips::LDI_W;
881       ViaVecTy = MVT::v4i32;
882       break;
883     case 64:
884       LdiOp = Mips::LDI_D;
885       ViaVecTy = MVT::v2i64;
886       break;
887     }
888
889     if (!SplatValue.isSignedIntN(10))
890       return std::make_pair(false, nullptr);
891
892     SDValue Imm = CurDAG->getTargetConstant(SplatValue,
893                                             ViaVecTy.getVectorElementType());
894
895     SDNode *Res = CurDAG->getMachineNode(LdiOp, SDLoc(Node), ViaVecTy, Imm);
896
897     if (ResVecTy != ViaVecTy) {
898       // If LdiOp is writing to a different register class to ResVecTy, then
899       // fix it up here. This COPY_TO_REGCLASS should never cause a move.v
900       // since the source and destination register sets contain the same
901       // registers.
902       const TargetLowering *TLI = getTargetLowering();
903       MVT ResVecTySimple = ResVecTy.getSimpleVT();
904       const TargetRegisterClass *RC = TLI->getRegClassFor(ResVecTySimple);
905       Res = CurDAG->getMachineNode(Mips::COPY_TO_REGCLASS, SDLoc(Node),
906                                    ResVecTy, SDValue(Res, 0),
907                                    CurDAG->getTargetConstant(RC->getID(),
908                                                              MVT::i32));
909     }
910
911     return std::make_pair(true, Res);
912   }
913
914   }
915
916   return std::make_pair(false, nullptr);
917 }
918
919 FunctionPass *llvm::createMipsSEISelDag(MipsTargetMachine &TM) {
920   return new MipsSEDAGToDAGISel(TM);
921 }