ARM64: print correct aliases for NEON mov & mvn instructions
[oota-llvm.git] / lib / Target / ARM64 / ARM64InstrFormats.td
1 //===- ARM64InstrFormats.td - ARM64 Instruction Formats ------*- tblgen -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9
10 //===----------------------------------------------------------------------===//
11 //  Describe ARM64 instructions format here
12 //
13
14 // Format specifies the encoding used by the instruction.  This is part of the
15 // ad-hoc solution used to emit machine instruction encodings by our machine
16 // code emitter.
17 class Format<bits<2> val> {
18   bits<2> Value = val;
19 }
20
21 def PseudoFrm   : Format<0>;
22 def NormalFrm   : Format<1>; // Do we need any others?
23
24 // ARM64 Instruction Format
25 class ARM64Inst<Format f, string cstr> : Instruction {
26   field bits<32> Inst; // Instruction encoding.
27   // Mask of bits that cause an encoding to be UNPREDICTABLE.
28   // If a bit is set, then if the corresponding bit in the
29   // target encoding differs from its value in the "Inst" field,
30   // the instruction is UNPREDICTABLE (SoftFail in abstract parlance).
31   field bits<32> Unpredictable = 0;
32   // SoftFail is the generic name for this field, but we alias it so
33   // as to make it more obvious what it means in ARM-land.
34   field bits<32> SoftFail = Unpredictable;
35   let Namespace   = "ARM64";
36   Format F        = f;
37   bits<2> Form    = F.Value;
38   let Pattern     = [];
39   let Constraints = cstr;
40 }
41
42 // Pseudo instructions (don't have encoding information)
43 class Pseudo<dag oops, dag iops, list<dag> pattern, string cstr = "">
44     : ARM64Inst<PseudoFrm, cstr> {
45   dag OutOperandList = oops;
46   dag InOperandList  = iops;
47   let Pattern        = pattern;
48   let isCodeGenOnly  = 1;
49 }
50
51 // Real instructions (have encoding information)
52 class EncodedI<string cstr, list<dag> pattern> : ARM64Inst<NormalFrm, cstr> {
53   let Pattern = pattern;
54   let Size = 4;
55 }
56
57 // Normal instructions
58 class I<dag oops, dag iops, string asm, string operands, string cstr,
59         list<dag> pattern>
60     : EncodedI<cstr, pattern> {
61   dag OutOperandList = oops;
62   dag InOperandList  = iops;
63   let AsmString      = !strconcat(asm, operands);
64 }
65
66 class TriOpFrag<dag res> : PatFrag<(ops node:$LHS, node:$MHS, node:$RHS), res>;
67 class BinOpFrag<dag res> : PatFrag<(ops node:$LHS, node:$RHS), res>;
68 class UnOpFrag<dag res>  : PatFrag<(ops node:$LHS), res>;
69
70 // Helper fragment for an extract of the high portion of a 128-bit vector.
71 def extract_high_v16i8 :
72    UnOpFrag<(extract_subvector (v16i8 node:$LHS), (i64 8))>;
73 def extract_high_v8i16 :
74    UnOpFrag<(extract_subvector (v8i16 node:$LHS), (i64 4))>;
75 def extract_high_v4i32 :
76    UnOpFrag<(extract_subvector (v4i32 node:$LHS), (i64 2))>;
77 def extract_high_v2i64 :
78    UnOpFrag<(extract_subvector (v2i64 node:$LHS), (i64 1))>;
79
80 //===----------------------------------------------------------------------===//
81 // Asm Operand Classes.
82 //
83
84 // Shifter operand for arithmetic shifted encodings.
85 def ShifterOperand : AsmOperandClass {
86   let Name = "Shifter";
87 }
88
89 // Shifter operand for mov immediate encodings.
90 def MovImm32ShifterOperand : AsmOperandClass {
91   let SuperClasses = [ShifterOperand];
92   let Name = "MovImm32Shifter";
93   let RenderMethod = "addShifterOperands";
94   let DiagnosticType = "InvalidMovImm32Shift";
95 }
96 def MovImm64ShifterOperand : AsmOperandClass {
97   let SuperClasses = [ShifterOperand];
98   let Name = "MovImm64Shifter";
99   let RenderMethod = "addShifterOperands";
100   let DiagnosticType = "InvalidMovImm64Shift";
101 }
102
103 // Shifter operand for arithmetic register shifted encodings.
104 class ArithmeticShifterOperand<int width> : AsmOperandClass {
105   let SuperClasses = [ShifterOperand];
106   let Name = "ArithmeticShifter" # width;
107   let PredicateMethod = "isArithmeticShifter<" # width # ">";
108   let RenderMethod = "addShifterOperands";
109   let DiagnosticType = "AddSubRegShift" # width;
110 }
111
112 def ArithmeticShifterOperand32 : ArithmeticShifterOperand<32>;
113 def ArithmeticShifterOperand64 : ArithmeticShifterOperand<64>;
114
115 // Shifter operand for logical register shifted encodings.
116 class LogicalShifterOperand<int width> : AsmOperandClass {
117   let SuperClasses = [ShifterOperand];
118   let Name = "LogicalShifter" # width;
119   let PredicateMethod = "isLogicalShifter<" # width # ">";
120   let RenderMethod = "addShifterOperands";
121   let DiagnosticType = "AddSubRegShift" # width;
122 }
123
124 def LogicalShifterOperand32 : LogicalShifterOperand<32>;
125 def LogicalShifterOperand64 : LogicalShifterOperand<64>;
126
127 // Shifter operand for logical vector 128/64-bit shifted encodings.
128 def LogicalVecShifterOperand : AsmOperandClass {
129   let SuperClasses = [ShifterOperand];
130   let Name = "LogicalVecShifter";
131   let RenderMethod = "addShifterOperands";
132 }
133 def LogicalVecHalfWordShifterOperand : AsmOperandClass {
134   let SuperClasses = [LogicalVecShifterOperand];
135   let Name = "LogicalVecHalfWordShifter";
136   let RenderMethod = "addShifterOperands";
137 }
138
139 // The "MSL" shifter on the vector MOVI instruction.
140 def MoveVecShifterOperand : AsmOperandClass {
141   let SuperClasses = [ShifterOperand];
142   let Name = "MoveVecShifter";
143   let RenderMethod = "addShifterOperands";
144 }
145
146 // Extend operand for arithmetic encodings.
147 def ExtendOperand : AsmOperandClass {
148   let Name = "Extend";
149   let DiagnosticType = "AddSubRegExtendLarge";
150 }
151 def ExtendOperand64 : AsmOperandClass {
152   let SuperClasses = [ExtendOperand];
153   let Name = "Extend64";
154   let DiagnosticType = "AddSubRegExtendSmall";
155 }
156 // 'extend' that's a lsl of a 64-bit register.
157 def ExtendOperandLSL64 : AsmOperandClass {
158   let SuperClasses = [ExtendOperand];
159   let Name = "ExtendLSL64";
160   let RenderMethod = "addExtend64Operands";
161   let DiagnosticType = "AddSubRegExtendLarge";
162 }
163
164 // 8-bit floating-point immediate encodings.
165 def FPImmOperand : AsmOperandClass {
166   let Name = "FPImm";
167   let ParserMethod = "tryParseFPImm";
168   let DiagnosticType = "InvalidFPImm";
169 }
170
171 def CondCode : AsmOperandClass {
172   let Name = "CondCode";
173   let DiagnosticType = "InvalidCondCode";
174 }
175
176 // 8-bit immediate for AdvSIMD where 64-bit values of the form:
177 // aaaaaaaa bbbbbbbb cccccccc dddddddd eeeeeeee ffffffff gggggggg hhhhhhhh
178 // are encoded as the eight bit value 'abcdefgh'.
179 def SIMDImmType10Operand : AsmOperandClass { let Name = "SIMDImmType10"; }
180
181
182 //===----------------------------------------------------------------------===//
183 // Operand Definitions.
184 //
185
186 // ADR[P] instruction labels.
187 def AdrpOperand : AsmOperandClass {
188   let Name = "AdrpLabel";
189   let ParserMethod = "tryParseAdrpLabel";
190   let DiagnosticType = "InvalidLabel";
191 }
192 def adrplabel : Operand<i64> {
193   let EncoderMethod = "getAdrLabelOpValue";
194   let PrintMethod = "printAdrpLabel";
195   let ParserMatchClass = AdrpOperand;
196 }
197
198 def AdrOperand : AsmOperandClass {
199   let Name = "AdrLabel";
200   let ParserMethod = "tryParseAdrLabel";
201   let DiagnosticType = "InvalidLabel";
202 }
203 def adrlabel : Operand<i64> {
204   let EncoderMethod = "getAdrLabelOpValue";
205   let ParserMatchClass = AdrOperand;
206 }
207
208 // simm9 predicate - True if the immediate is in the range [-256, 255].
209 def SImm9Operand : AsmOperandClass {
210   let Name = "SImm9";
211   let DiagnosticType = "InvalidMemoryIndexedSImm9";
212 }
213 def simm9 : Operand<i64>, ImmLeaf<i64, [{ return Imm >= -256 && Imm < 256; }]> {
214   let ParserMatchClass = SImm9Operand;
215 }
216
217 // simm7s4 predicate - True if the immediate is a multiple of 4 in the range
218 // [-256, 252].
219 def SImm7s4Operand : AsmOperandClass {
220   let Name = "SImm7s4";
221   let DiagnosticType = "InvalidMemoryIndexed32SImm7";
222 }
223 def simm7s4 : Operand<i32> {
224   let ParserMatchClass = SImm7s4Operand;
225   let PrintMethod = "printImmScale<4>";
226 }
227
228 // simm7s8 predicate - True if the immediate is a multiple of 8 in the range
229 // [-512, 504].
230 def SImm7s8Operand : AsmOperandClass {
231   let Name = "SImm7s8";
232   let DiagnosticType = "InvalidMemoryIndexed64SImm7";
233 }
234 def simm7s8 : Operand<i32> {
235   let ParserMatchClass = SImm7s8Operand;
236   let PrintMethod = "printImmScale<8>";
237 }
238
239 // simm7s16 predicate - True if the immediate is a multiple of 16 in the range
240 // [-1024, 1008].
241 def SImm7s16Operand : AsmOperandClass {
242   let Name = "SImm7s16";
243   let DiagnosticType = "InvalidMemoryIndexed64SImm7";
244 }
245 def simm7s16 : Operand<i32> {
246   let ParserMatchClass = SImm7s16Operand;
247   let PrintMethod = "printImmScale<16>";
248 }
249
250 class AsmImmRange<int Low, int High> : AsmOperandClass {
251   let Name = "Imm" # Low # "_" # High;
252   let DiagnosticType = "InvalidImm" # Low # "_" # High;
253 }
254
255 def Imm1_8Operand : AsmImmRange<1, 8>;
256 def Imm1_16Operand : AsmImmRange<1, 16>;
257 def Imm1_32Operand : AsmImmRange<1, 32>;
258 def Imm1_64Operand : AsmImmRange<1, 64>;
259
260 def MovZSymbolG3AsmOperand : AsmOperandClass {
261   let Name = "MovZSymbolG3";
262   let RenderMethod = "addImmOperands";
263 }
264
265 def movz_symbol_g3 : Operand<i32> {
266   let ParserMatchClass = MovZSymbolG3AsmOperand;
267 }
268
269 def MovZSymbolG2AsmOperand : AsmOperandClass {
270   let Name = "MovZSymbolG2";
271   let RenderMethod = "addImmOperands";
272 }
273
274 def movz_symbol_g2 : Operand<i32> {
275   let ParserMatchClass = MovZSymbolG2AsmOperand;
276 }
277
278 def MovZSymbolG1AsmOperand : AsmOperandClass {
279   let Name = "MovZSymbolG1";
280   let RenderMethod = "addImmOperands";
281 }
282
283 def movz_symbol_g1 : Operand<i32> {
284   let ParserMatchClass = MovZSymbolG1AsmOperand;
285 }
286
287 def MovZSymbolG0AsmOperand : AsmOperandClass {
288   let Name = "MovZSymbolG0";
289   let RenderMethod = "addImmOperands";
290 }
291
292 def movz_symbol_g0 : Operand<i32> {
293   let ParserMatchClass = MovZSymbolG0AsmOperand;
294 }
295
296 def MovKSymbolG3AsmOperand : AsmOperandClass {
297   let Name = "MovKSymbolG3";
298   let RenderMethod = "addImmOperands";
299 }
300
301 def movk_symbol_g3 : Operand<i32> {
302   let ParserMatchClass = MovKSymbolG3AsmOperand;
303 }
304
305 def MovKSymbolG2AsmOperand : AsmOperandClass {
306   let Name = "MovKSymbolG2";
307   let RenderMethod = "addImmOperands";
308 }
309
310 def movk_symbol_g2 : Operand<i32> {
311   let ParserMatchClass = MovKSymbolG2AsmOperand;
312 }
313
314 def MovKSymbolG1AsmOperand : AsmOperandClass {
315   let Name = "MovKSymbolG1";
316   let RenderMethod = "addImmOperands";
317 }
318
319 def movk_symbol_g1 : Operand<i32> {
320   let ParserMatchClass = MovKSymbolG1AsmOperand;
321 }
322
323 def MovKSymbolG0AsmOperand : AsmOperandClass {
324   let Name = "MovKSymbolG0";
325   let RenderMethod = "addImmOperands";
326 }
327
328 def movk_symbol_g0 : Operand<i32> {
329   let ParserMatchClass = MovKSymbolG0AsmOperand;
330 }
331
332 class fixedpoint_i32<ValueType FloatVT>
333   : Operand<FloatVT>,
334     ComplexPattern<FloatVT, 1, "SelectCVTFixedPosOperand<32>", [fpimm, ld]> {
335   let EncoderMethod = "getFixedPointScaleOpValue";
336   let DecoderMethod = "DecodeFixedPointScaleImm32";
337   let ParserMatchClass = Imm1_32Operand;
338 }
339
340 class fixedpoint_i64<ValueType FloatVT>
341   : Operand<FloatVT>,
342     ComplexPattern<FloatVT, 1, "SelectCVTFixedPosOperand<64>", [fpimm, ld]> {
343   let EncoderMethod = "getFixedPointScaleOpValue";
344   let DecoderMethod = "DecodeFixedPointScaleImm64";
345   let ParserMatchClass = Imm1_64Operand;
346 }
347
348 def fixedpoint_f32_i32 : fixedpoint_i32<f32>;
349 def fixedpoint_f64_i32 : fixedpoint_i32<f64>;
350
351 def fixedpoint_f32_i64 : fixedpoint_i64<f32>;
352 def fixedpoint_f64_i64 : fixedpoint_i64<f64>;
353
354 def vecshiftR8 : Operand<i32>, ImmLeaf<i32, [{
355   return (((uint32_t)Imm) > 0) && (((uint32_t)Imm) < 9);
356 }]> {
357   let EncoderMethod = "getVecShiftR8OpValue";
358   let DecoderMethod = "DecodeVecShiftR8Imm";
359   let ParserMatchClass = Imm1_8Operand;
360 }
361 def vecshiftR16 : Operand<i32>, ImmLeaf<i32, [{
362   return (((uint32_t)Imm) > 0) && (((uint32_t)Imm) < 17);
363 }]> {
364   let EncoderMethod = "getVecShiftR16OpValue";
365   let DecoderMethod = "DecodeVecShiftR16Imm";
366   let ParserMatchClass = Imm1_16Operand;
367 }
368 def vecshiftR16Narrow : Operand<i32>, ImmLeaf<i32, [{
369   return (((uint32_t)Imm) > 0) && (((uint32_t)Imm) < 9);
370 }]> {
371   let EncoderMethod = "getVecShiftR16OpValue";
372   let DecoderMethod = "DecodeVecShiftR16ImmNarrow";
373   let ParserMatchClass = Imm1_8Operand;
374 }
375 def vecshiftR32 : Operand<i32>, ImmLeaf<i32, [{
376   return (((uint32_t)Imm) > 0) && (((uint32_t)Imm) < 33);
377 }]> {
378   let EncoderMethod = "getVecShiftR32OpValue";
379   let DecoderMethod = "DecodeVecShiftR32Imm";
380   let ParserMatchClass = Imm1_32Operand;
381 }
382 def vecshiftR32Narrow : Operand<i32>, ImmLeaf<i32, [{
383   return (((uint32_t)Imm) > 0) && (((uint32_t)Imm) < 17);
384 }]> {
385   let EncoderMethod = "getVecShiftR32OpValue";
386   let DecoderMethod = "DecodeVecShiftR32ImmNarrow";
387   let ParserMatchClass = Imm1_16Operand;
388 }
389 def vecshiftR64 : Operand<i32>, ImmLeaf<i32, [{
390   return (((uint32_t)Imm) > 0) && (((uint32_t)Imm) < 65);
391 }]> {
392   let EncoderMethod = "getVecShiftR64OpValue";
393   let DecoderMethod = "DecodeVecShiftR64Imm";
394   let ParserMatchClass = Imm1_64Operand;
395 }
396 def vecshiftR64Narrow : Operand<i32>, ImmLeaf<i32, [{
397   return (((uint32_t)Imm) > 0) && (((uint32_t)Imm) < 33);
398 }]> {
399   let EncoderMethod = "getVecShiftR64OpValue";
400   let DecoderMethod = "DecodeVecShiftR64ImmNarrow";
401   let ParserMatchClass = Imm1_32Operand;
402 }
403
404 def Imm0_7Operand : AsmImmRange<0, 7>;
405 def Imm0_15Operand : AsmImmRange<0, 15>;
406 def Imm0_31Operand : AsmImmRange<0, 31>;
407 def Imm0_63Operand : AsmImmRange<0, 63>;
408
409 def vecshiftL8 : Operand<i32>, ImmLeaf<i32, [{
410   return (((uint32_t)Imm) < 8);
411 }]> {
412   let EncoderMethod = "getVecShiftL8OpValue";
413   let DecoderMethod = "DecodeVecShiftL8Imm";
414   let ParserMatchClass = Imm0_7Operand;
415 }
416 def vecshiftL16 : Operand<i32>, ImmLeaf<i32, [{
417   return (((uint32_t)Imm) < 16);
418 }]> {
419   let EncoderMethod = "getVecShiftL16OpValue";
420   let DecoderMethod = "DecodeVecShiftL16Imm";
421   let ParserMatchClass = Imm0_15Operand;
422 }
423 def vecshiftL32 : Operand<i32>, ImmLeaf<i32, [{
424   return (((uint32_t)Imm) < 32);
425 }]> {
426   let EncoderMethod = "getVecShiftL32OpValue";
427   let DecoderMethod = "DecodeVecShiftL32Imm";
428   let ParserMatchClass = Imm0_31Operand;
429 }
430 def vecshiftL64 : Operand<i32>, ImmLeaf<i32, [{
431   return (((uint32_t)Imm) < 64);
432 }]> {
433   let EncoderMethod = "getVecShiftL64OpValue";
434   let DecoderMethod = "DecodeVecShiftL64Imm";
435   let ParserMatchClass = Imm0_63Operand;
436 }
437
438
439 // Crazy immediate formats used by 32-bit and 64-bit logical immediate
440 // instructions for splatting repeating bit patterns across the immediate.
441 def logical_imm32_XFORM : SDNodeXForm<imm, [{
442   uint64_t enc = ARM64_AM::encodeLogicalImmediate(N->getZExtValue(), 32);
443   return CurDAG->getTargetConstant(enc, MVT::i32);
444 }]>;
445 def logical_imm64_XFORM : SDNodeXForm<imm, [{
446   uint64_t enc = ARM64_AM::encodeLogicalImmediate(N->getZExtValue(), 64);
447   return CurDAG->getTargetConstant(enc, MVT::i32);
448 }]>;
449
450 def LogicalImm32Operand : AsmOperandClass {
451   let Name = "LogicalImm32";
452   let DiagnosticType = "LogicalSecondSource";
453 }
454 def LogicalImm64Operand : AsmOperandClass {
455   let Name = "LogicalImm64";
456   let DiagnosticType = "LogicalSecondSource";
457 }
458 def logical_imm32 : Operand<i32>, PatLeaf<(imm), [{
459   return ARM64_AM::isLogicalImmediate(N->getZExtValue(), 32);
460 }], logical_imm32_XFORM> {
461   let PrintMethod = "printLogicalImm32";
462   let ParserMatchClass = LogicalImm32Operand;
463 }
464 def logical_imm64 : Operand<i64>, PatLeaf<(imm), [{
465   return ARM64_AM::isLogicalImmediate(N->getZExtValue(), 64);
466 }], logical_imm64_XFORM> {
467   let PrintMethod = "printLogicalImm64";
468   let ParserMatchClass = LogicalImm64Operand;
469 }
470
471 // imm0_65535 predicate - True if the immediate is in the range [0,65535].
472 def Imm0_65535Operand : AsmImmRange<0, 65535>;
473 def imm0_65535 : Operand<i32>, ImmLeaf<i32, [{
474   return ((uint32_t)Imm) < 65536;
475 }]> {
476   let ParserMatchClass = Imm0_65535Operand;
477   let PrintMethod = "printHexImm";
478 }
479
480 // imm0_255 predicate - True if the immediate is in the range [0,255].
481 def Imm0_255Operand : AsmOperandClass { let Name = "Imm0_255"; }
482 def imm0_255 : Operand<i32>, ImmLeaf<i32, [{
483   return ((uint32_t)Imm) < 256;
484 }]> {
485   let ParserMatchClass = Imm0_255Operand;
486   let PrintMethod = "printHexImm";
487 }
488
489 // imm0_127 predicate - True if the immediate is in the range [0,127]
490 def Imm0_127Operand : AsmImmRange<0, 127>;
491 def imm0_127 : Operand<i32>, ImmLeaf<i32, [{
492   return ((uint32_t)Imm) < 128;
493 }]> {
494   let ParserMatchClass = Imm0_127Operand;
495   let PrintMethod = "printHexImm";
496 }
497
498 // NOTE: These imm0_N operands have to be of type i64 because i64 is the size
499 // for all shift-amounts.
500
501 // imm0_63 predicate - True if the immediate is in the range [0,63]
502 def imm0_63 : Operand<i64>, ImmLeaf<i64, [{
503   return ((uint64_t)Imm) < 64;
504 }]> {
505   let ParserMatchClass = Imm0_63Operand;
506 }
507
508 // imm0_31 predicate - True if the immediate is in the range [0,31]
509 def imm0_31 : Operand<i64>, ImmLeaf<i64, [{
510   return ((uint64_t)Imm) < 32;
511 }]> {
512   let ParserMatchClass = Imm0_31Operand;
513 }
514
515 // imm0_15 predicate - True if the immediate is in the range [0,15]
516 def imm0_15 : Operand<i64>, ImmLeaf<i64, [{
517   return ((uint64_t)Imm) < 16;
518 }]> {
519   let ParserMatchClass = Imm0_15Operand;
520 }
521
522 // imm0_7 predicate - True if the immediate is in the range [0,7]
523 def imm0_7 : Operand<i64>, ImmLeaf<i64, [{
524   return ((uint64_t)Imm) < 8;
525 }]> {
526   let ParserMatchClass = Imm0_7Operand;
527 }
528
529 // An arithmetic shifter operand:
530 //  {7-6} - shift type: 00 = lsl, 01 = lsr, 10 = asr
531 //  {5-0} - imm6
532 class arith_shift<ValueType Ty, int width> : Operand<Ty> {
533   let PrintMethod = "printShifter";
534   let ParserMatchClass = !cast<AsmOperandClass>(
535                          "ArithmeticShifterOperand" # width);
536 }
537
538 def arith_shift32 : arith_shift<i32, 32>;
539 def arith_shift64 : arith_shift<i64, 64>;
540
541 class arith_shifted_reg<ValueType Ty, RegisterClass regclass, int width>
542     : Operand<Ty>,
543       ComplexPattern<Ty, 2, "SelectArithShiftedRegister", []> {
544   let PrintMethod = "printShiftedRegister";
545   let MIOperandInfo = (ops regclass, !cast<Operand>("arith_shift" # width));
546 }
547
548 def arith_shifted_reg32 : arith_shifted_reg<i32, GPR32, 32>;
549 def arith_shifted_reg64 : arith_shifted_reg<i64, GPR64, 64>;
550
551 // An arithmetic shifter operand:
552 //  {7-6} - shift type: 00 = lsl, 01 = lsr, 10 = asr, 11 = ror
553 //  {5-0} - imm6
554 class logical_shift<int width> : Operand<i32> {
555   let PrintMethod = "printShifter";
556   let ParserMatchClass = !cast<AsmOperandClass>(
557                          "LogicalShifterOperand" # width);
558 }
559
560 def logical_shift32 : logical_shift<32>;
561 def logical_shift64 : logical_shift<64>;
562
563 class logical_shifted_reg<ValueType Ty, RegisterClass regclass, Operand shiftop>
564     : Operand<Ty>,
565       ComplexPattern<Ty, 2, "SelectLogicalShiftedRegister", []> {
566   let PrintMethod = "printShiftedRegister";
567   let MIOperandInfo = (ops regclass, shiftop);
568 }
569
570 def logical_shifted_reg32 : logical_shifted_reg<i32, GPR32, logical_shift32>;
571 def logical_shifted_reg64 : logical_shifted_reg<i64, GPR64, logical_shift64>;
572
573 // A logical vector shifter operand:
574 //  {7-6} - shift type: 00 = lsl
575 //  {5-0} - imm6: #0, #8, #16, or #24
576 def logical_vec_shift : Operand<i32> {
577   let PrintMethod = "printShifter";
578   let EncoderMethod = "getVecShifterOpValue";
579   let ParserMatchClass = LogicalVecShifterOperand;
580 }
581
582 // A logical vector half-word shifter operand:
583 //  {7-6} - shift type: 00 = lsl
584 //  {5-0} - imm6: #0 or #8
585 def logical_vec_hw_shift : Operand<i32> {
586   let PrintMethod = "printShifter";
587   let EncoderMethod = "getVecShifterOpValue";
588   let ParserMatchClass = LogicalVecHalfWordShifterOperand;
589 }
590
591 // A vector move shifter operand:
592 //  {0} - imm1: #8 or #16
593 def move_vec_shift : Operand<i32> {
594   let PrintMethod = "printShifter";
595   let EncoderMethod = "getMoveVecShifterOpValue";
596   let ParserMatchClass = MoveVecShifterOperand;
597 }
598
599 def AddSubImmOperand : AsmOperandClass {
600   let Name = "AddSubImm";
601   let ParserMethod = "tryParseAddSubImm";
602   let DiagnosticType = "AddSubSecondSource";
603 }
604 // An ADD/SUB immediate shifter operand:
605 //  second operand:
606 //  {7-6} - shift type: 00 = lsl
607 //  {5-0} - imm6: #0 or #12
608 class addsub_shifted_imm<ValueType Ty>
609     : Operand<Ty>, ComplexPattern<Ty, 2, "SelectArithImmed", [imm]> {
610   let PrintMethod = "printAddSubImm";
611   let EncoderMethod = "getAddSubImmOpValue";
612   let ParserMatchClass = AddSubImmOperand;
613   let MIOperandInfo = (ops i32imm, i32imm);
614 }
615
616 def addsub_shifted_imm32 : addsub_shifted_imm<i32>;
617 def addsub_shifted_imm64 : addsub_shifted_imm<i64>;
618
619 class neg_addsub_shifted_imm<ValueType Ty>
620     : Operand<Ty>, ComplexPattern<Ty, 2, "SelectNegArithImmed", [imm]> {
621   let PrintMethod = "printAddSubImm";
622   let EncoderMethod = "getAddSubImmOpValue";
623   let ParserMatchClass = AddSubImmOperand;
624   let MIOperandInfo = (ops i32imm, i32imm);
625 }
626
627 def neg_addsub_shifted_imm32 : neg_addsub_shifted_imm<i32>;
628 def neg_addsub_shifted_imm64 : neg_addsub_shifted_imm<i64>;
629
630 // An extend operand:
631 //  {5-3} - extend type
632 //  {2-0} - imm3
633 def arith_extend : Operand<i32> {
634   let PrintMethod = "printExtend";
635   let ParserMatchClass = ExtendOperand;
636 }
637 def arith_extend64 : Operand<i32> {
638   let PrintMethod = "printExtend";
639   let ParserMatchClass = ExtendOperand64;
640 }
641
642 // 'extend' that's a lsl of a 64-bit register.
643 def arith_extendlsl64 : Operand<i32> {
644   let PrintMethod = "printExtend";
645   let ParserMatchClass = ExtendOperandLSL64;
646 }
647
648 class arith_extended_reg32<ValueType Ty> : Operand<Ty>,
649                     ComplexPattern<Ty, 2, "SelectArithExtendedRegister", []> {
650   let PrintMethod = "printExtendedRegister";
651   let MIOperandInfo = (ops GPR32, arith_extend);
652 }
653
654 class arith_extended_reg32to64<ValueType Ty> : Operand<Ty>,
655                     ComplexPattern<Ty, 2, "SelectArithExtendedRegister", []> {
656   let PrintMethod = "printExtendedRegister";
657   let MIOperandInfo = (ops GPR32, arith_extend64);
658 }
659
660 // Floating-point immediate.
661 def fpimm32 : Operand<f32>,
662               PatLeaf<(f32 fpimm), [{
663       return ARM64_AM::getFP32Imm(N->getValueAPF()) != -1;
664     }], SDNodeXForm<fpimm, [{
665       APFloat InVal = N->getValueAPF();
666       uint32_t enc = ARM64_AM::getFP32Imm(InVal);
667       return CurDAG->getTargetConstant(enc, MVT::i32);
668     }]>> {
669   let ParserMatchClass = FPImmOperand;
670   let PrintMethod = "printFPImmOperand";
671 }
672 def fpimm64 : Operand<f64>,
673               PatLeaf<(f64 fpimm), [{
674       return ARM64_AM::getFP64Imm(N->getValueAPF()) != -1;
675     }], SDNodeXForm<fpimm, [{
676       APFloat InVal = N->getValueAPF();
677       uint32_t enc = ARM64_AM::getFP64Imm(InVal);
678       return CurDAG->getTargetConstant(enc, MVT::i32);
679     }]>> {
680   let ParserMatchClass = FPImmOperand;
681   let PrintMethod = "printFPImmOperand";
682 }
683
684 def fpimm8 : Operand<i32> {
685   let ParserMatchClass = FPImmOperand;
686   let PrintMethod = "printFPImmOperand";
687 }
688
689 def fpimm0 : PatLeaf<(fpimm), [{
690   return N->isExactlyValue(+0.0);
691 }]>;
692
693 // Vector lane operands
694 class AsmVectorIndex<string Suffix> : AsmOperandClass {
695   let Name = "VectorIndex" # Suffix;
696   let DiagnosticType = "InvalidIndex" # Suffix;
697 }
698 def VectorIndex1Operand : AsmVectorIndex<"1">;
699 def VectorIndexBOperand : AsmVectorIndex<"B">;
700 def VectorIndexHOperand : AsmVectorIndex<"H">;
701 def VectorIndexSOperand : AsmVectorIndex<"S">;
702 def VectorIndexDOperand : AsmVectorIndex<"D">;
703
704 def VectorIndex1 : Operand<i64>, ImmLeaf<i64, [{
705   return ((uint64_t)Imm) == 1;
706 }]> {
707   let ParserMatchClass = VectorIndex1Operand;
708   let PrintMethod = "printVectorIndex";
709   let MIOperandInfo = (ops i64imm);
710 }
711 def VectorIndexB : Operand<i64>, ImmLeaf<i64, [{
712   return ((uint64_t)Imm) < 16;
713 }]> {
714   let ParserMatchClass = VectorIndexBOperand;
715   let PrintMethod = "printVectorIndex";
716   let MIOperandInfo = (ops i64imm);
717 }
718 def VectorIndexH : Operand<i64>, ImmLeaf<i64, [{
719   return ((uint64_t)Imm) < 8;
720 }]> {
721   let ParserMatchClass = VectorIndexHOperand;
722   let PrintMethod = "printVectorIndex";
723   let MIOperandInfo = (ops i64imm);
724 }
725 def VectorIndexS : Operand<i64>, ImmLeaf<i64, [{
726   return ((uint64_t)Imm) < 4;
727 }]> {
728   let ParserMatchClass = VectorIndexSOperand;
729   let PrintMethod = "printVectorIndex";
730   let MIOperandInfo = (ops i64imm);
731 }
732 def VectorIndexD : Operand<i64>, ImmLeaf<i64, [{
733   return ((uint64_t)Imm) < 2;
734 }]> {
735   let ParserMatchClass = VectorIndexDOperand;
736   let PrintMethod = "printVectorIndex";
737   let MIOperandInfo = (ops i64imm);
738 }
739
740 // 8-bit immediate for AdvSIMD where 64-bit values of the form:
741 // aaaaaaaa bbbbbbbb cccccccc dddddddd eeeeeeee ffffffff gggggggg hhhhhhhh
742 // are encoded as the eight bit value 'abcdefgh'.
743 def simdimmtype10 : Operand<i32>,
744                     PatLeaf<(f64 fpimm), [{
745       return ARM64_AM::isAdvSIMDModImmType10(N->getValueAPF()
746                                                .bitcastToAPInt()
747                                                .getZExtValue());
748     }], SDNodeXForm<fpimm, [{
749       APFloat InVal = N->getValueAPF();
750       uint32_t enc = ARM64_AM::encodeAdvSIMDModImmType10(N->getValueAPF()
751                                                            .bitcastToAPInt()
752                                                            .getZExtValue());
753       return CurDAG->getTargetConstant(enc, MVT::i32);
754     }]>> {
755   let ParserMatchClass = SIMDImmType10Operand;
756   let PrintMethod = "printSIMDType10Operand";
757 }
758
759
760 //---
761 // System management
762 //---
763
764 // Base encoding for system instruction operands.
765 let mayLoad = 0, mayStore = 0, hasSideEffects = 1 in
766 class BaseSystemI<bit L, dag oops, dag iops, string asm, string operands>
767     : I<oops, iops, asm, operands, "", []> {
768   let Inst{31-22} = 0b1101010100;
769   let Inst{21}    = L;
770 }
771
772 // System instructions which do not have an Rt register.
773 class SimpleSystemI<bit L, dag iops, string asm, string operands>
774     : BaseSystemI<L, (outs), iops, asm, operands> {
775   let Inst{4-0} = 0b11111;
776 }
777
778 // System instructions which have an Rt register.
779 class RtSystemI<bit L, dag oops, dag iops, string asm, string operands>
780     : BaseSystemI<L, oops, iops, asm, operands>,
781       Sched<[WriteSys]> {
782   bits<5> Rt;
783   let Inst{4-0} = Rt;
784 }
785
786 // Hint instructions that take both a CRm and a 3-bit immediate.
787 class HintI<string mnemonic>
788     : SimpleSystemI<0, (ins imm0_127:$imm), mnemonic#" $imm", "">,
789       Sched<[WriteHint]> {
790   bits <7> imm;
791   let Inst{20-12} = 0b000110010;
792   let Inst{11-5} = imm;
793 }
794
795 // System instructions taking a single literal operand which encodes into
796 // CRm. op2 differentiates the opcodes.
797 def BarrierAsmOperand : AsmOperandClass {
798   let Name = "Barrier";
799   let ParserMethod = "tryParseBarrierOperand";
800 }
801 def barrier_op : Operand<i32> {
802   let PrintMethod = "printBarrierOption";
803   let ParserMatchClass = BarrierAsmOperand;
804 }
805 class CRmSystemI<Operand crmtype, bits<3> opc, string asm>
806     : SimpleSystemI<0, (ins crmtype:$CRm), asm, "\t$CRm">,
807       Sched<[WriteBarrier]> {
808   bits<4> CRm;
809   let Inst{20-12} = 0b000110011;
810   let Inst{11-8} = CRm;
811   let Inst{7-5} = opc;
812 }
813
814 // MRS/MSR system instructions. These have different operand classes because
815 // a different subset of registers can be accessed through each instruction.
816 def MRSSystemRegisterOperand : AsmOperandClass {
817   let Name = "MRSSystemRegister";
818   let ParserMethod = "tryParseSysReg";
819   let DiagnosticType = "MRS";
820 }
821 // concatenation of 1, op0, op1, CRn, CRm, op2. 16-bit immediate.
822 def mrs_sysreg_op : Operand<i32> {
823   let ParserMatchClass = MRSSystemRegisterOperand;
824   let DecoderMethod = "DecodeMRSSystemRegister";
825   let PrintMethod = "printMRSSystemRegister";
826 }
827
828 def MSRSystemRegisterOperand : AsmOperandClass {
829   let Name = "MSRSystemRegister";
830   let ParserMethod = "tryParseSysReg";
831   let DiagnosticType = "MSR";
832 }
833 def msr_sysreg_op : Operand<i32> {
834   let ParserMatchClass = MSRSystemRegisterOperand;
835   let DecoderMethod = "DecodeMSRSystemRegister";
836   let PrintMethod = "printMSRSystemRegister";
837 }
838
839 class MRSI : RtSystemI<1, (outs GPR64:$Rt), (ins mrs_sysreg_op:$systemreg),
840                        "mrs", "\t$Rt, $systemreg"> {
841   bits<15> systemreg;
842   let Inst{20} = 1;
843   let Inst{19-5} = systemreg;
844 }
845
846 // FIXME: Some of these def NZCV, others don't. Best way to model that?
847 // Explicitly modeling each of the system register as a register class
848 // would do it, but feels like overkill at this point.
849 class MSRI : RtSystemI<0, (outs), (ins msr_sysreg_op:$systemreg, GPR64:$Rt),
850                        "msr", "\t$systemreg, $Rt"> {
851   bits<15> systemreg;
852   let Inst{20} = 1;
853   let Inst{19-5} = systemreg;
854 }
855
856 def SystemPStateFieldOperand : AsmOperandClass {
857   let Name = "SystemPStateField";
858   let ParserMethod = "tryParseSysReg";
859 }
860 def pstatefield_op : Operand<i32> {
861   let ParserMatchClass = SystemPStateFieldOperand;
862   let PrintMethod = "printSystemPStateField";
863 }
864
865 let Defs = [NZCV] in
866 class MSRpstateI
867   : SimpleSystemI<0, (ins pstatefield_op:$pstate_field, imm0_15:$imm),
868                   "msr", "\t$pstate_field, $imm">,
869     Sched<[WriteSys]> {
870   bits<6> pstatefield;
871   bits<4> imm;
872   let Inst{20-19} = 0b00;
873   let Inst{18-16} = pstatefield{5-3};
874   let Inst{15-12} = 0b0100;
875   let Inst{11-8} = imm;
876   let Inst{7-5} = pstatefield{2-0};
877
878   let DecoderMethod = "DecodeSystemPStateInstruction";
879 }
880
881 // SYS and SYSL generic system instructions.
882 def SysCRAsmOperand : AsmOperandClass {
883   let Name = "SysCR";
884   let ParserMethod = "tryParseSysCROperand";
885 }
886
887 def sys_cr_op : Operand<i32> {
888   let PrintMethod = "printSysCROperand";
889   let ParserMatchClass = SysCRAsmOperand;
890 }
891
892 class SystemXtI<bit L, string asm>
893   : RtSystemI<L, (outs),
894        (ins imm0_7:$op1, sys_cr_op:$Cn, sys_cr_op:$Cm, imm0_7:$op2, GPR64:$Rt),
895        asm, "\t$op1, $Cn, $Cm, $op2, $Rt"> {
896   bits<3> op1;
897   bits<4> Cn;
898   bits<4> Cm;
899   bits<3> op2;
900   let Inst{20-19} = 0b01;
901   let Inst{18-16} = op1;
902   let Inst{15-12} = Cn;
903   let Inst{11-8}  = Cm;
904   let Inst{7-5}   = op2;
905 }
906
907 class SystemLXtI<bit L, string asm>
908   : RtSystemI<L, (outs),
909        (ins GPR64:$Rt, imm0_7:$op1, sys_cr_op:$Cn, sys_cr_op:$Cm, imm0_7:$op2),
910        asm, "\t$Rt, $op1, $Cn, $Cm, $op2"> {
911   bits<3> op1;
912   bits<4> Cn;
913   bits<4> Cm;
914   bits<3> op2;
915   let Inst{20-19} = 0b01;
916   let Inst{18-16} = op1;
917   let Inst{15-12} = Cn;
918   let Inst{11-8}  = Cm;
919   let Inst{7-5}   = op2;
920 }
921
922
923 // Branch (register) instructions:
924 //
925 //  case opc of
926 //    0001 blr
927 //    0000 br
928 //    0101 dret
929 //    0100 eret
930 //    0010 ret
931 //    otherwise UNDEFINED
932 class BaseBranchReg<bits<4> opc, dag oops, dag iops, string asm,
933                     string operands, list<dag> pattern>
934     : I<oops, iops, asm, operands, "", pattern>, Sched<[WriteBrReg]> {
935   let Inst{31-25} = 0b1101011;
936   let Inst{24-21} = opc;
937   let Inst{20-16} = 0b11111;
938   let Inst{15-10} = 0b000000;
939   let Inst{4-0}   = 0b00000;
940 }
941
942 class BranchReg<bits<4> opc, string asm, list<dag> pattern>
943     : BaseBranchReg<opc, (outs), (ins GPR64:$Rn), asm, "\t$Rn", pattern> {
944   bits<5> Rn;
945   let Inst{9-5} = Rn;
946 }
947
948 let mayLoad = 0, mayStore = 0, hasSideEffects = 1, isReturn = 1 in
949 class SpecialReturn<bits<4> opc, string asm>
950     : BaseBranchReg<opc, (outs), (ins), asm, "", []> {
951   let Inst{9-5} = 0b11111;
952 }
953
954 //---
955 // Conditional branch instruction.
956 //---
957
958 // Condition code.
959 // 4-bit immediate. Pretty-printed as <cc>
960 def ccode : Operand<i32> {
961   let PrintMethod = "printCondCode";
962   let ParserMatchClass = CondCode;
963 }
964 def inv_ccode : Operand<i32> {
965   let PrintMethod = "printInverseCondCode";
966   let ParserMatchClass = CondCode;
967 }
968
969 // Conditional branch target. 19-bit immediate. The low two bits of the target
970 // offset are implied zero and so are not part of the immediate.
971 def PCRelLabel19Operand : AsmOperandClass {
972   let Name = "PCRelLabel19";
973   let DiagnosticType = "InvalidLabel";
974 }
975 def am_brcond : Operand<OtherVT> {
976   let EncoderMethod = "getCondBranchTargetOpValue";
977   let DecoderMethod = "DecodePCRelLabel19";
978   let PrintMethod = "printAlignedLabel";
979   let ParserMatchClass = PCRelLabel19Operand;
980 }
981
982 class BranchCond : I<(outs), (ins ccode:$cond, am_brcond:$target),
983                      "b", ".$cond\t$target", "",
984                      [(ARM64brcond bb:$target, imm:$cond, NZCV)]>,
985                    Sched<[WriteBr]> {
986   let isBranch = 1;
987   let isTerminator = 1;
988   let Uses = [NZCV];
989
990   bits<4> cond;
991   bits<19> target;
992   let Inst{31-24} = 0b01010100;
993   let Inst{23-5} = target;
994   let Inst{4} = 0;
995   let Inst{3-0} = cond;
996 }
997
998 //---
999 // Compare-and-branch instructions.
1000 //---
1001 class BaseCmpBranch<RegisterClass regtype, bit op, string asm, SDNode node>
1002     : I<(outs), (ins regtype:$Rt, am_brcond:$target),
1003          asm, "\t$Rt, $target", "",
1004          [(node regtype:$Rt, bb:$target)]>,
1005       Sched<[WriteBr]> {
1006   let isBranch = 1;
1007   let isTerminator = 1;
1008
1009   bits<5> Rt;
1010   bits<19> target;
1011   let Inst{30-25} = 0b011010;
1012   let Inst{24}    = op;
1013   let Inst{23-5}  = target;
1014   let Inst{4-0}   = Rt;
1015 }
1016
1017 multiclass CmpBranch<bit op, string asm, SDNode node> {
1018   def W : BaseCmpBranch<GPR32, op, asm, node> {
1019     let Inst{31} = 0;
1020   }
1021   def X : BaseCmpBranch<GPR64, op, asm, node> {
1022     let Inst{31} = 1;
1023   }
1024 }
1025
1026 //---
1027 // Test-bit-and-branch instructions.
1028 //---
1029 // Test-and-branch target. 14-bit sign-extended immediate. The low two bits of
1030 // the target offset are implied zero and so are not part of the immediate.
1031 def BranchTarget14Operand : AsmOperandClass {
1032   let Name = "BranchTarget14";
1033 }
1034 def am_tbrcond : Operand<OtherVT> {
1035   let EncoderMethod = "getTestBranchTargetOpValue";
1036   let PrintMethod = "printAlignedLabel";
1037   let ParserMatchClass = BranchTarget14Operand;
1038 }
1039
1040 class TestBranch<bit op, string asm, SDNode node>
1041     : I<(outs), (ins GPR64:$Rt, imm0_63:$bit_off, am_tbrcond:$target),
1042        asm, "\t$Rt, $bit_off, $target", "",
1043        [(node GPR64:$Rt, imm0_63:$bit_off, bb:$target)]>,
1044       Sched<[WriteBr]> {
1045   let isBranch = 1;
1046   let isTerminator = 1;
1047
1048   bits<5> Rt;
1049   bits<6> bit_off;
1050   bits<14> target;
1051
1052   let Inst{31}    = bit_off{5};
1053   let Inst{30-25} = 0b011011;
1054   let Inst{24}    = op;
1055   let Inst{23-19} = bit_off{4-0};
1056   let Inst{18-5}  = target;
1057   let Inst{4-0}   = Rt;
1058
1059   let DecoderMethod = "DecodeTestAndBranch";
1060 }
1061
1062 //---
1063 // Unconditional branch (immediate) instructions.
1064 //---
1065 def BranchTarget26Operand : AsmOperandClass {
1066   let Name = "BranchTarget26";
1067   let DiagnosticType = "InvalidLabel";
1068 }
1069 def am_b_target : Operand<OtherVT> {
1070   let EncoderMethod = "getBranchTargetOpValue";
1071   let PrintMethod = "printAlignedLabel";
1072   let ParserMatchClass = BranchTarget26Operand;
1073 }
1074 def am_bl_target : Operand<i64> {
1075   let EncoderMethod = "getBranchTargetOpValue";
1076   let PrintMethod = "printAlignedLabel";
1077   let ParserMatchClass = BranchTarget26Operand;
1078 }
1079
1080 class BImm<bit op, dag iops, string asm, list<dag> pattern>
1081     : I<(outs), iops, asm, "\t$addr", "", pattern>, Sched<[WriteBr]> {
1082   bits<26> addr;
1083   let Inst{31}    = op;
1084   let Inst{30-26} = 0b00101;
1085   let Inst{25-0}  = addr;
1086
1087   let DecoderMethod = "DecodeUnconditionalBranch";
1088 }
1089
1090 class BranchImm<bit op, string asm, list<dag> pattern>
1091     : BImm<op, (ins am_b_target:$addr), asm, pattern>;
1092 class CallImm<bit op, string asm, list<dag> pattern>
1093     : BImm<op, (ins am_bl_target:$addr), asm, pattern>;
1094
1095 //---
1096 // Basic one-operand data processing instructions.
1097 //---
1098
1099 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1100 class BaseOneOperandData<bits<3> opc, RegisterClass regtype, string asm,
1101                          SDPatternOperator node>
1102   : I<(outs regtype:$Rd), (ins regtype:$Rn), asm, "\t$Rd, $Rn", "",
1103       [(set regtype:$Rd, (node regtype:$Rn))]>,
1104     Sched<[WriteI]> {
1105   bits<5> Rd;
1106   bits<5> Rn;
1107
1108   let Inst{30-13} = 0b101101011000000000;
1109   let Inst{12-10} = opc;
1110   let Inst{9-5}   = Rn;
1111   let Inst{4-0}   = Rd;
1112 }
1113
1114 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1115 multiclass OneOperandData<bits<3> opc, string asm,
1116                           SDPatternOperator node = null_frag> {
1117   def Wr : BaseOneOperandData<opc, GPR32, asm, node> {
1118     let Inst{31} = 0;
1119   }
1120
1121   def Xr : BaseOneOperandData<opc, GPR64, asm, node> {
1122     let Inst{31} = 1;
1123   }
1124 }
1125
1126 class OneWRegData<bits<3> opc, string asm, SDPatternOperator node>
1127     : BaseOneOperandData<opc, GPR32, asm, node> {
1128   let Inst{31} = 0;
1129 }
1130
1131 class OneXRegData<bits<3> opc, string asm, SDPatternOperator node>
1132     : BaseOneOperandData<opc, GPR64, asm, node> {
1133   let Inst{31} = 1;
1134 }
1135
1136 //---
1137 // Basic two-operand data processing instructions.
1138 //---
1139 class BaseBaseAddSubCarry<bit isSub, RegisterClass regtype, string asm,
1140                           list<dag> pattern>
1141     : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm),
1142         asm, "\t$Rd, $Rn, $Rm", "", pattern>,
1143       Sched<[WriteI]> {
1144   let Uses = [NZCV];
1145   bits<5> Rd;
1146   bits<5> Rn;
1147   bits<5> Rm;
1148   let Inst{30}    = isSub;
1149   let Inst{28-21} = 0b11010000;
1150   let Inst{20-16} = Rm;
1151   let Inst{15-10} = 0;
1152   let Inst{9-5}   = Rn;
1153   let Inst{4-0}   = Rd;
1154 }
1155
1156 class BaseAddSubCarry<bit isSub, RegisterClass regtype, string asm,
1157                       SDNode OpNode>
1158     : BaseBaseAddSubCarry<isSub, regtype, asm,
1159         [(set regtype:$Rd, (OpNode regtype:$Rn, regtype:$Rm, NZCV))]>;
1160
1161 class BaseAddSubCarrySetFlags<bit isSub, RegisterClass regtype, string asm,
1162                               SDNode OpNode>
1163     : BaseBaseAddSubCarry<isSub, regtype, asm,
1164         [(set regtype:$Rd, (OpNode regtype:$Rn, regtype:$Rm, NZCV)),
1165          (implicit NZCV)]> {
1166   let Defs = [NZCV];
1167 }
1168
1169 multiclass AddSubCarry<bit isSub, string asm, string asm_setflags,
1170                        SDNode OpNode, SDNode OpNode_setflags> {
1171   def Wr : BaseAddSubCarry<isSub, GPR32, asm, OpNode> {
1172     let Inst{31} = 0;
1173     let Inst{29} = 0;
1174   }
1175   def Xr : BaseAddSubCarry<isSub, GPR64, asm, OpNode> {
1176     let Inst{31} = 1;
1177     let Inst{29} = 0;
1178   }
1179
1180   // Sets flags.
1181   def SWr : BaseAddSubCarrySetFlags<isSub, GPR32, asm_setflags,
1182                                     OpNode_setflags> {
1183     let Inst{31} = 0;
1184     let Inst{29} = 1;
1185   }
1186   def SXr : BaseAddSubCarrySetFlags<isSub, GPR64, asm_setflags,
1187                                     OpNode_setflags> {
1188     let Inst{31} = 1;
1189     let Inst{29} = 1;
1190   }
1191 }
1192
1193 class BaseTwoOperand<bits<4> opc, RegisterClass regtype, string asm,
1194                      SDPatternOperator OpNode>
1195   : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm),
1196       asm, "\t$Rd, $Rn, $Rm", "",
1197       [(set regtype:$Rd, (OpNode regtype:$Rn, regtype:$Rm))]> {
1198   bits<5> Rd;
1199   bits<5> Rn;
1200   bits<5> Rm;
1201   let Inst{30-21} = 0b0011010110;
1202   let Inst{20-16} = Rm;
1203   let Inst{15-14} = 0b00;
1204   let Inst{13-10} = opc;
1205   let Inst{9-5}   = Rn;
1206   let Inst{4-0}   = Rd;
1207 }
1208
1209 class BaseDiv<bit isSigned, RegisterClass regtype, string asm,
1210               SDPatternOperator OpNode>
1211     : BaseTwoOperand<{0,0,1,?}, regtype, asm, OpNode> {
1212   let Inst{10}    = isSigned;
1213 }
1214
1215 multiclass Div<bit isSigned, string asm, SDPatternOperator OpNode> {
1216   def Wr : BaseDiv<isSigned, GPR32, asm, OpNode>,
1217            Sched<[WriteID32]> {
1218     let Inst{31} = 0;
1219   }
1220   def Xr : BaseDiv<isSigned, GPR64, asm, OpNode>,
1221            Sched<[WriteID64]> {
1222     let Inst{31} = 1;
1223   }
1224 }
1225
1226 class BaseShift<bits<2> shift_type, RegisterClass regtype, string asm,
1227                 SDPatternOperator OpNode = null_frag>
1228   : BaseTwoOperand<{1,0,?,?}, regtype, asm, OpNode>,
1229     Sched<[WriteIS]> {
1230   let Inst{11-10} = shift_type;
1231 }
1232
1233 multiclass Shift<bits<2> shift_type, string asm, SDNode OpNode> {
1234   def Wr : BaseShift<shift_type, GPR32, asm> {
1235     let Inst{31} = 0;
1236   }
1237
1238   def Xr : BaseShift<shift_type, GPR64, asm, OpNode> {
1239     let Inst{31} = 1;
1240   }
1241
1242   def : Pat<(i32 (OpNode GPR32:$Rn, i64:$Rm)),
1243             (!cast<Instruction>(NAME # "Wr") GPR32:$Rn,
1244                                              (EXTRACT_SUBREG i64:$Rm, sub_32))>;
1245
1246   def : Pat<(i32 (OpNode GPR32:$Rn, (i64 (zext GPR32:$Rm)))),
1247             (!cast<Instruction>(NAME # "Wr") GPR32:$Rn, GPR32:$Rm)>;
1248
1249   def : Pat<(i32 (OpNode GPR32:$Rn, (i64 (anyext GPR32:$Rm)))),
1250             (!cast<Instruction>(NAME # "Wr") GPR32:$Rn, GPR32:$Rm)>;
1251
1252   def : Pat<(i32 (OpNode GPR32:$Rn, (i64 (sext GPR32:$Rm)))),
1253             (!cast<Instruction>(NAME # "Wr") GPR32:$Rn, GPR32:$Rm)>;
1254 }
1255
1256 class ShiftAlias<string asm, Instruction inst, RegisterClass regtype>
1257     : InstAlias<asm#" $dst, $src1, $src2",
1258                 (inst regtype:$dst, regtype:$src1, regtype:$src2)>;
1259
1260 class BaseMulAccum<bit isSub, bits<3> opc, RegisterClass multype,
1261                        RegisterClass addtype, string asm,
1262                        list<dag> pattern>
1263   : I<(outs addtype:$Rd), (ins multype:$Rn, multype:$Rm, addtype:$Ra),
1264       asm, "\t$Rd, $Rn, $Rm, $Ra", "", pattern> {
1265   bits<5> Rd;
1266   bits<5> Rn;
1267   bits<5> Rm;
1268   bits<5> Ra;
1269   let Inst{30-24} = 0b0011011;
1270   let Inst{23-21} = opc;
1271   let Inst{20-16} = Rm;
1272   let Inst{15}    = isSub;
1273   let Inst{14-10} = Ra;
1274   let Inst{9-5}   = Rn;
1275   let Inst{4-0}   = Rd;
1276 }
1277
1278 multiclass MulAccum<bit isSub, string asm, SDNode AccNode> {
1279   def Wrrr : BaseMulAccum<isSub, 0b000, GPR32, GPR32, asm,
1280       [(set GPR32:$Rd, (AccNode GPR32:$Ra, (mul GPR32:$Rn, GPR32:$Rm)))]>,
1281       Sched<[WriteIM32]> {
1282     let Inst{31} = 0;
1283   }
1284
1285   def Xrrr : BaseMulAccum<isSub, 0b000, GPR64, GPR64, asm,
1286       [(set GPR64:$Rd, (AccNode GPR64:$Ra, (mul GPR64:$Rn, GPR64:$Rm)))]>,
1287       Sched<[WriteIM64]> {
1288     let Inst{31} = 1;
1289   }
1290 }
1291
1292 class WideMulAccum<bit isSub, bits<3> opc, string asm,
1293                    SDNode AccNode, SDNode ExtNode>
1294   : BaseMulAccum<isSub, opc, GPR32, GPR64, asm,
1295     [(set GPR64:$Rd, (AccNode GPR64:$Ra,
1296                             (mul (ExtNode GPR32:$Rn), (ExtNode GPR32:$Rm))))]>,
1297     Sched<[WriteIM32]> {
1298   let Inst{31} = 1;
1299 }
1300
1301 class MulHi<bits<3> opc, string asm, SDNode OpNode>
1302   : I<(outs GPR64:$Rd), (ins GPR64:$Rn, GPR64:$Rm),
1303       asm, "\t$Rd, $Rn, $Rm", "",
1304       [(set GPR64:$Rd, (OpNode GPR64:$Rn, GPR64:$Rm))]>,
1305     Sched<[WriteIM64]> {
1306   bits<5> Rd;
1307   bits<5> Rn;
1308   bits<5> Rm;
1309   let Inst{31-24} = 0b10011011;
1310   let Inst{23-21} = opc;
1311   let Inst{20-16} = Rm;
1312   let Inst{15}    = 0;
1313   let Inst{9-5}   = Rn;
1314   let Inst{4-0}   = Rd;
1315
1316   // The Ra field of SMULH and UMULH is unused: it should be assembled as 31
1317   // (i.e. all bits 1) but is ignored by the processor.
1318   let PostEncoderMethod = "fixMulHigh";
1319 }
1320
1321 class MulAccumWAlias<string asm, Instruction inst>
1322     : InstAlias<asm#" $dst, $src1, $src2",
1323                 (inst GPR32:$dst, GPR32:$src1, GPR32:$src2, WZR)>;
1324 class MulAccumXAlias<string asm, Instruction inst>
1325     : InstAlias<asm#" $dst, $src1, $src2",
1326                 (inst GPR64:$dst, GPR64:$src1, GPR64:$src2, XZR)>;
1327 class WideMulAccumAlias<string asm, Instruction inst>
1328     : InstAlias<asm#" $dst, $src1, $src2",
1329                 (inst GPR64:$dst, GPR32:$src1, GPR32:$src2, XZR)>;
1330
1331 class BaseCRC32<bit sf, bits<2> sz, bit C, RegisterClass StreamReg,
1332               SDPatternOperator OpNode, string asm>
1333   : I<(outs GPR32:$Rd), (ins GPR32:$Rn, StreamReg:$Rm),
1334       asm, "\t$Rd, $Rn, $Rm", "",
1335       [(set GPR32:$Rd, (OpNode GPR32:$Rn, StreamReg:$Rm))]>,
1336     Sched<[WriteISReg]> {
1337   bits<5> Rd;
1338   bits<5> Rn;
1339   bits<5> Rm;
1340
1341   let Inst{31} = sf;
1342   let Inst{30-21} = 0b0011010110;
1343   let Inst{20-16} = Rm;
1344   let Inst{15-13} = 0b010;
1345   let Inst{12} = C;
1346   let Inst{11-10} = sz;
1347   let Inst{9-5} = Rn;
1348   let Inst{4-0} = Rd;
1349   let Predicates = [HasCRC];
1350 }
1351
1352 //---
1353 // Address generation.
1354 //---
1355
1356 class ADRI<bit page, string asm, Operand adr, list<dag> pattern>
1357     : I<(outs GPR64:$Xd), (ins adr:$label), asm, "\t$Xd, $label", "",
1358         pattern>,
1359       Sched<[WriteI]> {
1360   bits<5>  Xd;
1361   bits<21> label;
1362   let Inst{31}    = page;
1363   let Inst{30-29} = label{1-0};
1364   let Inst{28-24} = 0b10000;
1365   let Inst{23-5}  = label{20-2};
1366   let Inst{4-0}   = Xd;
1367
1368   let DecoderMethod = "DecodeAdrInstruction";
1369 }
1370
1371 //---
1372 // Move immediate.
1373 //---
1374
1375 def movimm32_imm : Operand<i32> {
1376   let ParserMatchClass = Imm0_65535Operand;
1377   let EncoderMethod = "getMoveWideImmOpValue";
1378   let PrintMethod = "printHexImm";
1379 }
1380 def movimm32_shift : Operand<i32> {
1381   let PrintMethod = "printShifter";
1382   let ParserMatchClass = MovImm32ShifterOperand;
1383 }
1384 def movimm64_shift : Operand<i32> {
1385   let PrintMethod = "printShifter";
1386   let ParserMatchClass = MovImm64ShifterOperand;
1387 }
1388
1389 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1390 class BaseMoveImmediate<bits<2> opc, RegisterClass regtype, Operand shifter,
1391                         string asm>
1392   : I<(outs regtype:$Rd), (ins movimm32_imm:$imm, shifter:$shift),
1393        asm, "\t$Rd, $imm$shift", "", []>,
1394     Sched<[WriteImm]> {
1395   bits<5> Rd;
1396   bits<16> imm;
1397   bits<6> shift;
1398   let Inst{30-29} = opc;
1399   let Inst{28-23} = 0b100101;
1400   let Inst{22-21} = shift{5-4};
1401   let Inst{20-5}  = imm;
1402   let Inst{4-0}   = Rd;
1403
1404   let DecoderMethod = "DecodeMoveImmInstruction";
1405 }
1406
1407 multiclass MoveImmediate<bits<2> opc, string asm> {
1408   def Wi : BaseMoveImmediate<opc, GPR32, movimm32_shift, asm> {
1409     let Inst{31} = 0;
1410   }
1411
1412   def Xi : BaseMoveImmediate<opc, GPR64, movimm64_shift, asm> {
1413     let Inst{31} = 1;
1414   }
1415 }
1416
1417 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1418 class BaseInsertImmediate<bits<2> opc, RegisterClass regtype, Operand shifter,
1419                           string asm>
1420   : I<(outs regtype:$Rd),
1421       (ins regtype:$src, movimm32_imm:$imm, shifter:$shift),
1422        asm, "\t$Rd, $imm$shift", "$src = $Rd", []>,
1423     Sched<[WriteI]> {
1424   bits<5> Rd;
1425   bits<16> imm;
1426   bits<6> shift;
1427   let Inst{30-29} = opc;
1428   let Inst{28-23} = 0b100101;
1429   let Inst{22-21} = shift{5-4};
1430   let Inst{20-5}  = imm;
1431   let Inst{4-0}   = Rd;
1432
1433   let DecoderMethod = "DecodeMoveImmInstruction";
1434 }
1435
1436 multiclass InsertImmediate<bits<2> opc, string asm> {
1437   def Wi : BaseInsertImmediate<opc, GPR32, movimm32_shift, asm> {
1438     let Inst{31} = 0;
1439   }
1440
1441   def Xi : BaseInsertImmediate<opc, GPR64, movimm64_shift, asm> {
1442     let Inst{31} = 1;
1443   }
1444 }
1445
1446 //---
1447 // Add/Subtract
1448 //---
1449
1450 class BaseAddSubImm<bit isSub, bit setFlags, RegisterClass dstRegtype,
1451                     RegisterClass srcRegtype, addsub_shifted_imm immtype,
1452                     string asm, SDPatternOperator OpNode>
1453     : I<(outs dstRegtype:$Rd), (ins srcRegtype:$Rn, immtype:$imm),
1454         asm, "\t$Rd, $Rn, $imm", "",
1455         [(set dstRegtype:$Rd, (OpNode srcRegtype:$Rn, immtype:$imm))]>,
1456       Sched<[WriteI]>  {
1457   bits<5>  Rd;
1458   bits<5>  Rn;
1459   bits<14> imm;
1460   let Inst{30}    = isSub;
1461   let Inst{29}    = setFlags;
1462   let Inst{28-24} = 0b10001;
1463   let Inst{23-22} = imm{13-12}; // '00' => lsl #0, '01' => lsl #12
1464   let Inst{21-10} = imm{11-0};
1465   let Inst{9-5}   = Rn;
1466   let Inst{4-0}   = Rd;
1467   let DecoderMethod = "DecodeBaseAddSubImm";
1468 }
1469
1470 class BaseAddSubRegPseudo<RegisterClass regtype,
1471                           SDPatternOperator OpNode>
1472     : Pseudo<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm),
1473              [(set regtype:$Rd, (OpNode regtype:$Rn, regtype:$Rm))]>,
1474       Sched<[WriteI]>;
1475
1476 class BaseAddSubSReg<bit isSub, bit setFlags, RegisterClass regtype,
1477                      arith_shifted_reg shifted_regtype, string asm,
1478                      SDPatternOperator OpNode>
1479     : I<(outs regtype:$Rd), (ins regtype:$Rn, shifted_regtype:$Rm),
1480         asm, "\t$Rd, $Rn, $Rm", "",
1481         [(set regtype:$Rd, (OpNode regtype:$Rn, shifted_regtype:$Rm))]>,
1482       Sched<[WriteISReg]> {
1483   // The operands are in order to match the 'addr' MI operands, so we
1484   // don't need an encoder method and by-name matching. Just use the default
1485   // in-order handling. Since we're using by-order, make sure the names
1486   // do not match.
1487   bits<5> dst;
1488   bits<5> src1;
1489   bits<5> src2;
1490   bits<8> shift;
1491   let Inst{30}    = isSub;
1492   let Inst{29}    = setFlags;
1493   let Inst{28-24} = 0b01011;
1494   let Inst{23-22} = shift{7-6};
1495   let Inst{21}    = 0;
1496   let Inst{20-16} = src2;
1497   let Inst{15-10} = shift{5-0};
1498   let Inst{9-5}   = src1;
1499   let Inst{4-0}   = dst;
1500
1501   let DecoderMethod = "DecodeThreeAddrSRegInstruction";
1502 }
1503
1504 class BaseAddSubEReg<bit isSub, bit setFlags, RegisterClass dstRegtype,
1505                      RegisterClass src1Regtype, Operand src2Regtype,
1506                      string asm, SDPatternOperator OpNode>
1507     : I<(outs dstRegtype:$R1),
1508         (ins src1Regtype:$R2, src2Regtype:$R3),
1509         asm, "\t$R1, $R2, $R3", "",
1510         [(set dstRegtype:$R1, (OpNode src1Regtype:$R2, src2Regtype:$R3))]>,
1511       Sched<[WriteIEReg]> {
1512   bits<5> Rd;
1513   bits<5> Rn;
1514   bits<5> Rm;
1515   bits<6> ext;
1516   let Inst{30}    = isSub;
1517   let Inst{29}    = setFlags;
1518   let Inst{28-24} = 0b01011;
1519   let Inst{23-21} = 0b001;
1520   let Inst{20-16} = Rm;
1521   let Inst{15-13} = ext{5-3};
1522   let Inst{12-10} = ext{2-0};
1523   let Inst{9-5}   = Rn;
1524   let Inst{4-0}   = Rd;
1525
1526   let DecoderMethod = "DecodeAddSubERegInstruction";
1527 }
1528
1529 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1530 class BaseAddSubEReg64<bit isSub, bit setFlags, RegisterClass dstRegtype,
1531                        RegisterClass src1Regtype, RegisterClass src2Regtype,
1532                        Operand ext_op, string asm>
1533     : I<(outs dstRegtype:$Rd),
1534         (ins src1Regtype:$Rn, src2Regtype:$Rm, ext_op:$ext),
1535         asm, "\t$Rd, $Rn, $Rm$ext", "", []>,
1536       Sched<[WriteIEReg]> {
1537   bits<5> Rd;
1538   bits<5> Rn;
1539   bits<5> Rm;
1540   bits<6> ext;
1541   let Inst{30}    = isSub;
1542   let Inst{29}    = setFlags;
1543   let Inst{28-24} = 0b01011;
1544   let Inst{23-21} = 0b001;
1545   let Inst{20-16} = Rm;
1546   let Inst{15}    = ext{5};
1547   let Inst{12-10} = ext{2-0};
1548   let Inst{9-5}   = Rn;
1549   let Inst{4-0}   = Rd;
1550
1551   let DecoderMethod = "DecodeAddSubERegInstruction";
1552 }
1553
1554 // Aliases for register+register add/subtract.
1555 class AddSubRegAlias<string asm, Instruction inst, RegisterClass dstRegtype,
1556                      RegisterClass src1Regtype, RegisterClass src2Regtype,
1557                      int shiftExt>
1558     : InstAlias<asm#" $dst, $src1, $src2",
1559                 (inst dstRegtype:$dst, src1Regtype:$src1, src2Regtype:$src2,
1560                       shiftExt)>;
1561
1562 multiclass AddSub<bit isSub, string mnemonic,
1563                   SDPatternOperator OpNode = null_frag> {
1564   let hasSideEffects = 0 in {
1565   // Add/Subtract immediate
1566   def Wri  : BaseAddSubImm<isSub, 0, GPR32sp, GPR32sp, addsub_shifted_imm32,
1567                            mnemonic, OpNode> {
1568     let Inst{31} = 0;
1569   }
1570   def Xri  : BaseAddSubImm<isSub, 0, GPR64sp, GPR64sp, addsub_shifted_imm64,
1571                            mnemonic, OpNode> {
1572     let Inst{31} = 1;
1573   }
1574
1575   // Add/Subtract register - Only used for CodeGen
1576   def Wrr : BaseAddSubRegPseudo<GPR32, OpNode>;
1577   def Xrr : BaseAddSubRegPseudo<GPR64, OpNode>;
1578
1579   // Add/Subtract shifted register
1580   def Wrs : BaseAddSubSReg<isSub, 0, GPR32, arith_shifted_reg32, mnemonic,
1581                            OpNode> {
1582     let Inst{31} = 0;
1583   }
1584   def Xrs : BaseAddSubSReg<isSub, 0, GPR64, arith_shifted_reg64, mnemonic,
1585                            OpNode> {
1586     let Inst{31} = 1;
1587   }
1588   }
1589
1590   // Add/Subtract extended register
1591   let AddedComplexity = 1, hasSideEffects = 0 in {
1592   def Wrx : BaseAddSubEReg<isSub, 0, GPR32sp, GPR32sp,
1593                            arith_extended_reg32<i32>, mnemonic, OpNode> {
1594     let Inst{31} = 0;
1595   }
1596   def Xrx : BaseAddSubEReg<isSub, 0, GPR64sp, GPR64sp,
1597                            arith_extended_reg32to64<i64>, mnemonic, OpNode> {
1598     let Inst{31} = 1;
1599   }
1600   }
1601
1602   def Xrx64 : BaseAddSubEReg64<isSub, 0, GPR64sp, GPR64sp, GPR64,
1603                                arith_extendlsl64, mnemonic> {
1604     // UXTX and SXTX only.
1605     let Inst{14-13} = 0b11;
1606     let Inst{31} = 1;
1607   }
1608
1609   // Register/register aliases with no shift when SP is not used.
1610   def : AddSubRegAlias<mnemonic, !cast<Instruction>(NAME#"Wrs"),
1611                        GPR32, GPR32, GPR32, 0>;
1612   def : AddSubRegAlias<mnemonic, !cast<Instruction>(NAME#"Xrs"),
1613                        GPR64, GPR64, GPR64, 0>;
1614
1615   // Register/register aliases with no shift when either the destination or
1616   // first source register is SP.  This relies on the shifted register aliases
1617   // above matching first in the case when SP is not used.
1618   def : AddSubRegAlias<mnemonic, !cast<Instruction>(NAME#"Wrx"),
1619                        GPR32sp, GPR32sp, GPR32, 16>; // UXTW #0
1620   def : AddSubRegAlias<mnemonic,
1621                        !cast<Instruction>(NAME#"Xrx64"),
1622                        GPR64sp, GPR64sp, GPR64, 24>; // UXTX #0
1623 }
1624
1625 multiclass AddSubS<bit isSub, string mnemonic, SDNode OpNode, string cmp> {
1626   let isCompare = 1, Defs = [NZCV] in {
1627   // Add/Subtract immediate
1628   def Wri  : BaseAddSubImm<isSub, 1, GPR32, GPR32sp, addsub_shifted_imm32,
1629                            mnemonic, OpNode> {
1630     let Inst{31} = 0;
1631   }
1632   def Xri  : BaseAddSubImm<isSub, 1, GPR64, GPR64sp, addsub_shifted_imm64,
1633                            mnemonic, OpNode> {
1634     let Inst{31} = 1;
1635   }
1636
1637   // Add/Subtract register
1638   def Wrr : BaseAddSubRegPseudo<GPR32, OpNode>;
1639   def Xrr : BaseAddSubRegPseudo<GPR64, OpNode>;
1640
1641   // Add/Subtract shifted register
1642   def Wrs : BaseAddSubSReg<isSub, 1, GPR32, arith_shifted_reg32, mnemonic,
1643                            OpNode> {
1644     let Inst{31} = 0;
1645   }
1646   def Xrs : BaseAddSubSReg<isSub, 1, GPR64, arith_shifted_reg64, mnemonic,
1647                            OpNode> {
1648     let Inst{31} = 1;
1649   }
1650
1651   // Add/Subtract extended register
1652   let AddedComplexity = 1 in {
1653   def Wrx : BaseAddSubEReg<isSub, 1, GPR32, GPR32sp,
1654                            arith_extended_reg32<i32>, mnemonic, OpNode> {
1655     let Inst{31} = 0;
1656   }
1657   def Xrx : BaseAddSubEReg<isSub, 1, GPR64, GPR64sp,
1658                            arith_extended_reg32<i64>, mnemonic, OpNode> {
1659     let Inst{31} = 1;
1660   }
1661   }
1662
1663   def Xrx64 : BaseAddSubEReg64<isSub, 1, GPR64, GPR64sp, GPR64,
1664                                arith_extendlsl64, mnemonic> {
1665     // UXTX and SXTX only.
1666     let Inst{14-13} = 0b11;
1667     let Inst{31} = 1;
1668   }
1669   } // Defs = [NZCV]
1670
1671   // Compare aliases
1672   def : InstAlias<cmp#" $src, $imm", (!cast<Instruction>(NAME#"Wri")
1673                   WZR, GPR32sp:$src, addsub_shifted_imm32:$imm)>;
1674   def : InstAlias<cmp#" $src, $imm", (!cast<Instruction>(NAME#"Xri")
1675                   XZR, GPR64sp:$src, addsub_shifted_imm64:$imm)>;
1676   def : InstAlias<cmp#" $src1, $src2, $sh", (!cast<Instruction>(NAME#"Wrx")
1677                   WZR, GPR32sp:$src1, GPR32:$src2, arith_extend:$sh)>;
1678   def : InstAlias<cmp#" $src1, $src2, $sh", (!cast<Instruction>(NAME#"Xrx")
1679                   XZR, GPR64sp:$src1, GPR32:$src2, arith_extend:$sh)>;
1680   def : InstAlias<cmp#" $src1, $src2, $sh", (!cast<Instruction>(NAME#"Xrx64")
1681                   XZR, GPR64sp:$src1, GPR64:$src2, arith_extendlsl64:$sh)>;
1682   def : InstAlias<cmp#" $src1, $src2, $sh", (!cast<Instruction>(NAME#"Wrs")
1683                   WZR, GPR32:$src1, GPR32:$src2, arith_shift32:$sh)>;
1684   def : InstAlias<cmp#" $src1, $src2, $sh", (!cast<Instruction>(NAME#"Xrs")
1685                   XZR, GPR64:$src1, GPR64:$src2, arith_shift64:$sh)>;
1686
1687   // Compare shorthands
1688   def : InstAlias<cmp#" $src1, $src2", (!cast<Instruction>(NAME#"Wrs")
1689                   WZR, GPR32:$src1, GPR32:$src2, 0)>;
1690   def : InstAlias<cmp#" $src1, $src2", (!cast<Instruction>(NAME#"Xrs")
1691                   XZR, GPR64:$src1, GPR64:$src2, 0)>;
1692
1693   // Register/register aliases with no shift when SP is not used.
1694   def : AddSubRegAlias<mnemonic, !cast<Instruction>(NAME#"Wrs"),
1695                        GPR32, GPR32, GPR32, 0>;
1696   def : AddSubRegAlias<mnemonic, !cast<Instruction>(NAME#"Xrs"),
1697                        GPR64, GPR64, GPR64, 0>;
1698
1699   // Register/register aliases with no shift when the first source register
1700   // is SP.  This relies on the shifted register aliases above matching first
1701   // in the case when SP is not used.
1702   def : AddSubRegAlias<mnemonic, !cast<Instruction>(NAME#"Wrx"),
1703                        GPR32, GPR32sp, GPR32, 16>; // UXTW #0
1704   def : AddSubRegAlias<mnemonic,
1705                        !cast<Instruction>(NAME#"Xrx64"),
1706                        GPR64, GPR64sp, GPR64, 24>; // UXTX #0
1707 }
1708
1709 //---
1710 // Extract
1711 //---
1712 def SDTA64EXTR : SDTypeProfile<1, 3, [SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>,
1713                                       SDTCisPtrTy<3>]>;
1714 def ARM64Extr : SDNode<"ARM64ISD::EXTR", SDTA64EXTR>;
1715
1716 class BaseExtractImm<RegisterClass regtype, Operand imm_type, string asm,
1717                      list<dag> patterns>
1718     : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm, imm_type:$imm),
1719          asm, "\t$Rd, $Rn, $Rm, $imm", "", patterns>,
1720       Sched<[WriteExtr, ReadExtrHi]> {
1721   bits<5> Rd;
1722   bits<5> Rn;
1723   bits<5> Rm;
1724   bits<6> imm;
1725
1726   let Inst{30-23} = 0b00100111;
1727   let Inst{21}    = 0;
1728   let Inst{20-16} = Rm;
1729   let Inst{15-10} = imm;
1730   let Inst{9-5}   = Rn;
1731   let Inst{4-0}   = Rd;
1732 }
1733
1734 multiclass ExtractImm<string asm> {
1735   def Wrri : BaseExtractImm<GPR32, imm0_31, asm,
1736                       [(set GPR32:$Rd,
1737                         (ARM64Extr GPR32:$Rn, GPR32:$Rm, imm0_31:$imm))]> {
1738     let Inst{31} = 0;
1739     let Inst{22} = 0;
1740     // imm<5> must be zero.
1741     let imm{5}   = 0;
1742   }
1743   def Xrri : BaseExtractImm<GPR64, imm0_63, asm,
1744                       [(set GPR64:$Rd,
1745                         (ARM64Extr GPR64:$Rn, GPR64:$Rm, imm0_63:$imm))]> {
1746
1747     let Inst{31} = 1;
1748     let Inst{22} = 1;
1749   }
1750 }
1751
1752 //---
1753 // Bitfield
1754 //---
1755
1756 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1757 class BaseBitfieldImm<bits<2> opc,
1758                       RegisterClass regtype, Operand imm_type, string asm>
1759     : I<(outs regtype:$Rd), (ins regtype:$Rn, imm_type:$immr, imm_type:$imms),
1760          asm, "\t$Rd, $Rn, $immr, $imms", "", []>,
1761       Sched<[WriteIS]> {
1762   bits<5> Rd;
1763   bits<5> Rn;
1764   bits<6> immr;
1765   bits<6> imms;
1766
1767   let Inst{30-29} = opc;
1768   let Inst{28-23} = 0b100110;
1769   let Inst{21-16} = immr;
1770   let Inst{15-10} = imms;
1771   let Inst{9-5}   = Rn;
1772   let Inst{4-0}   = Rd;
1773 }
1774
1775 multiclass BitfieldImm<bits<2> opc, string asm> {
1776   def Wri : BaseBitfieldImm<opc, GPR32, imm0_31, asm> {
1777     let Inst{31} = 0;
1778     let Inst{22} = 0;
1779     // imms<5> and immr<5> must be zero, else ReservedValue().
1780     let Inst{21} = 0;
1781     let Inst{15} = 0;
1782   }
1783   def Xri : BaseBitfieldImm<opc, GPR64, imm0_63, asm> {
1784     let Inst{31} = 1;
1785     let Inst{22} = 1;
1786   }
1787 }
1788
1789 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1790 class BaseBitfieldImmWith2RegArgs<bits<2> opc,
1791                       RegisterClass regtype, Operand imm_type, string asm>
1792     : I<(outs regtype:$Rd), (ins regtype:$src, regtype:$Rn, imm_type:$immr,
1793                              imm_type:$imms),
1794          asm, "\t$Rd, $Rn, $immr, $imms", "$src = $Rd", []>,
1795       Sched<[WriteIS]> {
1796   bits<5> Rd;
1797   bits<5> Rn;
1798   bits<6> immr;
1799   bits<6> imms;
1800
1801   let Inst{30-29} = opc;
1802   let Inst{28-23} = 0b100110;
1803   let Inst{21-16} = immr;
1804   let Inst{15-10} = imms;
1805   let Inst{9-5}   = Rn;
1806   let Inst{4-0}   = Rd;
1807 }
1808
1809 multiclass BitfieldImmWith2RegArgs<bits<2> opc, string asm> {
1810   def Wri : BaseBitfieldImmWith2RegArgs<opc, GPR32, imm0_31, asm> {
1811     let Inst{31} = 0;
1812     let Inst{22} = 0;
1813     // imms<5> and immr<5> must be zero, else ReservedValue().
1814     let Inst{21} = 0;
1815     let Inst{15} = 0;
1816   }
1817   def Xri : BaseBitfieldImmWith2RegArgs<opc, GPR64, imm0_63, asm> {
1818     let Inst{31} = 1;
1819     let Inst{22} = 1;
1820   }
1821 }
1822
1823 //---
1824 // Logical
1825 //---
1826
1827 // Logical (immediate)
1828 class BaseLogicalImm<bits<2> opc, RegisterClass dregtype,
1829                      RegisterClass sregtype, Operand imm_type, string asm,
1830                      list<dag> pattern>
1831     : I<(outs dregtype:$Rd), (ins sregtype:$Rn, imm_type:$imm),
1832          asm, "\t$Rd, $Rn, $imm", "", pattern>,
1833       Sched<[WriteI]> {
1834   bits<5>  Rd;
1835   bits<5>  Rn;
1836   bits<13> imm;
1837   let Inst{30-29} = opc;
1838   let Inst{28-23} = 0b100100;
1839   let Inst{22}    = imm{12};
1840   let Inst{21-16} = imm{11-6};
1841   let Inst{15-10} = imm{5-0};
1842   let Inst{9-5}   = Rn;
1843   let Inst{4-0}   = Rd;
1844
1845   let DecoderMethod = "DecodeLogicalImmInstruction";
1846 }
1847
1848 // Logical (shifted register)
1849 class BaseLogicalSReg<bits<2> opc, bit N, RegisterClass regtype,
1850                       logical_shifted_reg shifted_regtype, string asm,
1851                       list<dag> pattern>
1852     : I<(outs regtype:$Rd), (ins regtype:$Rn, shifted_regtype:$Rm),
1853         asm, "\t$Rd, $Rn, $Rm", "", pattern>,
1854       Sched<[WriteISReg]> {
1855   // The operands are in order to match the 'addr' MI operands, so we
1856   // don't need an encoder method and by-name matching. Just use the default
1857   // in-order handling. Since we're using by-order, make sure the names
1858   // do not match.
1859   bits<5> dst;
1860   bits<5> src1;
1861   bits<5> src2;
1862   bits<8> shift;
1863   let Inst{30-29} = opc;
1864   let Inst{28-24} = 0b01010;
1865   let Inst{23-22} = shift{7-6};
1866   let Inst{21}    = N;
1867   let Inst{20-16} = src2;
1868   let Inst{15-10} = shift{5-0};
1869   let Inst{9-5}   = src1;
1870   let Inst{4-0}   = dst;
1871
1872   let DecoderMethod = "DecodeThreeAddrSRegInstruction";
1873 }
1874
1875 // Aliases for register+register logical instructions.
1876 class LogicalRegAlias<string asm, Instruction inst, RegisterClass regtype>
1877     : InstAlias<asm#" $dst, $src1, $src2",
1878                 (inst regtype:$dst, regtype:$src1, regtype:$src2, 0)>;
1879
1880 let AddedComplexity = 6 in
1881 multiclass LogicalImm<bits<2> opc, string mnemonic, SDNode OpNode> {
1882   def Wri : BaseLogicalImm<opc, GPR32sp, GPR32, logical_imm32, mnemonic,
1883                            [(set GPR32sp:$Rd, (OpNode GPR32:$Rn,
1884                                                logical_imm32:$imm))]> {
1885     let Inst{31} = 0;
1886     let Inst{22} = 0; // 64-bit version has an additional bit of immediate.
1887   }
1888   def Xri : BaseLogicalImm<opc, GPR64sp, GPR64, logical_imm64, mnemonic,
1889                            [(set GPR64sp:$Rd, (OpNode GPR64:$Rn,
1890                                                logical_imm64:$imm))]> {
1891     let Inst{31} = 1;
1892   }
1893 }
1894
1895 multiclass LogicalImmS<bits<2> opc, string mnemonic, SDNode OpNode> {
1896   let isCompare = 1, Defs = [NZCV] in {
1897   def Wri  : BaseLogicalImm<opc, GPR32, GPR32, logical_imm32, mnemonic,
1898       [(set GPR32:$Rd, (OpNode GPR32:$Rn, logical_imm32:$imm))]> {
1899     let Inst{31} = 0;
1900     let Inst{22} = 0; // 64-bit version has an additional bit of immediate.
1901   }
1902   def Xri  : BaseLogicalImm<opc, GPR64, GPR64, logical_imm64, mnemonic,
1903       [(set GPR64:$Rd, (OpNode GPR64:$Rn, logical_imm64:$imm))]> {
1904     let Inst{31} = 1;
1905   }
1906   } // end Defs = [NZCV]
1907 }
1908
1909 class BaseLogicalRegPseudo<RegisterClass regtype, SDPatternOperator OpNode>
1910     : Pseudo<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm),
1911              [(set regtype:$Rd, (OpNode regtype:$Rn, regtype:$Rm))]>,
1912       Sched<[WriteI]>;
1913
1914 // Split from LogicalImm as not all instructions have both.
1915 multiclass LogicalReg<bits<2> opc, bit N, string mnemonic,
1916                       SDPatternOperator OpNode> {
1917   def Wrr : BaseLogicalRegPseudo<GPR32, OpNode>;
1918   def Xrr : BaseLogicalRegPseudo<GPR64, OpNode>;
1919
1920   def Wrs : BaseLogicalSReg<opc, N, GPR32, logical_shifted_reg32, mnemonic,
1921                             [(set GPR32:$Rd, (OpNode GPR32:$Rn,
1922                                                  logical_shifted_reg32:$Rm))]> {
1923     let Inst{31} = 0;
1924   }
1925   def Xrs : BaseLogicalSReg<opc, N, GPR64, logical_shifted_reg64, mnemonic,
1926                             [(set GPR64:$Rd, (OpNode GPR64:$Rn,
1927                                                  logical_shifted_reg64:$Rm))]> {
1928     let Inst{31} = 1;
1929   }
1930
1931   def : LogicalRegAlias<mnemonic,
1932                         !cast<Instruction>(NAME#"Wrs"), GPR32>;
1933   def : LogicalRegAlias<mnemonic,
1934                         !cast<Instruction>(NAME#"Xrs"), GPR64>;
1935 }
1936
1937 // Split from LogicalReg to allow setting NZCV Defs
1938 multiclass LogicalRegS<bits<2> opc, bit N, string mnemonic,
1939                        SDPatternOperator OpNode = null_frag> {
1940   let Defs = [NZCV], mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
1941   def Wrr : BaseLogicalRegPseudo<GPR32, OpNode>;
1942   def Xrr : BaseLogicalRegPseudo<GPR64, OpNode>;
1943
1944   def Wrs : BaseLogicalSReg<opc, N, GPR32, logical_shifted_reg32, mnemonic,
1945             [(set GPR32:$Rd, (OpNode GPR32:$Rn, logical_shifted_reg32:$Rm))]> {
1946     let Inst{31} = 0;
1947   }
1948   def Xrs : BaseLogicalSReg<opc, N, GPR64, logical_shifted_reg64, mnemonic,
1949             [(set GPR64:$Rd, (OpNode GPR64:$Rn, logical_shifted_reg64:$Rm))]> {
1950     let Inst{31} = 1;
1951   }
1952   } // Defs = [NZCV]
1953
1954   def : LogicalRegAlias<mnemonic,
1955                         !cast<Instruction>(NAME#"Wrs"), GPR32>;
1956   def : LogicalRegAlias<mnemonic,
1957                         !cast<Instruction>(NAME#"Xrs"), GPR64>;
1958 }
1959
1960 //---
1961 // Conditionally set flags
1962 //---
1963
1964 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1965 class BaseCondSetFlagsImm<bit op, RegisterClass regtype, string asm>
1966     : I<(outs), (ins regtype:$Rn, imm0_31:$imm, imm0_15:$nzcv, ccode:$cond),
1967          asm, "\t$Rn, $imm, $nzcv, $cond", "", []>,
1968       Sched<[WriteI]> {
1969   let Uses = [NZCV];
1970   let Defs = [NZCV];
1971
1972   bits<5> Rn;
1973   bits<5> imm;
1974   bits<4> nzcv;
1975   bits<4> cond;
1976
1977   let Inst{30}    = op;
1978   let Inst{29-21} = 0b111010010;
1979   let Inst{20-16} = imm;
1980   let Inst{15-12} = cond;
1981   let Inst{11-10} = 0b10;
1982   let Inst{9-5}   = Rn;
1983   let Inst{4}     = 0b0;
1984   let Inst{3-0}   = nzcv;
1985 }
1986
1987 multiclass CondSetFlagsImm<bit op, string asm> {
1988   def Wi : BaseCondSetFlagsImm<op, GPR32, asm> {
1989     let Inst{31} = 0;
1990   }
1991   def Xi : BaseCondSetFlagsImm<op, GPR64, asm> {
1992     let Inst{31} = 1;
1993   }
1994 }
1995
1996 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
1997 class BaseCondSetFlagsReg<bit op, RegisterClass regtype, string asm>
1998     : I<(outs), (ins regtype:$Rn, regtype:$Rm, imm0_15:$nzcv, ccode:$cond),
1999          asm, "\t$Rn, $Rm, $nzcv, $cond", "", []>,
2000       Sched<[WriteI]> {
2001   let Uses = [NZCV];
2002   let Defs = [NZCV];
2003
2004   bits<5> Rn;
2005   bits<5> Rm;
2006   bits<4> nzcv;
2007   bits<4> cond;
2008
2009   let Inst{30}    = op;
2010   let Inst{29-21} = 0b111010010;
2011   let Inst{20-16} = Rm;
2012   let Inst{15-12} = cond;
2013   let Inst{11-10} = 0b00;
2014   let Inst{9-5}   = Rn;
2015   let Inst{4}     = 0b0;
2016   let Inst{3-0}   = nzcv;
2017 }
2018
2019 multiclass CondSetFlagsReg<bit op, string asm> {
2020   def Wr : BaseCondSetFlagsReg<op, GPR32, asm> {
2021     let Inst{31} = 0;
2022   }
2023   def Xr : BaseCondSetFlagsReg<op, GPR64, asm> {
2024     let Inst{31} = 1;
2025   }
2026 }
2027
2028 //---
2029 // Conditional select
2030 //---
2031
2032 class BaseCondSelect<bit op, bits<2> op2, RegisterClass regtype, string asm>
2033     : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm, ccode:$cond),
2034          asm, "\t$Rd, $Rn, $Rm, $cond", "",
2035          [(set regtype:$Rd,
2036                (ARM64csel regtype:$Rn, regtype:$Rm, (i32 imm:$cond), NZCV))]>,
2037       Sched<[WriteI]> {
2038   let Uses = [NZCV];
2039
2040   bits<5> Rd;
2041   bits<5> Rn;
2042   bits<5> Rm;
2043   bits<4> cond;
2044
2045   let Inst{30}    = op;
2046   let Inst{29-21} = 0b011010100;
2047   let Inst{20-16} = Rm;
2048   let Inst{15-12} = cond;
2049   let Inst{11-10} = op2;
2050   let Inst{9-5}   = Rn;
2051   let Inst{4-0}   = Rd;
2052 }
2053
2054 multiclass CondSelect<bit op, bits<2> op2, string asm> {
2055   def Wr : BaseCondSelect<op, op2, GPR32, asm> {
2056     let Inst{31} = 0;
2057   }
2058   def Xr : BaseCondSelect<op, op2, GPR64, asm> {
2059     let Inst{31} = 1;
2060   }
2061 }
2062
2063 class BaseCondSelectOp<bit op, bits<2> op2, RegisterClass regtype, string asm,
2064                        PatFrag frag>
2065     : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm, ccode:$cond),
2066          asm, "\t$Rd, $Rn, $Rm, $cond", "",
2067          [(set regtype:$Rd,
2068                (ARM64csel regtype:$Rn, (frag regtype:$Rm),
2069                (i32 imm:$cond), NZCV))]>,
2070       Sched<[WriteI]> {
2071   let Uses = [NZCV];
2072
2073   bits<5> Rd;
2074   bits<5> Rn;
2075   bits<5> Rm;
2076   bits<4> cond;
2077
2078   let Inst{30}    = op;
2079   let Inst{29-21} = 0b011010100;
2080   let Inst{20-16} = Rm;
2081   let Inst{15-12} = cond;
2082   let Inst{11-10} = op2;
2083   let Inst{9-5}   = Rn;
2084   let Inst{4-0}   = Rd;
2085 }
2086
2087 def inv_cond_XFORM : SDNodeXForm<imm, [{
2088   ARM64CC::CondCode CC = static_cast<ARM64CC::CondCode>(N->getZExtValue());
2089   return CurDAG->getTargetConstant(ARM64CC::getInvertedCondCode(CC), MVT::i32);
2090 }]>;
2091
2092 multiclass CondSelectOp<bit op, bits<2> op2, string asm, PatFrag frag> {
2093   def Wr : BaseCondSelectOp<op, op2, GPR32, asm, frag> {
2094     let Inst{31} = 0;
2095   }
2096   def Xr : BaseCondSelectOp<op, op2, GPR64, asm, frag> {
2097     let Inst{31} = 1;
2098   }
2099
2100   def : Pat<(ARM64csel (frag GPR32:$Rm), GPR32:$Rn, (i32 imm:$cond), NZCV),
2101             (!cast<Instruction>(NAME # Wr) GPR32:$Rn, GPR32:$Rm,
2102                                            (inv_cond_XFORM imm:$cond))>;
2103
2104   def : Pat<(ARM64csel (frag GPR64:$Rm), GPR64:$Rn, (i32 imm:$cond), NZCV),
2105             (!cast<Instruction>(NAME # Xr) GPR64:$Rn, GPR64:$Rm,
2106                                            (inv_cond_XFORM imm:$cond))>;
2107 }
2108
2109 //---
2110 // Special Mask Value
2111 //---
2112 def maski8_or_more : Operand<i32>,
2113   ImmLeaf<i32, [{ return (Imm & 0xff) == 0xff; }]> {
2114 }
2115 def maski16_or_more : Operand<i32>,
2116   ImmLeaf<i32, [{ return (Imm & 0xffff) == 0xffff; }]> {
2117 }
2118
2119
2120 //---
2121 // Load/store
2122 //---
2123
2124 // (unsigned immediate)
2125 // Indexed for 8-bit registers. offset is in range [0,4095].
2126 def MemoryIndexed8Operand : AsmOperandClass {
2127   let Name = "MemoryIndexed8";
2128   let DiagnosticType = "InvalidMemoryIndexed8";
2129 }
2130 def am_indexed8 : Operand<i64>,
2131                   ComplexPattern<i64, 2, "SelectAddrModeIndexed8", []> {
2132   let PrintMethod = "printAMIndexed<8>";
2133   let EncoderMethod
2134       = "getAMIndexed8OpValue<ARM64::fixup_arm64_ldst_imm12_scale1>";
2135   let ParserMatchClass = MemoryIndexed8Operand;
2136   let MIOperandInfo = (ops GPR64sp:$base, i64imm:$offset);
2137 }
2138
2139 // Indexed for 16-bit registers. offset is multiple of 2 in range [0,8190],
2140 // stored as immval/2 (the 12-bit literal that encodes directly into the insn).
2141 def MemoryIndexed16Operand : AsmOperandClass {
2142   let Name = "MemoryIndexed16";
2143   let DiagnosticType = "InvalidMemoryIndexed16";
2144 }
2145 def am_indexed16 : Operand<i64>,
2146                    ComplexPattern<i64, 2, "SelectAddrModeIndexed16", []> {
2147   let PrintMethod = "printAMIndexed<16>";
2148   let EncoderMethod
2149       = "getAMIndexed8OpValue<ARM64::fixup_arm64_ldst_imm12_scale2>";
2150   let ParserMatchClass = MemoryIndexed16Operand;
2151   let MIOperandInfo = (ops GPR64sp:$base, i64imm:$offset);
2152 }
2153
2154 // Indexed for 32-bit registers. offset is multiple of 4 in range [0,16380],
2155 // stored as immval/4 (the 12-bit literal that encodes directly into the insn).
2156 def MemoryIndexed32Operand : AsmOperandClass {
2157   let Name = "MemoryIndexed32";
2158   let DiagnosticType = "InvalidMemoryIndexed32";
2159 }
2160 def am_indexed32 : Operand<i64>,
2161                    ComplexPattern<i64, 2, "SelectAddrModeIndexed32", []> {
2162   let PrintMethod = "printAMIndexed<32>";
2163   let EncoderMethod
2164       = "getAMIndexed8OpValue<ARM64::fixup_arm64_ldst_imm12_scale4>";
2165   let ParserMatchClass = MemoryIndexed32Operand;
2166   let MIOperandInfo = (ops GPR64sp:$base, i64imm:$offset);
2167 }
2168
2169 // Indexed for 64-bit registers. offset is multiple of 8 in range [0,32760],
2170 // stored as immval/8 (the 12-bit literal that encodes directly into the insn).
2171 def MemoryIndexed64Operand : AsmOperandClass {
2172   let Name = "MemoryIndexed64";
2173   let DiagnosticType = "InvalidMemoryIndexed64";
2174 }
2175 def am_indexed64 : Operand<i64>,
2176                    ComplexPattern<i64, 2, "SelectAddrModeIndexed64", []> {
2177   let PrintMethod = "printAMIndexed<64>";
2178   let EncoderMethod
2179       = "getAMIndexed8OpValue<ARM64::fixup_arm64_ldst_imm12_scale8>";
2180   let ParserMatchClass = MemoryIndexed64Operand;
2181   let MIOperandInfo = (ops GPR64sp:$base, i64imm:$offset);
2182 }
2183
2184 // Indexed for 128-bit registers. offset is multiple of 16 in range [0,65520],
2185 // stored as immval/16 (the 12-bit literal that encodes directly into the insn).
2186 def MemoryIndexed128Operand : AsmOperandClass {
2187   let Name = "MemoryIndexed128";
2188   let DiagnosticType = "InvalidMemoryIndexed128";
2189 }
2190 def am_indexed128 : Operand<i64>,
2191                    ComplexPattern<i64, 2, "SelectAddrModeIndexed128", []> {
2192   let PrintMethod = "printAMIndexed<128>";
2193   let EncoderMethod
2194       = "getAMIndexed8OpValue<ARM64::fixup_arm64_ldst_imm12_scale16>";
2195   let ParserMatchClass = MemoryIndexed128Operand;
2196   let MIOperandInfo = (ops GPR64sp:$base, i64imm:$offset);
2197 }
2198
2199 // No offset.
2200 def MemoryNoIndexOperand : AsmOperandClass { let Name = "MemoryNoIndex"; }
2201 def am_noindex : Operand<i64>,
2202                  ComplexPattern<i64, 1, "SelectAddrModeNoIndex", []> {
2203   let PrintMethod = "printAMNoIndex";
2204   let ParserMatchClass = MemoryNoIndexOperand;
2205   let MIOperandInfo = (ops GPR64sp:$base);
2206 }
2207
2208 class BaseLoadStoreUI<bits<2> sz, bit V, bits<2> opc, dag oops, dag iops,
2209                       string asm, list<dag> pattern>
2210     : I<oops, iops, asm, "\t$Rt, $addr", "", pattern> {
2211   bits<5> dst;
2212
2213   bits<17> addr;
2214   bits<5> base = addr{4-0};
2215   bits<12> offset = addr{16-5};
2216
2217   let Inst{31-30} = sz;
2218   let Inst{29-27} = 0b111;
2219   let Inst{26}    = V;
2220   let Inst{25-24} = 0b01;
2221   let Inst{23-22} = opc;
2222   let Inst{21-10} = offset;
2223   let Inst{9-5}   = base;
2224   let Inst{4-0}   = dst;
2225
2226   let DecoderMethod = "DecodeUnsignedLdStInstruction";
2227 }
2228
2229 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
2230 class LoadUI<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2231              Operand indextype, string asm, list<dag> pattern>
2232     : BaseLoadStoreUI<sz, V, opc,
2233                       (outs regtype:$Rt), (ins indextype:$addr), asm, pattern>,
2234       Sched<[WriteLD]>;
2235
2236 let mayLoad = 0, mayStore = 1, hasSideEffects = 0 in
2237 class StoreUI<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2238              Operand indextype, string asm, list<dag> pattern>
2239     : BaseLoadStoreUI<sz, V, opc,
2240                       (outs), (ins regtype:$Rt, indextype:$addr), asm, pattern>,
2241       Sched<[WriteST]>;
2242
2243 def PrefetchOperand : AsmOperandClass {
2244   let Name = "Prefetch";
2245   let ParserMethod = "tryParsePrefetch";
2246 }
2247 def prfop : Operand<i32> {
2248   let PrintMethod = "printPrefetchOp";
2249   let ParserMatchClass = PrefetchOperand;
2250 }
2251
2252 let mayLoad = 0, mayStore = 0, hasSideEffects = 1 in
2253 class PrefetchUI<bits<2> sz, bit V, bits<2> opc, string asm, list<dag> pat>
2254     : BaseLoadStoreUI<sz, V, opc,
2255                       (outs), (ins prfop:$Rt, am_indexed64:$addr), asm, pat>,
2256       Sched<[WriteLD]>;
2257
2258 //---
2259 // Load literal
2260 //---
2261
2262 // Load literal address: 19-bit immediate. The low two bits of the target
2263 // offset are implied zero and so are not part of the immediate.
2264 def am_ldrlit : Operand<OtherVT> {
2265   let EncoderMethod = "getLoadLiteralOpValue";
2266   let DecoderMethod = "DecodePCRelLabel19";
2267   let PrintMethod = "printAlignedLabel";
2268   let ParserMatchClass = PCRelLabel19Operand;
2269 }
2270
2271 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
2272 class LoadLiteral<bits<2> opc, bit V, RegisterClass regtype, string asm>
2273     : I<(outs regtype:$Rt), (ins am_ldrlit:$label),
2274         asm, "\t$Rt, $label", "", []>,
2275       Sched<[WriteLD]> {
2276   bits<5> Rt;
2277   bits<19> label;
2278   let Inst{31-30} = opc;
2279   let Inst{29-27} = 0b011;
2280   let Inst{26}    = V;
2281   let Inst{25-24} = 0b00;
2282   let Inst{23-5}  = label;
2283   let Inst{4-0}   = Rt;
2284 }
2285
2286 let mayLoad = 0, mayStore = 0, hasSideEffects = 1 in
2287 class PrefetchLiteral<bits<2> opc, bit V, string asm, list<dag> pat>
2288     : I<(outs), (ins prfop:$Rt, am_ldrlit:$label),
2289         asm, "\t$Rt, $label", "", pat>,
2290       Sched<[WriteLD]> {
2291   bits<5> Rt;
2292   bits<19> label;
2293   let Inst{31-30} = opc;
2294   let Inst{29-27} = 0b011;
2295   let Inst{26}    = V;
2296   let Inst{25-24} = 0b00;
2297   let Inst{23-5}  = label;
2298   let Inst{4-0}   = Rt;
2299 }
2300
2301 //---
2302 // Load/store register offset
2303 //---
2304
2305 class MemROAsmOperand<int sz> : AsmOperandClass {
2306   let Name = "MemoryRegisterOffset"#sz;
2307   let DiagnosticType = "InvalidMemoryIndexed";
2308 }
2309
2310 def MemROAsmOperand8 : MemROAsmOperand<8>;
2311 def MemROAsmOperand16 : MemROAsmOperand<16>;
2312 def MemROAsmOperand32 : MemROAsmOperand<32>;
2313 def MemROAsmOperand64 : MemROAsmOperand<64>;
2314 def MemROAsmOperand128 : MemROAsmOperand<128>;
2315
2316 class ro_indexed<int sz> : Operand<i64> { // ComplexPattern<...>
2317   let PrintMethod = "printMemoryRegOffset<" # sz # ">";
2318   let MIOperandInfo = (ops GPR64sp:$base, GPR64:$offset, i32imm:$extend);
2319 }
2320
2321 def ro_indexed8 : ro_indexed<8>, ComplexPattern<i64, 3, "SelectAddrModeRO8", []> {
2322   let ParserMatchClass = MemROAsmOperand8;
2323 }
2324
2325 def ro_indexed16 : ro_indexed<16>, ComplexPattern<i64, 3, "SelectAddrModeRO16", []> {
2326   let ParserMatchClass = MemROAsmOperand16;
2327 }
2328
2329 def ro_indexed32 : ro_indexed<32>, ComplexPattern<i64, 3, "SelectAddrModeRO32", []> {
2330   let ParserMatchClass = MemROAsmOperand32;
2331 }
2332
2333 def ro_indexed64 : ro_indexed<64>, ComplexPattern<i64, 3, "SelectAddrModeRO64", []> {
2334   let ParserMatchClass = MemROAsmOperand64;
2335 }
2336
2337 def ro_indexed128 : ro_indexed<128>, ComplexPattern<i64, 3, "SelectAddrModeRO128", []> {
2338   let ParserMatchClass = MemROAsmOperand128;
2339 }
2340
2341 class LoadStore8RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2342                       string asm, dag ins, dag outs, list<dag> pat>
2343     : I<ins, outs, asm, "\t$Rt, $addr", "", pat> {
2344   // The operands are in order to match the 'addr' MI operands, so we
2345   // don't need an encoder method and by-name matching. Just use the default
2346   // in-order handling. Since we're using by-order, make sure the names
2347   // do not match.
2348   bits<5> dst;
2349   bits<5> base;
2350   bits<5> offset;
2351   bits<4> extend;
2352   let Inst{31-30} = sz;
2353   let Inst{29-27} = 0b111;
2354   let Inst{26}    = V;
2355   let Inst{25-24} = 0b00;
2356   let Inst{23-22} = opc;
2357   let Inst{21}    = 1;
2358   let Inst{20-16} = offset;
2359   let Inst{15-13} = extend{3-1};
2360
2361   let Inst{12}    = extend{0};
2362   let Inst{11-10} = 0b10;
2363   let Inst{9-5}   = base;
2364   let Inst{4-0}   = dst;
2365
2366   let DecoderMethod = "DecodeRegOffsetLdStInstruction";
2367 }
2368
2369 class Load8RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2370              string asm, list<dag> pat>
2371   : LoadStore8RO<sz, V, opc, regtype, asm,
2372                  (outs regtype:$Rt), (ins ro_indexed8:$addr), pat>,
2373     Sched<[WriteLDIdx, ReadAdrBase]>;
2374
2375 class Store8RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2376              string asm, list<dag> pat>
2377   : LoadStore8RO<sz, V, opc, regtype, asm,
2378                  (outs), (ins regtype:$Rt, ro_indexed8:$addr), pat>,
2379     Sched<[WriteSTIdx, ReadAdrBase]>;
2380
2381 class LoadStore16RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2382                       string asm, dag ins, dag outs, list<dag> pat>
2383     : I<ins, outs, asm, "\t$Rt, $addr", "", pat> {
2384   // The operands are in order to match the 'addr' MI operands, so we
2385   // don't need an encoder method and by-name matching. Just use the default
2386   // in-order handling. Since we're using by-order, make sure the names
2387   // do not match.
2388   bits<5> dst;
2389   bits<5> base;
2390   bits<5> offset;
2391   bits<4> extend;
2392   let Inst{31-30} = sz;
2393   let Inst{29-27} = 0b111;
2394   let Inst{26}    = V;
2395   let Inst{25-24} = 0b00;
2396   let Inst{23-22} = opc;
2397   let Inst{21}    = 1;
2398   let Inst{20-16} = offset;
2399   let Inst{15-13} = extend{3-1};
2400
2401   let Inst{12}    = extend{0};
2402   let Inst{11-10} = 0b10;
2403   let Inst{9-5}   = base;
2404   let Inst{4-0}   = dst;
2405
2406   let DecoderMethod = "DecodeRegOffsetLdStInstruction";
2407 }
2408
2409 class Load16RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2410              string asm, list<dag> pat>
2411   : LoadStore16RO<sz, V, opc, regtype, asm,
2412                  (outs regtype:$Rt), (ins ro_indexed16:$addr), pat>,
2413     Sched<[WriteLDIdx, ReadAdrBase]>;
2414
2415 class Store16RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2416              string asm, list<dag> pat>
2417   : LoadStore16RO<sz, V, opc, regtype, asm,
2418                  (outs), (ins regtype:$Rt, ro_indexed16:$addr), pat>,
2419     Sched<[WriteSTIdx, ReadAdrBase]>;
2420
2421 class LoadStore32RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2422                       string asm, dag ins, dag outs, list<dag> pat>
2423     : I<ins, outs, asm, "\t$Rt, $addr", "", pat> {
2424   // The operands are in order to match the 'addr' MI operands, so we
2425   // don't need an encoder method and by-name matching. Just use the default
2426   // in-order handling. Since we're using by-order, make sure the names
2427   // do not match.
2428   bits<5> dst;
2429   bits<5> base;
2430   bits<5> offset;
2431   bits<4> extend;
2432   let Inst{31-30} = sz;
2433   let Inst{29-27} = 0b111;
2434   let Inst{26}    = V;
2435   let Inst{25-24} = 0b00;
2436   let Inst{23-22} = opc;
2437   let Inst{21}    = 1;
2438   let Inst{20-16} = offset;
2439   let Inst{15-13} = extend{3-1};
2440
2441   let Inst{12}    = extend{0};
2442   let Inst{11-10} = 0b10;
2443   let Inst{9-5}   = base;
2444   let Inst{4-0}   = dst;
2445
2446   let DecoderMethod = "DecodeRegOffsetLdStInstruction";
2447 }
2448
2449 class Load32RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2450              string asm, list<dag> pat>
2451   : LoadStore32RO<sz, V, opc, regtype, asm,
2452                  (outs regtype:$Rt), (ins ro_indexed32:$addr), pat>,
2453     Sched<[WriteLDIdx, ReadAdrBase]>;
2454
2455 class Store32RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2456              string asm, list<dag> pat>
2457   : LoadStore32RO<sz, V, opc, regtype, asm,
2458                  (outs), (ins regtype:$Rt, ro_indexed32:$addr), pat>,
2459     Sched<[WriteSTIdx, ReadAdrBase]>;
2460
2461 class LoadStore64RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2462                       string asm, dag ins, dag outs, list<dag> pat>
2463     : I<ins, outs, asm, "\t$Rt, $addr", "", pat> {
2464   // The operands are in order to match the 'addr' MI operands, so we
2465   // don't need an encoder method and by-name matching. Just use the default
2466   // in-order handling. Since we're using by-order, make sure the names
2467   // do not match.
2468   bits<5> dst;
2469   bits<5> base;
2470   bits<5> offset;
2471   bits<4> extend;
2472   let Inst{31-30} = sz;
2473   let Inst{29-27} = 0b111;
2474   let Inst{26}    = V;
2475   let Inst{25-24} = 0b00;
2476   let Inst{23-22} = opc;
2477   let Inst{21}    = 1;
2478   let Inst{20-16} = offset;
2479   let Inst{15-13} = extend{3-1};
2480
2481   let Inst{12}    = extend{0};
2482   let Inst{11-10} = 0b10;
2483   let Inst{9-5}   = base;
2484   let Inst{4-0}   = dst;
2485
2486   let DecoderMethod = "DecodeRegOffsetLdStInstruction";
2487 }
2488
2489 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
2490 class Load64RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2491              string asm, list<dag> pat>
2492   : LoadStore64RO<sz, V, opc, regtype, asm,
2493                  (outs regtype:$Rt), (ins ro_indexed64:$addr), pat>,
2494     Sched<[WriteLDIdx, ReadAdrBase]>;
2495
2496 let mayLoad = 0, mayStore = 1, hasSideEffects = 0 in
2497 class Store64RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2498              string asm, list<dag> pat>
2499   : LoadStore64RO<sz, V, opc, regtype, asm,
2500                  (outs), (ins regtype:$Rt, ro_indexed64:$addr), pat>,
2501     Sched<[WriteSTIdx, ReadAdrBase]>;
2502
2503
2504 class LoadStore128RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2505                       string asm, dag ins, dag outs, list<dag> pat>
2506     : I<ins, outs, asm, "\t$Rt, $addr", "", pat> {
2507   // The operands are in order to match the 'addr' MI operands, so we
2508   // don't need an encoder method and by-name matching. Just use the default
2509   // in-order handling. Since we're using by-order, make sure the names
2510   // do not match.
2511   bits<5> dst;
2512   bits<5> base;
2513   bits<5> offset;
2514   bits<4> extend;
2515   let Inst{31-30} = sz;
2516   let Inst{29-27} = 0b111;
2517   let Inst{26}    = V;
2518   let Inst{25-24} = 0b00;
2519   let Inst{23-22} = opc;
2520   let Inst{21}    = 1;
2521   let Inst{20-16} = offset;
2522   let Inst{15-13} = extend{3-1};
2523
2524   let Inst{12}    = extend{0};
2525   let Inst{11-10} = 0b10;
2526   let Inst{9-5}   = base;
2527   let Inst{4-0}   = dst;
2528
2529   let DecoderMethod = "DecodeRegOffsetLdStInstruction";
2530 }
2531
2532 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
2533 class Load128RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2534              string asm, list<dag> pat>
2535   : LoadStore128RO<sz, V, opc, regtype, asm,
2536                  (outs regtype:$Rt), (ins ro_indexed128:$addr), pat>,
2537     Sched<[WriteLDIdx, ReadAdrBase]>;
2538
2539 let mayLoad = 0, mayStore = 1, hasSideEffects = 0 in
2540 class Store128RO<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2541              string asm, list<dag> pat>
2542   : LoadStore128RO<sz, V, opc, regtype, asm,
2543                  (outs), (ins regtype:$Rt, ro_indexed128:$addr), pat>,
2544     Sched<[WriteSTIdx, ReadAdrBase]>;
2545
2546 let mayLoad = 0, mayStore = 0, hasSideEffects = 1 in
2547 class PrefetchRO<bits<2> sz, bit V, bits<2> opc, string asm, list<dag> pat>
2548     : I<(outs), (ins prfop:$Rt, ro_indexed64:$addr), asm,
2549          "\t$Rt, $addr", "", pat>,
2550       Sched<[WriteLD]> {
2551   // The operands are in order to match the 'addr' MI operands, so we
2552   // don't need an encoder method and by-name matching. Just use the default
2553   // in-order handling. Since we're using by-order, make sure the names
2554   // do not match.
2555   bits<5> dst;
2556   bits<5> base;
2557   bits<5> offset;
2558   bits<4> extend;
2559   let Inst{31-30} = sz;
2560   let Inst{29-27} = 0b111;
2561   let Inst{26}    = V;
2562   let Inst{25-24} = 0b00;
2563   let Inst{23-22} = opc;
2564   let Inst{21}    = 1;
2565   let Inst{20-16} = offset;
2566   let Inst{15-13} = extend{3-1};
2567
2568   let Inst{12}    = extend{0};
2569   let Inst{11-10} = 0b10;
2570   let Inst{9-5}   = base;
2571   let Inst{4-0}   = dst;
2572
2573   let DecoderMethod = "DecodeRegOffsetLdStInstruction";
2574 }
2575
2576 //---
2577 // Load/store unscaled immediate
2578 //---
2579
2580 def MemoryUnscaledOperand : AsmOperandClass {
2581   let Name = "MemoryUnscaled";
2582   let DiagnosticType = "InvalidMemoryIndexedSImm9";
2583 }
2584 class am_unscaled_operand : Operand<i64> {
2585   let PrintMethod = "printAMIndexed<8>";
2586   let ParserMatchClass = MemoryUnscaledOperand;
2587   let MIOperandInfo = (ops GPR64sp:$base, i64imm:$offset);
2588 }
2589 class am_unscaled_wb_operand : Operand<i64> {
2590   let PrintMethod = "printAMIndexedWB<8>";
2591   let ParserMatchClass = MemoryUnscaledOperand;
2592   let MIOperandInfo = (ops GPR64sp:$base, i64imm:$offset);
2593 }
2594 def am_unscaled   : am_unscaled_operand;
2595 def am_unscaled_wb: am_unscaled_wb_operand;
2596 def am_unscaled8  : am_unscaled_operand,
2597                     ComplexPattern<i64, 2, "SelectAddrModeUnscaled8", []>;
2598 def am_unscaled16 : am_unscaled_operand,
2599                     ComplexPattern<i64, 2, "SelectAddrModeUnscaled16", []>;
2600 def am_unscaled32 : am_unscaled_operand,
2601                     ComplexPattern<i64, 2, "SelectAddrModeUnscaled32", []>;
2602 def am_unscaled64 : am_unscaled_operand,
2603                     ComplexPattern<i64, 2, "SelectAddrModeUnscaled64", []>;
2604 def am_unscaled128 : am_unscaled_operand,
2605                     ComplexPattern<i64, 2, "SelectAddrModeUnscaled128", []>;
2606
2607 class BaseLoadStoreUnscale<bits<2> sz, bit V, bits<2> opc, dag oops, dag iops,
2608                            string asm, list<dag> pattern>
2609     : I<oops, iops, asm, "\t$Rt, $addr", "", pattern> {
2610   // The operands are in order to match the 'addr' MI operands, so we
2611   // don't need an encoder method and by-name matching. Just use the default
2612   // in-order handling. Since we're using by-order, make sure the names
2613   // do not match.
2614   bits<5> dst;
2615   bits<5> base;
2616   bits<9> offset;
2617   let Inst{31-30} = sz;
2618   let Inst{29-27} = 0b111;
2619   let Inst{26}    = V;
2620   let Inst{25-24} = 0b00;
2621   let Inst{23-22} = opc;
2622   let Inst{21}    = 0;
2623   let Inst{20-12} = offset;
2624   let Inst{11-10} = 0b00;
2625   let Inst{9-5}   = base;
2626   let Inst{4-0}   = dst;
2627
2628   let DecoderMethod = "DecodeSignedLdStInstruction";
2629 }
2630
2631 let AddedComplexity = 1 in // try this before LoadUI
2632 class LoadUnscaled<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2633                    Operand amtype, string asm, list<dag> pattern>
2634     : BaseLoadStoreUnscale<sz, V, opc, (outs regtype:$Rt),
2635                            (ins amtype:$addr), asm, pattern>,
2636       Sched<[WriteLD]>;
2637
2638 let AddedComplexity = 1 in // try this before StoreUI
2639 class StoreUnscaled<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2640                     Operand amtype, string asm, list<dag> pattern>
2641     : BaseLoadStoreUnscale<sz, V, opc, (outs),
2642                            (ins regtype:$Rt, amtype:$addr), asm, pattern>,
2643       Sched<[WriteST]>;
2644
2645 let mayLoad = 0, mayStore = 0, hasSideEffects = 1 in
2646 class PrefetchUnscaled<bits<2> sz, bit V, bits<2> opc, string asm, list<dag> pat>
2647     : BaseLoadStoreUnscale<sz, V, opc, (outs),
2648                            (ins prfop:$Rt, am_unscaled:$addr), asm, pat>,
2649       Sched<[WriteLD]>;
2650
2651 //---
2652 // Load/store unscaled immediate, unprivileged
2653 //---
2654
2655 class BaseLoadStoreUnprivileged<bits<2> sz, bit V, bits<2> opc,
2656                                 dag oops, dag iops, string asm>
2657     : I<oops, iops, asm, "\t$Rt, $addr", "", []> {
2658   // The operands are in order to match the 'addr' MI operands, so we
2659   // don't need an encoder method and by-name matching. Just use the default
2660   // in-order handling. Since we're using by-order, make sure the names
2661   // do not match.
2662   bits<5> dst;
2663   bits<5> base;
2664   bits<9> offset;
2665   let Inst{31-30} = sz;
2666   let Inst{29-27} = 0b111;
2667   let Inst{26}    = V;
2668   let Inst{25-24} = 0b00;
2669   let Inst{23-22} = opc;
2670   let Inst{21}    = 0;
2671   let Inst{20-12} = offset;
2672   let Inst{11-10} = 0b10;
2673   let Inst{9-5}   = base;
2674   let Inst{4-0}   = dst;
2675
2676   let DecoderMethod = "DecodeSignedLdStInstruction";
2677 }
2678
2679 let mayStore = 0, mayLoad = 1, hasSideEffects = 0 in {
2680 class LoadUnprivileged<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2681                    string asm>
2682     : BaseLoadStoreUnprivileged<sz, V, opc,
2683                       (outs regtype:$Rt), (ins am_unscaled:$addr), asm>,
2684       Sched<[WriteLD]>;
2685 }
2686
2687 let mayStore = 1, mayLoad = 0, hasSideEffects = 0 in {
2688 class StoreUnprivileged<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2689                     string asm>
2690     : BaseLoadStoreUnprivileged<sz, V, opc,
2691                       (outs), (ins regtype:$Rt, am_unscaled:$addr), asm>,
2692       Sched<[WriteST]>;
2693 }
2694
2695 //---
2696 // Load/store pre-indexed
2697 //---
2698
2699 class BaseLoadStorePreIdx<bits<2> sz, bit V, bits<2> opc, dag oops, dag iops,
2700                           string asm, string cstr>
2701     : I<oops, iops, asm, "\t$Rt, $addr!", cstr, []> {
2702   // The operands are in order to match the 'addr' MI operands, so we
2703   // don't need an encoder method and by-name matching. Just use the default
2704   // in-order handling.
2705   bits<5> dst;
2706   bits<5> base;
2707   bits<9> offset;
2708   let Inst{31-30} = sz;
2709   let Inst{29-27} = 0b111;
2710   let Inst{26}    = V;
2711   let Inst{25-24} = 0;
2712   let Inst{23-22} = opc;
2713   let Inst{21}    = 0;
2714   let Inst{20-12} = offset;
2715   let Inst{11-10} = 0b11;
2716   let Inst{9-5}   = base;
2717   let Inst{4-0}   = dst;
2718
2719   let DecoderMethod = "DecodeSignedLdStInstruction";
2720 }
2721
2722 let hasSideEffects = 0 in {
2723 let mayStore = 0, mayLoad = 1 in
2724 // FIXME: Modeling the write-back of these instructions for isel is tricky.
2725 //        we need the complex addressing mode for the memory reference, but
2726 //        we also need the write-back specified as a tied operand to the
2727 //        base register. That combination does not play nicely with
2728 //        the asm matcher and friends.
2729 class LoadPreIdx<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2730              string asm>
2731     : BaseLoadStorePreIdx<sz, V, opc,
2732                      (outs regtype:$Rt/*, GPR64sp:$wback*/),
2733                      (ins am_unscaled_wb:$addr), asm, ""/*"$addr.base = $wback"*/>,
2734       Sched<[WriteLD, WriteAdr]>;
2735
2736 let mayStore = 1, mayLoad = 0 in
2737 class StorePreIdx<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2738              string asm>
2739     : BaseLoadStorePreIdx<sz, V, opc,
2740                       (outs/* GPR64sp:$wback*/),
2741                       (ins regtype:$Rt, am_unscaled_wb:$addr),
2742                        asm, ""/*"$addr.base = $wback"*/>,
2743       Sched<[WriteAdr, WriteST]>;
2744 } // hasSideEffects = 0
2745
2746 // ISel pseudo-instructions which have the tied operands. When the MC lowering
2747 // logic finally gets smart enough to strip off tied operands that are just
2748 // for isel convenience, we can get rid of these pseudos and just reference
2749 // the real instructions directly.
2750 //
2751 // Ironically, also because of the writeback operands, we can't put the
2752 // matcher pattern directly on the instruction, but need to define it
2753 // separately.
2754 //
2755 // Loads aren't matched with patterns here at all, but rather in C++
2756 // custom lowering.
2757 let mayStore = 0, mayLoad = 1, hasSideEffects = 0 in {
2758 class LoadPreIdxPseudo<RegisterClass regtype>
2759     : Pseudo<(outs regtype:$Rt, GPR64sp:$wback),
2760              (ins am_noindex:$addr, simm9:$offset), [],
2761               "$addr.base = $wback,@earlyclobber $wback">,
2762       Sched<[WriteLD, WriteAdr]>;
2763 class LoadPostIdxPseudo<RegisterClass regtype>
2764     : Pseudo<(outs regtype:$Rt, GPR64sp:$wback),
2765              (ins am_noindex:$addr, simm9:$offset), [],
2766               "$addr.base = $wback,@earlyclobber $wback">,
2767       Sched<[WriteLD, WriteI]>;
2768 }
2769 multiclass StorePreIdxPseudo<RegisterClass regtype, ValueType Ty,
2770                              SDPatternOperator OpNode> {
2771   let mayStore = 1, mayLoad = 0, hasSideEffects = 0 in
2772   def _isel: Pseudo<(outs GPR64sp:$wback),
2773                     (ins regtype:$Rt, am_noindex:$addr, simm9:$offset), [],
2774                     "$addr.base = $wback,@earlyclobber $wback">,
2775       Sched<[WriteAdr, WriteST]>;
2776
2777   def : Pat<(OpNode (Ty regtype:$Rt), am_noindex:$addr, simm9:$offset),
2778             (!cast<Instruction>(NAME#_isel) regtype:$Rt, am_noindex:$addr,
2779                                             simm9:$offset)>;
2780 }
2781
2782 //---
2783 // Load/store post-indexed
2784 //---
2785
2786 // (pre-index) load/stores.
2787 class BaseLoadStorePostIdx<bits<2> sz, bit V, bits<2> opc, dag oops, dag iops,
2788                           string asm, string cstr>
2789     : I<oops, iops, asm, "\t$Rt, $addr, $idx", cstr, []> {
2790   // The operands are in order to match the 'addr' MI operands, so we
2791   // don't need an encoder method and by-name matching. Just use the default
2792   // in-order handling.
2793   bits<5> dst;
2794   bits<5> base;
2795   bits<9> offset;
2796   let Inst{31-30} = sz;
2797   let Inst{29-27} = 0b111;
2798   let Inst{26}    = V;
2799   let Inst{25-24} = 0b00;
2800   let Inst{23-22} = opc;
2801   let Inst{21}    = 0b0;
2802   let Inst{20-12} = offset;
2803   let Inst{11-10} = 0b01;
2804   let Inst{9-5}   = base;
2805   let Inst{4-0}   = dst;
2806
2807   let DecoderMethod = "DecodeSignedLdStInstruction";
2808 }
2809
2810 let hasSideEffects = 0 in {
2811 let mayStore = 0, mayLoad = 1 in
2812 // FIXME: Modeling the write-back of these instructions for isel is tricky.
2813 //        we need the complex addressing mode for the memory reference, but
2814 //        we also need the write-back specified as a tied operand to the
2815 //        base register. That combination does not play nicely with
2816 //        the asm matcher and friends.
2817 class LoadPostIdx<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2818              string asm>
2819     : BaseLoadStorePostIdx<sz, V, opc,
2820                       (outs regtype:$Rt/*, GPR64sp:$wback*/),
2821                       (ins am_noindex:$addr, simm9:$idx),
2822                       asm, ""/*"$addr.base = $wback"*/>,
2823       Sched<[WriteLD, WriteI]>;
2824
2825 let mayStore = 1, mayLoad = 0 in
2826 class StorePostIdx<bits<2> sz, bit V, bits<2> opc, RegisterClass regtype,
2827              string asm>
2828     : BaseLoadStorePostIdx<sz, V, opc,
2829                       (outs/* GPR64sp:$wback*/),
2830                       (ins regtype:$Rt, am_noindex:$addr, simm9:$idx),
2831                        asm, ""/*"$addr.base = $wback"*/>,
2832     Sched<[WriteAdr, WriteST, ReadAdrBase]>;
2833 } // hasSideEffects = 0
2834
2835 // ISel pseudo-instructions which have the tied operands. When the MC lowering
2836 // logic finally gets smart enough to strip off tied operands that are just
2837 // for isel convenience, we can get rid of these pseudos and just reference
2838 // the real instructions directly.
2839 //
2840 // Ironically, also because of the writeback operands, we can't put the
2841 // matcher pattern directly on the instruction, but need to define it
2842 // separately.
2843 multiclass StorePostIdxPseudo<RegisterClass regtype, ValueType Ty,
2844                               SDPatternOperator OpNode, Instruction Insn> {
2845   let mayStore = 1, mayLoad = 0, hasSideEffects = 0 in
2846   def _isel: Pseudo<(outs GPR64sp:$wback),
2847                     (ins regtype:$Rt, am_noindex:$addr, simm9:$idx), [],
2848                     "$addr.base = $wback,@earlyclobber $wback">,
2849       PseudoInstExpansion<(Insn regtype:$Rt, am_noindex:$addr, simm9:$idx)>,
2850       Sched<[WriteAdr, WriteST, ReadAdrBase]>;
2851
2852   def : Pat<(OpNode (Ty regtype:$Rt), am_noindex:$addr, simm9:$idx),
2853             (!cast<Instruction>(NAME#_isel) regtype:$Rt, am_noindex:$addr,
2854                                             simm9:$idx)>;
2855 }
2856
2857 //---
2858 // Load/store pair
2859 //---
2860
2861 // (indexed, offset)
2862
2863 class BaseLoadStorePairOffset<bits<2> opc, bit V, bit L, dag oops, dag iops,
2864                               string asm>
2865     : I<oops, iops, asm, "\t$Rt, $Rt2, $addr", "", []> {
2866   // The operands are in order to match the 'addr' MI operands, so we
2867   // don't need an encoder method and by-name matching. Just use the default
2868   // in-order handling. Since we're using by-order, make sure the names
2869   // do not match.
2870   bits<5> dst;
2871   bits<5> dst2;
2872   bits<5> base;
2873   bits<7> offset;
2874   let Inst{31-30} = opc;
2875   let Inst{29-27} = 0b101;
2876   let Inst{26}    = V;
2877   let Inst{25-23} = 0b010;
2878   let Inst{22}    = L;
2879   let Inst{21-15} = offset;
2880   let Inst{14-10} = dst2;
2881   let Inst{9-5}   = base;
2882   let Inst{4-0}   = dst;
2883
2884   let DecoderMethod = "DecodePairLdStInstruction";
2885 }
2886
2887 let hasSideEffects = 0 in {
2888 let mayStore = 0, mayLoad = 1 in
2889 class LoadPairOffset<bits<2> opc, bit V, RegisterClass regtype,
2890                      Operand indextype, string asm>
2891     : BaseLoadStorePairOffset<opc, V, 1,
2892                               (outs regtype:$Rt, regtype:$Rt2),
2893                               (ins indextype:$addr), asm>,
2894       Sched<[WriteLD, WriteLDHi]>;
2895
2896 let mayLoad = 0, mayStore = 1 in
2897 class StorePairOffset<bits<2> opc, bit V, RegisterClass regtype,
2898                       Operand indextype, string asm>
2899     : BaseLoadStorePairOffset<opc, V, 0, (outs),
2900                              (ins regtype:$Rt, regtype:$Rt2, indextype:$addr),
2901                              asm>,
2902       Sched<[WriteSTP]>;
2903 } // hasSideEffects = 0
2904
2905 // (pre-indexed)
2906
2907 def MemoryIndexed32SImm7 : AsmOperandClass {
2908   let Name = "MemoryIndexed32SImm7";
2909   let DiagnosticType = "InvalidMemoryIndexed32SImm7";
2910 }
2911 def am_indexed32simm7 : Operand<i32> { // ComplexPattern<...>
2912   let PrintMethod = "printAMIndexed<32>";
2913   let ParserMatchClass = MemoryIndexed32SImm7;
2914   let MIOperandInfo = (ops GPR64sp:$base, i32imm:$offset);
2915 }
2916 def am_indexed32simm7_wb : Operand<i32> { // ComplexPattern<...>
2917   let PrintMethod = "printAMIndexedWB<32>";
2918   let ParserMatchClass = MemoryIndexed32SImm7;
2919   let MIOperandInfo = (ops GPR64sp:$base, i32imm:$offset);
2920 }
2921
2922 def MemoryIndexed64SImm7 : AsmOperandClass {
2923   let Name = "MemoryIndexed64SImm7";
2924   let DiagnosticType = "InvalidMemoryIndexed64SImm7";
2925 }
2926 def am_indexed64simm7 : Operand<i32> { // ComplexPattern<...>
2927   let PrintMethod = "printAMIndexed<64>";
2928   let ParserMatchClass = MemoryIndexed64SImm7;
2929   let MIOperandInfo = (ops GPR64sp:$base, i32imm:$offset);
2930 }
2931 def am_indexed64simm7_wb : Operand<i32> { // ComplexPattern<...>
2932   let PrintMethod = "printAMIndexedWB<64>";
2933   let ParserMatchClass = MemoryIndexed64SImm7;
2934   let MIOperandInfo = (ops GPR64sp:$base, i32imm:$offset);
2935 }
2936
2937 def MemoryIndexed128SImm7 : AsmOperandClass {
2938   let Name = "MemoryIndexed128SImm7";
2939   let DiagnosticType = "InvalidMemoryIndexed128SImm7";
2940 }
2941 def am_indexed128simm7 : Operand<i32> { // ComplexPattern<...>
2942   let PrintMethod = "printAMIndexed<128>";
2943   let ParserMatchClass = MemoryIndexed128SImm7;
2944   let MIOperandInfo = (ops GPR64sp:$base, i32imm:$offset);
2945 }
2946 def am_indexed128simm7_wb : Operand<i32> { // ComplexPattern<...>
2947   let PrintMethod = "printAMIndexedWB<128>";
2948   let ParserMatchClass = MemoryIndexed128SImm7;
2949   let MIOperandInfo = (ops GPR64sp:$base, i32imm:$offset);
2950 }
2951
2952 class BaseLoadStorePairPreIdx<bits<2> opc, bit V, bit L, dag oops, dag iops,
2953                               string asm>
2954     : I<oops, iops, asm, "\t$Rt, $Rt2, $addr!", "", []> {
2955   // The operands are in order to match the 'addr' MI operands, so we
2956   // don't need an encoder method and by-name matching. Just use the default
2957   // in-order handling. Since we're using by-order, make sure the names
2958   // do not match.
2959   bits<5> dst;
2960   bits<5> dst2;
2961   bits<5> base;
2962   bits<7> offset;
2963   let Inst{31-30} = opc;
2964   let Inst{29-27} = 0b101;
2965   let Inst{26}    = V;
2966   let Inst{25-23} = 0b011;
2967   let Inst{22}    = L;
2968   let Inst{21-15} = offset;
2969   let Inst{14-10} = dst2;
2970   let Inst{9-5}   = base;
2971   let Inst{4-0}   = dst;
2972
2973   let DecoderMethod = "DecodePairLdStInstruction";
2974 }
2975
2976 let hasSideEffects = 0 in {
2977 let mayStore = 0, mayLoad = 1 in
2978 class LoadPairPreIdx<bits<2> opc, bit V, RegisterClass regtype,
2979                      Operand addrmode, string asm>
2980     : BaseLoadStorePairPreIdx<opc, V, 1,
2981                               (outs regtype:$Rt, regtype:$Rt2),
2982                               (ins addrmode:$addr), asm>,
2983       Sched<[WriteLD, WriteLDHi, WriteAdr]>;
2984
2985 let mayStore = 1, mayLoad = 0 in
2986 class StorePairPreIdx<bits<2> opc, bit V, RegisterClass regtype,
2987                       Operand addrmode, string asm>
2988     : BaseLoadStorePairPreIdx<opc, V, 0, (outs),
2989                              (ins regtype:$Rt, regtype:$Rt2, addrmode:$addr),
2990                              asm>,
2991       Sched<[WriteAdr, WriteSTP]>;
2992 } // hasSideEffects = 0
2993
2994 // (post-indexed)
2995
2996 class BaseLoadStorePairPostIdx<bits<2> opc, bit V, bit L, dag oops, dag iops,
2997                               string asm>
2998     : I<oops, iops, asm, "\t$Rt, $Rt2, $addr, $idx", "", []> {
2999   // The operands are in order to match the 'addr' MI operands, so we
3000   // don't need an encoder method and by-name matching. Just use the default
3001   // in-order handling. Since we're using by-order, make sure the names
3002   // do not match.
3003   bits<5> dst;
3004   bits<5> dst2;
3005   bits<5> base;
3006   bits<7> offset;
3007   let Inst{31-30} = opc;
3008   let Inst{29-27} = 0b101;
3009   let Inst{26}    = V;
3010   let Inst{25-23} = 0b001;
3011   let Inst{22}    = L;
3012   let Inst{21-15} = offset;
3013   let Inst{14-10} = dst2;
3014   let Inst{9-5}   = base;
3015   let Inst{4-0}   = dst;
3016
3017   let DecoderMethod = "DecodePairLdStInstruction";
3018 }
3019
3020 let hasSideEffects = 0 in {
3021 let mayStore = 0, mayLoad = 1 in
3022 class LoadPairPostIdx<bits<2> opc, bit V, RegisterClass regtype,
3023                       Operand idxtype, string asm>
3024     : BaseLoadStorePairPostIdx<opc, V, 1,
3025                               (outs regtype:$Rt, regtype:$Rt2),
3026                               (ins am_noindex:$addr, idxtype:$idx), asm>,
3027       Sched<[WriteLD, WriteLDHi, WriteAdr]>;
3028
3029 let mayStore = 1, mayLoad = 0 in
3030 class StorePairPostIdx<bits<2> opc, bit V, RegisterClass regtype,
3031                        Operand idxtype, string asm>
3032     : BaseLoadStorePairPostIdx<opc, V, 0, (outs),
3033                              (ins regtype:$Rt, regtype:$Rt2,
3034                                   am_noindex:$addr, idxtype:$idx),
3035                              asm>,
3036       Sched<[WriteAdr, WriteSTP]>;
3037 } // hasSideEffects = 0
3038
3039 //  (no-allocate)
3040
3041 class BaseLoadStorePairNoAlloc<bits<2> opc, bit V, bit L, dag oops, dag iops,
3042                               string asm>
3043     : I<oops, iops, asm, "\t$Rt, $Rt2, $addr", "", []> {
3044   // The operands are in order to match the 'addr' MI operands, so we
3045   // don't need an encoder method and by-name matching. Just use the default
3046   // in-order handling. Since we're using by-order, make sure the names
3047   // do not match.
3048   bits<5> dst;
3049   bits<5> dst2;
3050   bits<5> base;
3051   bits<7> offset;
3052   let Inst{31-30} = opc;
3053   let Inst{29-27} = 0b101;
3054   let Inst{26}    = V;
3055   let Inst{25-23} = 0b000;
3056   let Inst{22}    = L;
3057   let Inst{21-15} = offset;
3058   let Inst{14-10} = dst2;
3059   let Inst{9-5}   = base;
3060   let Inst{4-0}   = dst;
3061
3062   let DecoderMethod = "DecodePairLdStInstruction";
3063 }
3064
3065 let hasSideEffects = 0 in {
3066 let mayStore = 0, mayLoad = 1 in
3067 class LoadPairNoAlloc<bits<2> opc, bit V, RegisterClass regtype,
3068                      Operand indextype, string asm>
3069     : BaseLoadStorePairNoAlloc<opc, V, 1,
3070                               (outs regtype:$Rt, regtype:$Rt2),
3071                               (ins indextype:$addr), asm>,
3072       Sched<[WriteLD, WriteLDHi]>;
3073
3074 let mayStore = 1, mayLoad = 0 in
3075 class StorePairNoAlloc<bits<2> opc, bit V, RegisterClass regtype,
3076                       Operand indextype, string asm>
3077     : BaseLoadStorePairNoAlloc<opc, V, 0, (outs),
3078                              (ins regtype:$Rt, regtype:$Rt2, indextype:$addr),
3079                              asm>,
3080       Sched<[WriteSTP]>;
3081 } // hasSideEffects = 0
3082
3083 //---
3084 // Load/store exclusive
3085 //---
3086
3087 // True exclusive operations write to and/or read from the system's exclusive
3088 // monitors, which as far as a compiler is concerned can be modelled as a
3089 // random shared memory address. Hence LoadExclusive mayStore.
3090 //
3091 // Since these instructions have the undefined register bits set to 1 in
3092 // their canonical form, we need a post encoder method to set those bits
3093 // to 1 when encoding these instructions. We do this using the
3094 // fixLoadStoreExclusive function. This function has template parameters:
3095 //
3096 // fixLoadStoreExclusive<int hasRs, int hasRt2>
3097 //
3098 // hasRs indicates that the instruction uses the Rs field, so we won't set
3099 // it to 1 (and the same for Rt2). We don't need template parameters for
3100 // the other register fields since Rt and Rn are always used.
3101 //
3102 let hasSideEffects = 1, mayLoad = 1, mayStore = 1 in
3103 class BaseLoadStoreExclusive<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3104                              dag oops, dag iops, string asm, string operands>
3105     : I<oops, iops, asm, operands, "", []> {
3106   let Inst{31-30} = sz;
3107   let Inst{29-24} = 0b001000;
3108   let Inst{23}    = o2;
3109   let Inst{22}    = L;
3110   let Inst{21}    = o1;
3111   let Inst{15}    = o0;
3112
3113   let DecoderMethod = "DecodeExclusiveLdStInstruction";
3114 }
3115
3116 // Neither Rs nor Rt2 operands.
3117 class LoadStoreExclusiveSimple<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3118                                dag oops, dag iops, string asm, string operands>
3119     : BaseLoadStoreExclusive<sz, o2, L, o1, o0, oops, iops, asm, operands> {
3120   bits<5> reg;
3121   bits<5> base;
3122   let Inst{9-5} = base;
3123   let Inst{4-0} = reg;
3124
3125   let PostEncoderMethod = "fixLoadStoreExclusive<0,0>";
3126 }
3127
3128 // Simple load acquires don't set the exclusive monitor
3129 let mayLoad = 1, mayStore = 0 in
3130 class LoadAcquire<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3131                   RegisterClass regtype, string asm>
3132     : LoadStoreExclusiveSimple<sz, o2, L, o1, o0, (outs regtype:$Rt),
3133                                (ins am_noindex:$addr), asm, "\t$Rt, $addr">,
3134       Sched<[WriteLD]>;
3135
3136 class LoadExclusive<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3137                     RegisterClass regtype, string asm>
3138     : LoadStoreExclusiveSimple<sz, o2, L, o1, o0, (outs regtype:$Rt),
3139                                (ins am_noindex:$addr), asm, "\t$Rt, $addr">,
3140       Sched<[WriteLD]>;
3141
3142 class LoadExclusivePair<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3143                        RegisterClass regtype, string asm>
3144     : BaseLoadStoreExclusive<sz, o2, L, o1, o0,
3145                              (outs regtype:$Rt, regtype:$Rt2),
3146                              (ins am_noindex:$addr), asm,
3147                              "\t$Rt, $Rt2, $addr">,
3148       Sched<[WriteLD, WriteLDHi]> {
3149   bits<5> dst1;
3150   bits<5> dst2;
3151   bits<5> base;
3152   let Inst{14-10} = dst2;
3153   let Inst{9-5} = base;
3154   let Inst{4-0} = dst1;
3155
3156   let PostEncoderMethod = "fixLoadStoreExclusive<0,1>";
3157 }
3158
3159 // Simple store release operations do not check the exclusive monitor.
3160 let mayLoad = 0, mayStore = 1 in
3161 class StoreRelease<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3162                    RegisterClass regtype, string asm>
3163     : LoadStoreExclusiveSimple<sz, o2, L, o1, o0, (outs),
3164                                (ins regtype:$Rt, am_noindex:$addr),
3165                                asm, "\t$Rt, $addr">,
3166       Sched<[WriteST]>;
3167
3168 let mayLoad = 1, mayStore = 1 in
3169 class StoreExclusive<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3170                      RegisterClass regtype, string asm>
3171     : BaseLoadStoreExclusive<sz, o2, L, o1, o0, (outs GPR32:$Ws),
3172                              (ins regtype:$Rt, am_noindex:$addr),
3173                              asm, "\t$Ws, $Rt, $addr">,
3174       Sched<[WriteSTX]> {
3175   bits<5> status;
3176   bits<5> reg;
3177   bits<5> base;
3178   let Inst{20-16} = status;
3179   let Inst{9-5} = base;
3180   let Inst{4-0} = reg;
3181
3182   let Constraints = "@earlyclobber $Ws";
3183   let PostEncoderMethod = "fixLoadStoreExclusive<1,0>";
3184 }
3185
3186 class StoreExclusivePair<bits<2> sz, bit o2, bit L, bit o1, bit o0,
3187                          RegisterClass regtype, string asm>
3188     : BaseLoadStoreExclusive<sz, o2, L, o1, o0,
3189                              (outs GPR32:$Ws),
3190                              (ins regtype:$Rt, regtype:$Rt2, am_noindex:$addr),
3191                               asm, "\t$Ws, $Rt, $Rt2, $addr">,
3192       Sched<[WriteSTX]> {
3193   bits<5> status;
3194   bits<5> dst1;
3195   bits<5> dst2;
3196   bits<5> base;
3197   let Inst{20-16} = status;
3198   let Inst{14-10} = dst2;
3199   let Inst{9-5} = base;
3200   let Inst{4-0} = dst1;
3201
3202   let Constraints = "@earlyclobber $Ws";
3203 }
3204
3205 //---
3206 // Exception generation
3207 //---
3208
3209 let mayLoad = 0, mayStore = 0, hasSideEffects = 1 in
3210 class ExceptionGeneration<bits<3> op1, bits<2> ll, string asm>
3211     : I<(outs), (ins imm0_65535:$imm), asm, "\t$imm", "", []>,
3212       Sched<[WriteSys]> {
3213   bits<16> imm;
3214   let Inst{31-24} = 0b11010100;
3215   let Inst{23-21} = op1;
3216   let Inst{20-5}  = imm;
3217   let Inst{4-2}   = 0b000;
3218   let Inst{1-0}   = ll;
3219 }
3220
3221 let Predicates = [HasFPARMv8] in {
3222
3223 //---
3224 // Floating point to integer conversion
3225 //---
3226
3227 class BaseFPToIntegerUnscaled<bits<2> type, bits<2> rmode, bits<3> opcode,
3228                       RegisterClass srcType, RegisterClass dstType,
3229                       string asm, list<dag> pattern>
3230     : I<(outs dstType:$Rd), (ins srcType:$Rn),
3231          asm, "\t$Rd, $Rn", "", pattern>,
3232       Sched<[WriteFCvt]> {
3233   bits<5> Rd;
3234   bits<5> Rn;
3235   let Inst{30-29} = 0b00;
3236   let Inst{28-24} = 0b11110;
3237   let Inst{23-22} = type;
3238   let Inst{21}    = 1;
3239   let Inst{20-19} = rmode;
3240   let Inst{18-16} = opcode;
3241   let Inst{15-10} = 0;
3242   let Inst{9-5}   = Rn;
3243   let Inst{4-0}   = Rd;
3244 }
3245
3246 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3247 class BaseFPToInteger<bits<2> type, bits<2> rmode, bits<3> opcode,
3248                       RegisterClass srcType, RegisterClass dstType,
3249                       Operand immType, string asm, list<dag> pattern>
3250     : I<(outs dstType:$Rd), (ins srcType:$Rn, immType:$scale),
3251          asm, "\t$Rd, $Rn, $scale", "", pattern>,
3252       Sched<[WriteFCvt]> {
3253   bits<5> Rd;
3254   bits<5> Rn;
3255   bits<6> scale;
3256   let Inst{30-29} = 0b00;
3257   let Inst{28-24} = 0b11110;
3258   let Inst{23-22} = type;
3259   let Inst{21}    = 0;
3260   let Inst{20-19} = rmode;
3261   let Inst{18-16} = opcode;
3262   let Inst{15-10} = scale;
3263   let Inst{9-5}   = Rn;
3264   let Inst{4-0}   = Rd;
3265 }
3266
3267 multiclass FPToIntegerUnscaled<bits<2> rmode, bits<3> opcode, string asm,
3268            SDPatternOperator OpN> {
3269   // Unscaled single-precision to 32-bit
3270   def UWSr : BaseFPToIntegerUnscaled<0b00, rmode, opcode, FPR32, GPR32, asm,
3271                                      [(set GPR32:$Rd, (OpN FPR32:$Rn))]> {
3272     let Inst{31} = 0; // 32-bit GPR flag
3273   }
3274
3275   // Unscaled single-precision to 64-bit
3276   def UXSr : BaseFPToIntegerUnscaled<0b00, rmode, opcode, FPR32, GPR64, asm,
3277                                      [(set GPR64:$Rd, (OpN FPR32:$Rn))]> {
3278     let Inst{31} = 1; // 64-bit GPR flag
3279   }
3280
3281   // Unscaled double-precision to 32-bit
3282   def UWDr : BaseFPToIntegerUnscaled<0b01, rmode, opcode, FPR64, GPR32, asm,
3283                                      [(set GPR32:$Rd, (OpN (f64 FPR64:$Rn)))]> {
3284     let Inst{31} = 0; // 32-bit GPR flag
3285   }
3286
3287   // Unscaled double-precision to 64-bit
3288   def UXDr : BaseFPToIntegerUnscaled<0b01, rmode, opcode, FPR64, GPR64, asm,
3289                                      [(set GPR64:$Rd, (OpN (f64 FPR64:$Rn)))]> {
3290     let Inst{31} = 1; // 64-bit GPR flag
3291   }
3292 }
3293
3294 multiclass FPToIntegerScaled<bits<2> rmode, bits<3> opcode, string asm,
3295                              SDPatternOperator OpN> {
3296   // Scaled single-precision to 32-bit
3297   def SWSri : BaseFPToInteger<0b00, rmode, opcode, FPR32, GPR32,
3298                               fixedpoint_f32_i32, asm,
3299               [(set GPR32:$Rd, (OpN (fmul FPR32:$Rn,
3300                                           fixedpoint_f32_i32:$scale)))]> {
3301     let Inst{31} = 0; // 32-bit GPR flag
3302     let scale{5} = 1;
3303   }
3304
3305   // Scaled single-precision to 64-bit
3306   def SXSri : BaseFPToInteger<0b00, rmode, opcode, FPR32, GPR64,
3307                               fixedpoint_f32_i64, asm,
3308               [(set GPR64:$Rd, (OpN (fmul FPR32:$Rn,
3309                                           fixedpoint_f32_i64:$scale)))]> {
3310     let Inst{31} = 1; // 64-bit GPR flag
3311   }
3312
3313   // Scaled double-precision to 32-bit
3314   def SWDri : BaseFPToInteger<0b01, rmode, opcode, FPR64, GPR32,
3315                               fixedpoint_f64_i32, asm,
3316               [(set GPR32:$Rd, (OpN (fmul FPR64:$Rn,
3317                                           fixedpoint_f64_i32:$scale)))]> {
3318     let Inst{31} = 0; // 32-bit GPR flag
3319     let scale{5} = 1;
3320   }
3321
3322   // Scaled double-precision to 64-bit
3323   def SXDri : BaseFPToInteger<0b01, rmode, opcode, FPR64, GPR64,
3324                               fixedpoint_f64_i64, asm,
3325               [(set GPR64:$Rd, (OpN (fmul FPR64:$Rn,
3326                                           fixedpoint_f64_i64:$scale)))]> {
3327     let Inst{31} = 1; // 64-bit GPR flag
3328   }
3329 }
3330
3331 //---
3332 // Integer to floating point conversion
3333 //---
3334
3335 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
3336 class BaseIntegerToFP<bit isUnsigned,
3337                       RegisterClass srcType, RegisterClass dstType,
3338                       Operand immType, string asm, list<dag> pattern>
3339     : I<(outs dstType:$Rd), (ins srcType:$Rn, immType:$scale),
3340          asm, "\t$Rd, $Rn, $scale", "", pattern>,
3341       Sched<[WriteFCvt]> {
3342   bits<5> Rd;
3343   bits<5> Rn;
3344   bits<6> scale;
3345   let Inst{30-23} = 0b00111100;
3346   let Inst{21-17} = 0b00001;
3347   let Inst{16}    = isUnsigned;
3348   let Inst{15-10} = scale;
3349   let Inst{9-5}   = Rn;
3350   let Inst{4-0}   = Rd;
3351 }
3352
3353 class BaseIntegerToFPUnscaled<bit isUnsigned,
3354                       RegisterClass srcType, RegisterClass dstType,
3355                       ValueType dvt, string asm, SDNode node>
3356     : I<(outs dstType:$Rd), (ins srcType:$Rn),
3357          asm, "\t$Rd, $Rn", "", [(set (dvt dstType:$Rd), (node srcType:$Rn))]>,
3358       Sched<[WriteFCvt]> {
3359   bits<5> Rd;
3360   bits<5> Rn;
3361   bits<6> scale;
3362   let Inst{30-23} = 0b00111100;
3363   let Inst{21-17} = 0b10001;
3364   let Inst{16}    = isUnsigned;
3365   let Inst{15-10} = 0b000000;
3366   let Inst{9-5}   = Rn;
3367   let Inst{4-0}   = Rd;
3368 }
3369
3370 multiclass IntegerToFP<bit isUnsigned, string asm, SDNode node> {
3371   // Unscaled
3372   def UWSri: BaseIntegerToFPUnscaled<isUnsigned, GPR32, FPR32, f32, asm, node> {
3373     let Inst{31} = 0; // 32-bit GPR flag
3374     let Inst{22} = 0; // 32-bit FPR flag
3375   }
3376
3377   def UWDri: BaseIntegerToFPUnscaled<isUnsigned, GPR32, FPR64, f64, asm, node> {
3378     let Inst{31} = 0; // 32-bit GPR flag
3379     let Inst{22} = 1; // 64-bit FPR flag
3380   }
3381
3382   def UXSri: BaseIntegerToFPUnscaled<isUnsigned, GPR64, FPR32, f32, asm, node> {
3383     let Inst{31} = 1; // 64-bit GPR flag
3384     let Inst{22} = 0; // 32-bit FPR flag
3385   }
3386
3387   def UXDri: BaseIntegerToFPUnscaled<isUnsigned, GPR64, FPR64, f64, asm, node> {
3388     let Inst{31} = 1; // 64-bit GPR flag
3389     let Inst{22} = 1; // 64-bit FPR flag
3390   }
3391
3392   // Scaled
3393   def SWSri: BaseIntegerToFP<isUnsigned, GPR32, FPR32, fixedpoint_f32_i32, asm,
3394                              [(set FPR32:$Rd,
3395                                    (fdiv (node GPR32:$Rn),
3396                                          fixedpoint_f32_i32:$scale))]> {
3397     let Inst{31} = 0; // 32-bit GPR flag
3398     let Inst{22} = 0; // 32-bit FPR flag
3399     let scale{5} = 1;
3400   }
3401
3402   def SWDri: BaseIntegerToFP<isUnsigned, GPR32, FPR64, fixedpoint_f64_i32, asm,
3403                              [(set FPR64:$Rd,
3404                                    (fdiv (node GPR32:$Rn),
3405                                          fixedpoint_f64_i32:$scale))]> {
3406     let Inst{31} = 0; // 32-bit GPR flag
3407     let Inst{22} = 1; // 64-bit FPR flag
3408     let scale{5} = 1;
3409   }
3410
3411   def SXSri: BaseIntegerToFP<isUnsigned, GPR64, FPR32, fixedpoint_f32_i64, asm,
3412                              [(set FPR32:$Rd,
3413                                    (fdiv (node GPR64:$Rn),
3414                                          fixedpoint_f32_i64:$scale))]> {
3415     let Inst{31} = 1; // 64-bit GPR flag
3416     let Inst{22} = 0; // 32-bit FPR flag
3417   }
3418
3419   def SXDri: BaseIntegerToFP<isUnsigned, GPR64, FPR64, fixedpoint_f64_i64, asm,
3420                              [(set FPR64:$Rd,
3421                                    (fdiv (node GPR64:$Rn),
3422                                          fixedpoint_f64_i64:$scale))]> {
3423     let Inst{31} = 1; // 64-bit GPR flag
3424     let Inst{22} = 1; // 64-bit FPR flag
3425   }
3426 }
3427
3428 //---
3429 // Unscaled integer <-> floating point conversion (i.e. FMOV)
3430 //---
3431
3432 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3433 class BaseUnscaledConversion<bits<2> rmode, bits<3> opcode,
3434                       RegisterClass srcType, RegisterClass dstType,
3435                       string asm>
3436     : I<(outs dstType:$Rd), (ins srcType:$Rn), asm, "\t$Rd, $Rn", "",
3437         // We use COPY_TO_REGCLASS for these bitconvert operations.
3438         // copyPhysReg() expands the resultant COPY instructions after
3439         // regalloc is done. This gives greater freedom for the allocator
3440         // and related passes (coalescing, copy propagation, et. al.) to
3441         // be more effective.
3442         [/*(set (dvt dstType:$Rd), (bitconvert (svt srcType:$Rn)))*/]>,
3443       Sched<[WriteFCopy]> {
3444   bits<5> Rd;
3445   bits<5> Rn;
3446   let Inst{30-23} = 0b00111100;
3447   let Inst{21}    = 1;
3448   let Inst{20-19} = rmode;
3449   let Inst{18-16} = opcode;
3450   let Inst{15-10} = 0b000000;
3451   let Inst{9-5}   = Rn;
3452   let Inst{4-0}   = Rd;
3453 }
3454
3455 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3456 class BaseUnscaledConversionToHigh<bits<2> rmode, bits<3> opcode,
3457                      RegisterClass srcType, RegisterOperand dstType, string asm,
3458                      string kind>
3459     : I<(outs dstType:$Rd), (ins srcType:$Rn, VectorIndex1:$idx), asm,
3460         "{\t$Rd"#kind#"$idx, $Rn|"#kind#"\t$Rd$idx, $Rn}", "", []>,
3461       Sched<[WriteFCopy]> {
3462   bits<5> Rd;
3463   bits<5> Rn;
3464   let Inst{30-23} = 0b00111101;
3465   let Inst{21}    = 1;
3466   let Inst{20-19} = rmode;
3467   let Inst{18-16} = opcode;
3468   let Inst{15-10} = 0b000000;
3469   let Inst{9-5}   = Rn;
3470   let Inst{4-0}   = Rd;
3471
3472   let DecoderMethod =  "DecodeFMOVLaneInstruction";
3473 }
3474
3475 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3476 class BaseUnscaledConversionFromHigh<bits<2> rmode, bits<3> opcode,
3477                      RegisterOperand srcType, RegisterClass dstType, string asm,
3478                      string kind>
3479     : I<(outs dstType:$Rd), (ins srcType:$Rn, VectorIndex1:$idx), asm,
3480         "{\t$Rd, $Rn"#kind#"$idx|"#kind#"\t$Rd, $Rn$idx}", "", []>,
3481       Sched<[WriteFCopy]> {
3482   bits<5> Rd;
3483   bits<5> Rn;
3484   let Inst{30-23} = 0b00111101;
3485   let Inst{21}    = 1;
3486   let Inst{20-19} = rmode;
3487   let Inst{18-16} = opcode;
3488   let Inst{15-10} = 0b000000;
3489   let Inst{9-5}   = Rn;
3490   let Inst{4-0}   = Rd;
3491
3492   let DecoderMethod =  "DecodeFMOVLaneInstruction";
3493 }
3494
3495
3496
3497 multiclass UnscaledConversion<string asm> {
3498   def WSr : BaseUnscaledConversion<0b00, 0b111, GPR32, FPR32, asm> {
3499     let Inst{31} = 0; // 32-bit GPR flag
3500     let Inst{22} = 0; // 32-bit FPR flag
3501   }
3502
3503   def XDr : BaseUnscaledConversion<0b00, 0b111, GPR64, FPR64, asm> {
3504     let Inst{31} = 1; // 64-bit GPR flag
3505     let Inst{22} = 1; // 64-bit FPR flag
3506   }
3507
3508   def SWr : BaseUnscaledConversion<0b00, 0b110, FPR32, GPR32, asm> {
3509     let Inst{31} = 0; // 32-bit GPR flag
3510     let Inst{22} = 0; // 32-bit FPR flag
3511   }
3512
3513   def DXr : BaseUnscaledConversion<0b00, 0b110, FPR64, GPR64, asm> {
3514     let Inst{31} = 1; // 64-bit GPR flag
3515     let Inst{22} = 1; // 64-bit FPR flag
3516   }
3517
3518   def XDHighr : BaseUnscaledConversionToHigh<0b01, 0b111, GPR64, V128,
3519                                              asm, ".d"> {
3520     let Inst{31} = 1;
3521     let Inst{22} = 0;
3522   }
3523
3524   def DXHighr : BaseUnscaledConversionFromHigh<0b01, 0b110, V128, GPR64,
3525                                                asm, ".d"> {
3526     let Inst{31} = 1;
3527     let Inst{22} = 0;
3528   }
3529 }
3530
3531 //---
3532 // Floating point conversion
3533 //---
3534
3535 class BaseFPConversion<bits<2> type, bits<2> opcode, RegisterClass dstType,
3536                        RegisterClass srcType, string asm, list<dag> pattern>
3537     : I<(outs dstType:$Rd), (ins srcType:$Rn), asm, "\t$Rd, $Rn", "", pattern>,
3538       Sched<[WriteFCvt]> {
3539   bits<5> Rd;
3540   bits<5> Rn;
3541   let Inst{31-24} = 0b00011110;
3542   let Inst{23-22} = type;
3543   let Inst{21-17} = 0b10001;
3544   let Inst{16-15} = opcode;
3545   let Inst{14-10} = 0b10000;
3546   let Inst{9-5}   = Rn;
3547   let Inst{4-0}   = Rd;
3548 }
3549
3550 multiclass FPConversion<string asm> {
3551   // Double-precision to Half-precision
3552   def HDr : BaseFPConversion<0b01, 0b11, FPR16, FPR64, asm,
3553                              [(set FPR16:$Rd, (fround FPR64:$Rn))]>;
3554
3555   // Double-precision to Single-precision
3556   def SDr : BaseFPConversion<0b01, 0b00, FPR32, FPR64, asm,
3557                              [(set FPR32:$Rd, (fround FPR64:$Rn))]>;
3558
3559   // Half-precision to Double-precision
3560   def DHr : BaseFPConversion<0b11, 0b01, FPR64, FPR16, asm,
3561                              [(set FPR64:$Rd, (fextend FPR16:$Rn))]>;
3562
3563   // Half-precision to Single-precision
3564   def SHr : BaseFPConversion<0b11, 0b00, FPR32, FPR16, asm,
3565                              [(set FPR32:$Rd, (fextend FPR16:$Rn))]>;
3566
3567   // Single-precision to Double-precision
3568   def DSr : BaseFPConversion<0b00, 0b01, FPR64, FPR32, asm,
3569                              [(set FPR64:$Rd, (fextend FPR32:$Rn))]>;
3570
3571   // Single-precision to Half-precision
3572   def HSr : BaseFPConversion<0b00, 0b11, FPR16, FPR32, asm,
3573                              [(set FPR16:$Rd, (fround FPR32:$Rn))]>;
3574 }
3575
3576 //---
3577 // Single operand floating point data processing
3578 //---
3579
3580 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3581 class BaseSingleOperandFPData<bits<4> opcode, RegisterClass regtype,
3582                               ValueType vt, string asm, SDPatternOperator node>
3583     : I<(outs regtype:$Rd), (ins regtype:$Rn), asm, "\t$Rd, $Rn", "",
3584          [(set (vt regtype:$Rd), (node (vt regtype:$Rn)))]>,
3585       Sched<[WriteF]> {
3586   bits<5> Rd;
3587   bits<5> Rn;
3588   let Inst{31-23} = 0b000111100;
3589   let Inst{21-19} = 0b100;
3590   let Inst{18-15} = opcode;
3591   let Inst{14-10} = 0b10000;
3592   let Inst{9-5}   = Rn;
3593   let Inst{4-0}   = Rd;
3594 }
3595
3596 multiclass SingleOperandFPData<bits<4> opcode, string asm,
3597                                SDPatternOperator node = null_frag> {
3598   def Sr : BaseSingleOperandFPData<opcode, FPR32, f32, asm, node> {
3599     let Inst{22} = 0; // 32-bit size flag
3600   }
3601
3602   def Dr : BaseSingleOperandFPData<opcode, FPR64, f64, asm, node> {
3603     let Inst{22} = 1; // 64-bit size flag
3604   }
3605 }
3606
3607 //---
3608 // Two operand floating point data processing
3609 //---
3610
3611 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3612 class BaseTwoOperandFPData<bits<4> opcode, RegisterClass regtype,
3613                            string asm, list<dag> pat>
3614     : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm),
3615          asm, "\t$Rd, $Rn, $Rm", "", pat>,
3616       Sched<[WriteF]> {
3617   bits<5> Rd;
3618   bits<5> Rn;
3619   bits<5> Rm;
3620   let Inst{31-23} = 0b000111100;
3621   let Inst{21}    = 1;
3622   let Inst{20-16} = Rm;
3623   let Inst{15-12} = opcode;
3624   let Inst{11-10} = 0b10;
3625   let Inst{9-5}   = Rn;
3626   let Inst{4-0}   = Rd;
3627 }
3628
3629 multiclass TwoOperandFPData<bits<4> opcode, string asm,
3630                             SDPatternOperator node = null_frag> {
3631   def Srr : BaseTwoOperandFPData<opcode, FPR32, asm,
3632                          [(set (f32 FPR32:$Rd),
3633                                (node (f32 FPR32:$Rn), (f32 FPR32:$Rm)))]> {
3634     let Inst{22} = 0; // 32-bit size flag
3635   }
3636
3637   def Drr : BaseTwoOperandFPData<opcode, FPR64, asm,
3638                          [(set (f64 FPR64:$Rd),
3639                                (node (f64 FPR64:$Rn), (f64 FPR64:$Rm)))]> {
3640     let Inst{22} = 1; // 64-bit size flag
3641   }
3642 }
3643
3644 multiclass TwoOperandFPDataNeg<bits<4> opcode, string asm, SDNode node> {
3645   def Srr : BaseTwoOperandFPData<opcode, FPR32, asm,
3646                   [(set FPR32:$Rd, (fneg (node FPR32:$Rn, (f32 FPR32:$Rm))))]> {
3647     let Inst{22} = 0; // 32-bit size flag
3648   }
3649
3650   def Drr : BaseTwoOperandFPData<opcode, FPR64, asm,
3651                   [(set FPR64:$Rd, (fneg (node FPR64:$Rn, (f64 FPR64:$Rm))))]> {
3652     let Inst{22} = 1; // 64-bit size flag
3653   }
3654 }
3655
3656
3657 //---
3658 // Three operand floating point data processing
3659 //---
3660
3661 class BaseThreeOperandFPData<bit isNegated, bit isSub,
3662                              RegisterClass regtype, string asm, list<dag> pat>
3663     : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm, regtype: $Ra),
3664          asm, "\t$Rd, $Rn, $Rm, $Ra", "", pat>,
3665       Sched<[WriteFMul]> {
3666   bits<5> Rd;
3667   bits<5> Rn;
3668   bits<5> Rm;
3669   bits<5> Ra;
3670   let Inst{31-23} = 0b000111110;
3671   let Inst{21}    = isNegated;
3672   let Inst{20-16} = Rm;
3673   let Inst{15}    = isSub;
3674   let Inst{14-10} = Ra;
3675   let Inst{9-5}   = Rn;
3676   let Inst{4-0}   = Rd;
3677 }
3678
3679 multiclass ThreeOperandFPData<bit isNegated, bit isSub,string asm,
3680                               SDPatternOperator node> {
3681   def Srrr : BaseThreeOperandFPData<isNegated, isSub, FPR32, asm,
3682             [(set FPR32:$Rd,
3683                   (node (f32 FPR32:$Rn), (f32 FPR32:$Rm), (f32 FPR32:$Ra)))]> {
3684     let Inst{22} = 0; // 32-bit size flag
3685   }
3686
3687   def Drrr : BaseThreeOperandFPData<isNegated, isSub, FPR64, asm,
3688             [(set FPR64:$Rd,
3689                   (node (f64 FPR64:$Rn), (f64 FPR64:$Rm), (f64 FPR64:$Ra)))]> {
3690     let Inst{22} = 1; // 64-bit size flag
3691   }
3692 }
3693
3694 //---
3695 // Floating point data comparisons
3696 //---
3697
3698 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3699 class BaseOneOperandFPComparison<bit signalAllNans,
3700                                  RegisterClass regtype, string asm,
3701                                  list<dag> pat>
3702     : I<(outs), (ins regtype:$Rn), asm, "\t$Rn, #0.0", "", pat>,
3703       Sched<[WriteFCmp]> {
3704   bits<5> Rn;
3705   let Inst{31-23} = 0b000111100;
3706   let Inst{21}    = 1;
3707
3708   let Inst{15-10} = 0b001000;
3709   let Inst{9-5}   = Rn;
3710   let Inst{4}     = signalAllNans;
3711   let Inst{3-0}   = 0b1000;
3712
3713   // Rm should be 0b00000 canonically, but we need to accept any value.
3714   let PostEncoderMethod = "fixOneOperandFPComparison";
3715 }
3716
3717 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3718 class BaseTwoOperandFPComparison<bit signalAllNans, RegisterClass regtype,
3719                                 string asm, list<dag> pat>
3720     : I<(outs), (ins regtype:$Rn, regtype:$Rm), asm, "\t$Rn, $Rm", "", pat>,
3721       Sched<[WriteFCmp]> {
3722   bits<5> Rm;
3723   bits<5> Rn;
3724   let Inst{31-23} = 0b000111100;
3725   let Inst{21}    = 1;
3726   let Inst{20-16} = Rm;
3727   let Inst{15-10} = 0b001000;
3728   let Inst{9-5}   = Rn;
3729   let Inst{4}     = signalAllNans;
3730   let Inst{3-0}   = 0b0000;
3731 }
3732
3733 multiclass FPComparison<bit signalAllNans, string asm,
3734                         SDPatternOperator OpNode = null_frag> {
3735   let Defs = [NZCV] in {
3736   def Srr : BaseTwoOperandFPComparison<signalAllNans, FPR32, asm,
3737       [(OpNode FPR32:$Rn, (f32 FPR32:$Rm)), (implicit NZCV)]> {
3738     let Inst{22} = 0;
3739   }
3740
3741   def Sri : BaseOneOperandFPComparison<signalAllNans, FPR32, asm,
3742       [(OpNode (f32 FPR32:$Rn), fpimm0), (implicit NZCV)]> {
3743     let Inst{22} = 0;
3744   }
3745
3746   def Drr : BaseTwoOperandFPComparison<signalAllNans, FPR64, asm,
3747       [(OpNode FPR64:$Rn, (f64 FPR64:$Rm)), (implicit NZCV)]> {
3748     let Inst{22} = 1;
3749   }
3750
3751   def Dri : BaseOneOperandFPComparison<signalAllNans, FPR64, asm,
3752       [(OpNode (f64 FPR64:$Rn), fpimm0), (implicit NZCV)]> {
3753     let Inst{22} = 1;
3754   }
3755   } // Defs = [NZCV]
3756 }
3757
3758 //---
3759 // Floating point conditional comparisons
3760 //---
3761
3762 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3763 class BaseFPCondComparison<bit signalAllNans,
3764                               RegisterClass regtype, string asm>
3765     : I<(outs), (ins regtype:$Rn, regtype:$Rm, imm0_15:$nzcv, ccode:$cond),
3766          asm, "\t$Rn, $Rm, $nzcv, $cond", "", []>,
3767       Sched<[WriteFCmp]> {
3768   bits<5> Rn;
3769   bits<5> Rm;
3770   bits<4> nzcv;
3771   bits<4> cond;
3772
3773   let Inst{31-23} = 0b000111100;
3774   let Inst{21}    = 1;
3775   let Inst{20-16} = Rm;
3776   let Inst{15-12} = cond;
3777   let Inst{11-10} = 0b01;
3778   let Inst{9-5}   = Rn;
3779   let Inst{4}     = signalAllNans;
3780   let Inst{3-0}   = nzcv;
3781 }
3782
3783 multiclass FPCondComparison<bit signalAllNans, string asm> {
3784   let Defs = [NZCV], Uses = [NZCV] in {
3785   def Srr : BaseFPCondComparison<signalAllNans, FPR32, asm> {
3786     let Inst{22} = 0;
3787   }
3788
3789   def Drr : BaseFPCondComparison<signalAllNans, FPR64, asm> {
3790     let Inst{22} = 1;
3791   }
3792   } // Defs = [NZCV], Uses = [NZCV]
3793 }
3794
3795 //---
3796 // Floating point conditional select
3797 //---
3798
3799 class BaseFPCondSelect<RegisterClass regtype, ValueType vt, string asm>
3800     : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm, ccode:$cond),
3801          asm, "\t$Rd, $Rn, $Rm, $cond", "",
3802          [(set regtype:$Rd,
3803                (ARM64csel (vt regtype:$Rn), regtype:$Rm,
3804                           (i32 imm:$cond), NZCV))]>,
3805       Sched<[WriteF]> {
3806   bits<5> Rd;
3807   bits<5> Rn;
3808   bits<5> Rm;
3809   bits<4> cond;
3810
3811   let Inst{31-23} = 0b000111100;
3812   let Inst{21}    = 1;
3813   let Inst{20-16} = Rm;
3814   let Inst{15-12} = cond;
3815   let Inst{11-10} = 0b11;
3816   let Inst{9-5}   = Rn;
3817   let Inst{4-0}   = Rd;
3818 }
3819
3820 multiclass FPCondSelect<string asm> {
3821   let Uses = [NZCV] in {
3822   def Srrr : BaseFPCondSelect<FPR32, f32, asm> {
3823     let Inst{22} = 0;
3824   }
3825
3826   def Drrr : BaseFPCondSelect<FPR64, f64, asm> {
3827     let Inst{22} = 1;
3828   }
3829   } // Uses = [NZCV]
3830 }
3831
3832 //---
3833 // Floating move immediate
3834 //---
3835
3836 class BaseFPMoveImmediate<RegisterClass regtype, Operand fpimmtype, string asm>
3837   : I<(outs regtype:$Rd), (ins fpimmtype:$imm), asm, "\t$Rd, $imm", "",
3838       [(set regtype:$Rd, fpimmtype:$imm)]>,
3839     Sched<[WriteFImm]> {
3840   bits<5> Rd;
3841   bits<8> imm;
3842   let Inst{31-23} = 0b000111100;
3843   let Inst{21}    = 1;
3844   let Inst{20-13} = imm;
3845   let Inst{12-5}  = 0b10000000;
3846   let Inst{4-0}   = Rd;
3847 }
3848
3849 multiclass FPMoveImmediate<string asm> {
3850   def Si : BaseFPMoveImmediate<FPR32, fpimm32, asm> {
3851     let Inst{22} = 0;
3852   }
3853
3854   def Di : BaseFPMoveImmediate<FPR64, fpimm64, asm> {
3855     let Inst{22} = 1;
3856   }
3857 }
3858 } // end of 'let Predicates = [HasFPARMv8]'
3859
3860 //----------------------------------------------------------------------------
3861 // AdvSIMD
3862 //----------------------------------------------------------------------------
3863
3864 def MemorySIMDNoIndexOperand : AsmOperandClass {
3865   let Name = "MemorySIMDNoIndex";
3866   let ParserMethod = "tryParseNoIndexMemory";
3867 }
3868 def am_simdnoindex : Operand<i64>,
3869                      ComplexPattern<i64, 1, "SelectAddrModeNoIndex", []> {
3870   let PrintMethod = "printAMNoIndex";
3871   let ParserMatchClass = MemorySIMDNoIndexOperand;
3872   let MIOperandInfo = (ops GPR64sp:$base);
3873   let DecoderMethod = "DecodeGPR64spRegisterClass";
3874 }
3875
3876 let Predicates = [HasNEON] in {
3877
3878 //----------------------------------------------------------------------------
3879 // AdvSIMD three register vector instructions
3880 //----------------------------------------------------------------------------
3881
3882 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3883 class BaseSIMDThreeSameVector<bit Q, bit U, bits<2> size, bits<5> opcode,
3884                         RegisterOperand regtype, string asm, string kind,
3885                         list<dag> pattern>
3886   : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm), asm,
3887       "{\t$Rd" # kind # ", $Rn" # kind # ", $Rm" # kind #
3888       "|" # kind # "\t$Rd, $Rn, $Rm|}", "", pattern>,
3889     Sched<[WriteV]> {
3890   bits<5> Rd;
3891   bits<5> Rn;
3892   bits<5> Rm;
3893   let Inst{31}    = 0;
3894   let Inst{30}    = Q;
3895   let Inst{29}    = U;
3896   let Inst{28-24} = 0b01110;
3897   let Inst{23-22} = size;
3898   let Inst{21}    = 1;
3899   let Inst{20-16} = Rm;
3900   let Inst{15-11} = opcode;
3901   let Inst{10}    = 1;
3902   let Inst{9-5}   = Rn;
3903   let Inst{4-0}   = Rd;
3904 }
3905
3906 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
3907 class BaseSIMDThreeSameVectorTied<bit Q, bit U, bits<2> size, bits<5> opcode,
3908                         RegisterOperand regtype, string asm, string kind,
3909                         list<dag> pattern>
3910   : I<(outs regtype:$dst), (ins regtype:$Rd, regtype:$Rn, regtype:$Rm), asm,
3911       "{\t$Rd" # kind # ", $Rn" # kind # ", $Rm" # kind #
3912       "|" # kind # "\t$Rd, $Rn, $Rm}", "$Rd = $dst", pattern>,
3913     Sched<[WriteV]> {
3914   bits<5> Rd;
3915   bits<5> Rn;
3916   bits<5> Rm;
3917   let Inst{31}    = 0;
3918   let Inst{30}    = Q;
3919   let Inst{29}    = U;
3920   let Inst{28-24} = 0b01110;
3921   let Inst{23-22} = size;
3922   let Inst{21}    = 1;
3923   let Inst{20-16} = Rm;
3924   let Inst{15-11} = opcode;
3925   let Inst{10}    = 1;
3926   let Inst{9-5}   = Rn;
3927   let Inst{4-0}   = Rd;
3928 }
3929
3930 // All operand sizes distinguished in the encoding.
3931 multiclass SIMDThreeSameVector<bit U, bits<5> opc, string asm,
3932                                SDPatternOperator OpNode> {
3933   def v8i8  : BaseSIMDThreeSameVector<0, U, 0b00, opc, V64,
3934                                       asm, ".8b",
3935          [(set (v8i8 V64:$Rd), (OpNode (v8i8 V64:$Rn), (v8i8 V64:$Rm)))]>;
3936   def v16i8 : BaseSIMDThreeSameVector<1, U, 0b00, opc, V128,
3937                                       asm, ".16b",
3938          [(set (v16i8 V128:$Rd), (OpNode (v16i8 V128:$Rn), (v16i8 V128:$Rm)))]>;
3939   def v4i16 : BaseSIMDThreeSameVector<0, U, 0b01, opc, V64,
3940                                       asm, ".4h",
3941          [(set (v4i16 V64:$Rd), (OpNode (v4i16 V64:$Rn), (v4i16 V64:$Rm)))]>;
3942   def v8i16 : BaseSIMDThreeSameVector<1, U, 0b01, opc, V128,
3943                                       asm, ".8h",
3944          [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn), (v8i16 V128:$Rm)))]>;
3945   def v2i32 : BaseSIMDThreeSameVector<0, U, 0b10, opc, V64,
3946                                       asm, ".2s",
3947          [(set (v2i32 V64:$Rd), (OpNode (v2i32 V64:$Rn), (v2i32 V64:$Rm)))]>;
3948   def v4i32 : BaseSIMDThreeSameVector<1, U, 0b10, opc, V128,
3949                                       asm, ".4s",
3950          [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn), (v4i32 V128:$Rm)))]>;
3951   def v2i64 : BaseSIMDThreeSameVector<1, U, 0b11, opc, V128,
3952                                       asm, ".2d",
3953          [(set (v2i64 V128:$Rd), (OpNode (v2i64 V128:$Rn), (v2i64 V128:$Rm)))]>;
3954 }
3955
3956 // As above, but D sized elements unsupported.
3957 multiclass SIMDThreeSameVectorBHS<bit U, bits<5> opc, string asm,
3958                                   SDPatternOperator OpNode> {
3959   def v8i8  : BaseSIMDThreeSameVector<0, U, 0b00, opc, V64,
3960                                       asm, ".8b",
3961         [(set V64:$Rd, (v8i8 (OpNode (v8i8 V64:$Rn), (v8i8 V64:$Rm))))]>;
3962   def v16i8 : BaseSIMDThreeSameVector<1, U, 0b00, opc, V128,
3963                                       asm, ".16b",
3964         [(set V128:$Rd, (v16i8 (OpNode (v16i8 V128:$Rn), (v16i8 V128:$Rm))))]>;
3965   def v4i16 : BaseSIMDThreeSameVector<0, U, 0b01, opc, V64,
3966                                       asm, ".4h",
3967         [(set V64:$Rd, (v4i16 (OpNode (v4i16 V64:$Rn), (v4i16 V64:$Rm))))]>;
3968   def v8i16 : BaseSIMDThreeSameVector<1, U, 0b01, opc, V128,
3969                                       asm, ".8h",
3970         [(set V128:$Rd, (v8i16 (OpNode (v8i16 V128:$Rn), (v8i16 V128:$Rm))))]>;
3971   def v2i32 : BaseSIMDThreeSameVector<0, U, 0b10, opc, V64,
3972                                       asm, ".2s",
3973         [(set V64:$Rd, (v2i32 (OpNode (v2i32 V64:$Rn), (v2i32 V64:$Rm))))]>;
3974   def v4i32 : BaseSIMDThreeSameVector<1, U, 0b10, opc, V128,
3975                                       asm, ".4s",
3976         [(set V128:$Rd, (v4i32 (OpNode (v4i32 V128:$Rn), (v4i32 V128:$Rm))))]>;
3977 }
3978
3979 multiclass SIMDThreeSameVectorBHSTied<bit U, bits<5> opc, string asm,
3980                                   SDPatternOperator OpNode> {
3981   def v8i8  : BaseSIMDThreeSameVectorTied<0, U, 0b00, opc, V64,
3982                                       asm, ".8b",
3983       [(set (v8i8 V64:$dst),
3984             (OpNode (v8i8 V64:$Rd), (v8i8 V64:$Rn), (v8i8 V64:$Rm)))]>;
3985   def v16i8 : BaseSIMDThreeSameVectorTied<1, U, 0b00, opc, V128,
3986                                       asm, ".16b",
3987       [(set (v16i8 V128:$dst),
3988             (OpNode (v16i8 V128:$Rd), (v16i8 V128:$Rn), (v16i8 V128:$Rm)))]>;
3989   def v4i16 : BaseSIMDThreeSameVectorTied<0, U, 0b01, opc, V64,
3990                                       asm, ".4h",
3991       [(set (v4i16 V64:$dst),
3992             (OpNode (v4i16 V64:$Rd), (v4i16 V64:$Rn), (v4i16 V64:$Rm)))]>;
3993   def v8i16 : BaseSIMDThreeSameVectorTied<1, U, 0b01, opc, V128,
3994                                       asm, ".8h",
3995       [(set (v8i16 V128:$dst),
3996             (OpNode (v8i16 V128:$Rd), (v8i16 V128:$Rn), (v8i16 V128:$Rm)))]>;
3997   def v2i32 : BaseSIMDThreeSameVectorTied<0, U, 0b10, opc, V64,
3998                                       asm, ".2s",
3999       [(set (v2i32 V64:$dst),
4000             (OpNode (v2i32 V64:$Rd), (v2i32 V64:$Rn), (v2i32 V64:$Rm)))]>;
4001   def v4i32 : BaseSIMDThreeSameVectorTied<1, U, 0b10, opc, V128,
4002                                       asm, ".4s",
4003       [(set (v4i32 V128:$dst),
4004             (OpNode (v4i32 V128:$Rd), (v4i32 V128:$Rn), (v4i32 V128:$Rm)))]>;
4005 }
4006
4007 // As above, but only B sized elements supported.
4008 multiclass SIMDThreeSameVectorB<bit U, bits<5> opc, string asm,
4009                                 SDPatternOperator OpNode> {
4010   def v8i8  : BaseSIMDThreeSameVector<0, U, 0b00, opc, V64,
4011                                       asm, ".8b",
4012     [(set (v8i8 V64:$Rd), (OpNode (v8i8 V64:$Rn), (v8i8 V64:$Rm)))]>;
4013   def v16i8 : BaseSIMDThreeSameVector<1, U, 0b00, opc, V128,
4014                                       asm, ".16b",
4015     [(set (v16i8 V128:$Rd),
4016           (OpNode (v16i8 V128:$Rn), (v16i8 V128:$Rm)))]>;
4017 }
4018
4019 // As above, but only S and D sized floating point elements supported.
4020 multiclass SIMDThreeSameVectorFP<bit U, bit S, bits<5> opc,
4021                                  string asm, SDPatternOperator OpNode> {
4022   def v2f32 : BaseSIMDThreeSameVector<0, U, {S,0}, opc, V64,
4023                                       asm, ".2s",
4024         [(set (v2f32 V64:$Rd), (OpNode (v2f32 V64:$Rn), (v2f32 V64:$Rm)))]>;
4025   def v4f32 : BaseSIMDThreeSameVector<1, U, {S,0}, opc, V128,
4026                                       asm, ".4s",
4027         [(set (v4f32 V128:$Rd), (OpNode (v4f32 V128:$Rn), (v4f32 V128:$Rm)))]>;
4028   def v2f64 : BaseSIMDThreeSameVector<1, U, {S,1}, opc, V128,
4029                                       asm, ".2d",
4030         [(set (v2f64 V128:$Rd), (OpNode (v2f64 V128:$Rn), (v2f64 V128:$Rm)))]>;
4031 }
4032
4033 multiclass SIMDThreeSameVectorFPCmp<bit U, bit S, bits<5> opc,
4034                                     string asm,
4035                                     SDPatternOperator OpNode> {
4036   def v2f32 : BaseSIMDThreeSameVector<0, U, {S,0}, opc, V64,
4037                                       asm, ".2s",
4038         [(set (v2i32 V64:$Rd), (OpNode (v2f32 V64:$Rn), (v2f32 V64:$Rm)))]>;
4039   def v4f32 : BaseSIMDThreeSameVector<1, U, {S,0}, opc, V128,
4040                                       asm, ".4s",
4041         [(set (v4i32 V128:$Rd), (OpNode (v4f32 V128:$Rn), (v4f32 V128:$Rm)))]>;
4042   def v2f64 : BaseSIMDThreeSameVector<1, U, {S,1}, opc, V128,
4043                                       asm, ".2d",
4044         [(set (v2i64 V128:$Rd), (OpNode (v2f64 V128:$Rn), (v2f64 V128:$Rm)))]>;
4045 }
4046
4047 multiclass SIMDThreeSameVectorFPTied<bit U, bit S, bits<5> opc,
4048                                  string asm, SDPatternOperator OpNode> {
4049   def v2f32 : BaseSIMDThreeSameVectorTied<0, U, {S,0}, opc, V64,
4050                                       asm, ".2s",
4051      [(set (v2f32 V64:$dst),
4052            (OpNode (v2f32 V64:$Rd), (v2f32 V64:$Rn), (v2f32 V64:$Rm)))]>;
4053   def v4f32 : BaseSIMDThreeSameVectorTied<1, U, {S,0}, opc, V128,
4054                                       asm, ".4s",
4055      [(set (v4f32 V128:$dst),
4056            (OpNode (v4f32 V128:$Rd), (v4f32 V128:$Rn), (v4f32 V128:$Rm)))]>;
4057   def v2f64 : BaseSIMDThreeSameVectorTied<1, U, {S,1}, opc, V128,
4058                                       asm, ".2d",
4059      [(set (v2f64 V128:$dst),
4060            (OpNode (v2f64 V128:$Rd), (v2f64 V128:$Rn), (v2f64 V128:$Rm)))]>;
4061 }
4062
4063 // As above, but D and B sized elements unsupported.
4064 multiclass SIMDThreeSameVectorHS<bit U, bits<5> opc, string asm,
4065                                 SDPatternOperator OpNode> {
4066   def v4i16 : BaseSIMDThreeSameVector<0, U, 0b01, opc, V64,
4067                                       asm, ".4h",
4068         [(set (v4i16 V64:$Rd), (OpNode (v4i16 V64:$Rn), (v4i16 V64:$Rm)))]>;
4069   def v8i16 : BaseSIMDThreeSameVector<1, U, 0b01, opc, V128,
4070                                       asm, ".8h",
4071         [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn), (v8i16 V128:$Rm)))]>;
4072   def v2i32 : BaseSIMDThreeSameVector<0, U, 0b10, opc, V64,
4073                                       asm, ".2s",
4074         [(set (v2i32 V64:$Rd), (OpNode (v2i32 V64:$Rn), (v2i32 V64:$Rm)))]>;
4075   def v4i32 : BaseSIMDThreeSameVector<1, U, 0b10, opc, V128,
4076                                       asm, ".4s",
4077         [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn), (v4i32 V128:$Rm)))]>;
4078 }
4079
4080 // Logical three vector ops share opcode bits, and only use B sized elements.
4081 multiclass SIMDLogicalThreeVector<bit U, bits<2> size, string asm,
4082                                   SDPatternOperator OpNode = null_frag> {
4083   def v8i8  : BaseSIMDThreeSameVector<0, U, size, 0b00011, V64,
4084                                      asm, ".8b",
4085                          [(set (v8i8 V64:$Rd), (OpNode V64:$Rn, V64:$Rm))]>;
4086   def v16i8  : BaseSIMDThreeSameVector<1, U, size, 0b00011, V128,
4087                                      asm, ".16b",
4088                          [(set (v16i8 V128:$Rd), (OpNode V128:$Rn, V128:$Rm))]>;
4089
4090   def : Pat<(v4i16 (OpNode V64:$LHS, V64:$RHS)),
4091           (!cast<Instruction>(NAME#"v8i8") V64:$LHS, V64:$RHS)>;
4092   def : Pat<(v2i32 (OpNode V64:$LHS, V64:$RHS)),
4093           (!cast<Instruction>(NAME#"v8i8") V64:$LHS, V64:$RHS)>;
4094   def : Pat<(v1i64 (OpNode V64:$LHS, V64:$RHS)),
4095           (!cast<Instruction>(NAME#"v8i8") V64:$LHS, V64:$RHS)>;
4096
4097   def : Pat<(v8i16 (OpNode V128:$LHS, V128:$RHS)),
4098       (!cast<Instruction>(NAME#"v16i8") V128:$LHS, V128:$RHS)>;
4099   def : Pat<(v4i32 (OpNode V128:$LHS, V128:$RHS)),
4100       (!cast<Instruction>(NAME#"v16i8") V128:$LHS, V128:$RHS)>;
4101   def : Pat<(v2i64 (OpNode V128:$LHS, V128:$RHS)),
4102       (!cast<Instruction>(NAME#"v16i8") V128:$LHS, V128:$RHS)>;
4103 }
4104
4105 multiclass SIMDLogicalThreeVectorTied<bit U, bits<2> size,
4106                                   string asm, SDPatternOperator OpNode> {
4107   def v8i8  : BaseSIMDThreeSameVectorTied<0, U, size, 0b00011, V64,
4108                                      asm, ".8b",
4109              [(set (v8i8 V64:$dst),
4110                    (OpNode (v8i8 V64:$Rd), (v8i8 V64:$Rn), (v8i8 V64:$Rm)))]>;
4111   def v16i8  : BaseSIMDThreeSameVectorTied<1, U, size, 0b00011, V128,
4112                                      asm, ".16b",
4113              [(set (v16i8 V128:$dst),
4114                    (OpNode (v16i8 V128:$Rd), (v16i8 V128:$Rn),
4115                            (v16i8 V128:$Rm)))]>;
4116
4117   def : Pat<(v4i16 (OpNode (v4i16 V64:$LHS), (v4i16 V64:$MHS),
4118                            (v4i16 V64:$RHS))),
4119           (!cast<Instruction>(NAME#"v8i8")
4120             V64:$LHS, V64:$MHS, V64:$RHS)>;
4121   def : Pat<(v2i32 (OpNode (v2i32 V64:$LHS), (v2i32 V64:$MHS),
4122                            (v2i32 V64:$RHS))),
4123           (!cast<Instruction>(NAME#"v8i8")
4124             V64:$LHS, V64:$MHS, V64:$RHS)>;
4125   def : Pat<(v1i64 (OpNode (v1i64 V64:$LHS), (v1i64 V64:$MHS),
4126                            (v1i64 V64:$RHS))),
4127           (!cast<Instruction>(NAME#"v8i8")
4128             V64:$LHS, V64:$MHS, V64:$RHS)>;
4129
4130   def : Pat<(v8i16 (OpNode (v8i16 V128:$LHS), (v8i16 V128:$MHS),
4131                            (v8i16 V128:$RHS))),
4132       (!cast<Instruction>(NAME#"v16i8")
4133         V128:$LHS, V128:$MHS, V128:$RHS)>;
4134   def : Pat<(v4i32 (OpNode (v4i32 V128:$LHS), (v4i32 V128:$MHS),
4135                            (v4i32 V128:$RHS))),
4136       (!cast<Instruction>(NAME#"v16i8")
4137         V128:$LHS, V128:$MHS, V128:$RHS)>;
4138   def : Pat<(v2i64 (OpNode (v2i64 V128:$LHS), (v2i64 V128:$MHS),
4139                            (v2i64 V128:$RHS))),
4140       (!cast<Instruction>(NAME#"v16i8")
4141         V128:$LHS, V128:$MHS, V128:$RHS)>;
4142 }
4143
4144
4145 //----------------------------------------------------------------------------
4146 // AdvSIMD two register vector instructions.
4147 //----------------------------------------------------------------------------
4148
4149 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
4150 class BaseSIMDTwoSameVector<bit Q, bit U, bits<2> size, bits<5> opcode,
4151                         RegisterOperand regtype, string asm, string dstkind,
4152                         string srckind, list<dag> pattern>
4153   : I<(outs regtype:$Rd), (ins regtype:$Rn), asm,
4154       "{\t$Rd" # dstkind # ", $Rn" # srckind #
4155       "|" # dstkind # "\t$Rd, $Rn}", "", pattern>,
4156     Sched<[WriteV]> {
4157   bits<5> Rd;
4158   bits<5> Rn;
4159   let Inst{31}    = 0;
4160   let Inst{30}    = Q;
4161   let Inst{29}    = U;
4162   let Inst{28-24} = 0b01110;
4163   let Inst{23-22} = size;
4164   let Inst{21-17} = 0b10000;
4165   let Inst{16-12} = opcode;
4166   let Inst{11-10} = 0b10;
4167   let Inst{9-5}   = Rn;
4168   let Inst{4-0}   = Rd;
4169 }
4170
4171 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
4172 class BaseSIMDTwoSameVectorTied<bit Q, bit U, bits<2> size, bits<5> opcode,
4173                             RegisterOperand regtype, string asm, string dstkind,
4174                             string srckind, list<dag> pattern>
4175   : I<(outs regtype:$dst), (ins regtype:$Rd, regtype:$Rn), asm,
4176       "{\t$Rd" # dstkind # ", $Rn" # srckind #
4177       "|" # dstkind # "\t$Rd, $Rn}", "$Rd = $dst", pattern>,
4178     Sched<[WriteV]> {
4179   bits<5> Rd;
4180   bits<5> Rn;
4181   let Inst{31}    = 0;
4182   let Inst{30}    = Q;
4183   let Inst{29}    = U;
4184   let Inst{28-24} = 0b01110;
4185   let Inst{23-22} = size;
4186   let Inst{21-17} = 0b10000;
4187   let Inst{16-12} = opcode;
4188   let Inst{11-10} = 0b10;
4189   let Inst{9-5}   = Rn;
4190   let Inst{4-0}   = Rd;
4191 }
4192
4193 // Supports B, H, and S element sizes.
4194 multiclass SIMDTwoVectorBHS<bit U, bits<5> opc, string asm,
4195                             SDPatternOperator OpNode> {
4196   def v8i8  : BaseSIMDTwoSameVector<0, U, 0b00, opc, V64,
4197                                       asm, ".8b", ".8b",
4198                           [(set (v8i8 V64:$Rd), (OpNode (v8i8 V64:$Rn)))]>;
4199   def v16i8 : BaseSIMDTwoSameVector<1, U, 0b00, opc, V128,
4200                                       asm, ".16b", ".16b",
4201                           [(set (v16i8 V128:$Rd), (OpNode (v16i8 V128:$Rn)))]>;
4202   def v4i16 : BaseSIMDTwoSameVector<0, U, 0b01, opc, V64,
4203                                       asm, ".4h", ".4h",
4204                           [(set (v4i16 V64:$Rd), (OpNode (v4i16 V64:$Rn)))]>;
4205   def v8i16 : BaseSIMDTwoSameVector<1, U, 0b01, opc, V128,
4206                                       asm, ".8h", ".8h",
4207                           [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn)))]>;
4208   def v2i32 : BaseSIMDTwoSameVector<0, U, 0b10, opc, V64,
4209                                       asm, ".2s", ".2s",
4210                           [(set (v2i32 V64:$Rd), (OpNode (v2i32 V64:$Rn)))]>;
4211   def v4i32 : BaseSIMDTwoSameVector<1, U, 0b10, opc, V128,
4212                                       asm, ".4s", ".4s",
4213                           [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn)))]>;
4214 }
4215
4216 class BaseSIMDVectorLShiftLongBySize<bit Q, bits<2> size,
4217                             RegisterOperand regtype, string asm, string dstkind,
4218                             string srckind, string amount>
4219   : I<(outs V128:$Rd), (ins regtype:$Rn), asm,
4220       "{\t$Rd" # dstkind # ", $Rn" # srckind # ", #" # amount #
4221       "|" # dstkind # "\t$Rd, $Rn, #" #  amount # "}", "", []>,
4222     Sched<[WriteV]> {
4223   bits<5> Rd;
4224   bits<5> Rn;
4225   let Inst{31}    = 0;
4226   let Inst{30}    = Q;
4227   let Inst{29-24} = 0b101110;
4228   let Inst{23-22} = size;
4229   let Inst{21-10} = 0b100001001110;
4230   let Inst{9-5}   = Rn;
4231   let Inst{4-0}   = Rd;
4232 }
4233
4234 multiclass SIMDVectorLShiftLongBySizeBHS {
4235   let neverHasSideEffects = 1 in {
4236   def v8i8  : BaseSIMDVectorLShiftLongBySize<0, 0b00, V64,
4237                                              "shll", ".8h",  ".8b", "8">;
4238   def v16i8 : BaseSIMDVectorLShiftLongBySize<1, 0b00, V128,
4239                                              "shll2", ".8h", ".16b", "8">;
4240   def v4i16 : BaseSIMDVectorLShiftLongBySize<0, 0b01, V64,
4241                                              "shll", ".4s",  ".4h", "16">;
4242   def v8i16 : BaseSIMDVectorLShiftLongBySize<1, 0b01, V128,
4243                                              "shll2", ".4s", ".8h", "16">;
4244   def v2i32 : BaseSIMDVectorLShiftLongBySize<0, 0b10, V64,
4245                                              "shll", ".2d",  ".2s", "32">;
4246   def v4i32 : BaseSIMDVectorLShiftLongBySize<1, 0b10, V128,
4247                                              "shll2", ".2d", ".4s", "32">;
4248   }
4249 }
4250
4251 // Supports all element sizes.
4252 multiclass SIMDLongTwoVector<bit U, bits<5> opc, string asm,
4253                              SDPatternOperator OpNode> {
4254   def v8i8_v4i16  : BaseSIMDTwoSameVector<0, U, 0b00, opc, V64,
4255                                       asm, ".4h", ".8b",
4256                [(set (v4i16 V64:$Rd), (OpNode (v8i8 V64:$Rn)))]>;
4257   def v16i8_v8i16 : BaseSIMDTwoSameVector<1, U, 0b00, opc, V128,
4258                                       asm, ".8h", ".16b",
4259                [(set (v8i16 V128:$Rd), (OpNode (v16i8 V128:$Rn)))]>;
4260   def v4i16_v2i32 : BaseSIMDTwoSameVector<0, U, 0b01, opc, V64,
4261                                       asm, ".2s", ".4h",
4262                [(set (v2i32 V64:$Rd), (OpNode (v4i16 V64:$Rn)))]>;
4263   def v8i16_v4i32 : BaseSIMDTwoSameVector<1, U, 0b01, opc, V128,
4264                                       asm, ".4s", ".8h",
4265                [(set (v4i32 V128:$Rd), (OpNode (v8i16 V128:$Rn)))]>;
4266   def v2i32_v1i64 : BaseSIMDTwoSameVector<0, U, 0b10, opc, V64,
4267                                       asm, ".1d", ".2s",
4268                [(set (v1i64 V64:$Rd), (OpNode (v2i32 V64:$Rn)))]>;
4269   def v4i32_v2i64 : BaseSIMDTwoSameVector<1, U, 0b10, opc, V128,
4270                                       asm, ".2d", ".4s",
4271                [(set (v2i64 V128:$Rd), (OpNode (v4i32 V128:$Rn)))]>;
4272 }
4273
4274 multiclass SIMDLongTwoVectorTied<bit U, bits<5> opc, string asm,
4275                                  SDPatternOperator OpNode> {
4276   def v8i8_v4i16  : BaseSIMDTwoSameVectorTied<0, U, 0b00, opc, V64,
4277                                           asm, ".4h", ".8b",
4278       [(set (v4i16 V64:$dst), (OpNode (v4i16 V64:$Rd),
4279                                       (v8i8 V64:$Rn)))]>;
4280   def v16i8_v8i16 : BaseSIMDTwoSameVectorTied<1, U, 0b00, opc, V128,
4281                                           asm, ".8h", ".16b",
4282       [(set (v8i16 V128:$dst), (OpNode (v8i16 V128:$Rd),
4283                                       (v16i8 V128:$Rn)))]>;
4284   def v4i16_v2i32 : BaseSIMDTwoSameVectorTied<0, U, 0b01, opc, V64,
4285                                           asm, ".2s", ".4h",
4286       [(set (v2i32 V64:$dst), (OpNode (v2i32 V64:$Rd),
4287                                       (v4i16 V64:$Rn)))]>;
4288   def v8i16_v4i32 : BaseSIMDTwoSameVectorTied<1, U, 0b01, opc, V128,
4289                                           asm, ".4s", ".8h",
4290       [(set (v4i32 V128:$dst), (OpNode (v4i32 V128:$Rd),
4291                                       (v8i16 V128:$Rn)))]>;
4292   def v2i32_v1i64 : BaseSIMDTwoSameVectorTied<0, U, 0b10, opc, V64,
4293                                           asm, ".1d", ".2s",
4294       [(set (v1i64 V64:$dst), (OpNode (v1i64 V64:$Rd),
4295                                       (v2i32 V64:$Rn)))]>;
4296   def v4i32_v2i64 : BaseSIMDTwoSameVectorTied<1, U, 0b10, opc, V128,
4297                                           asm, ".2d", ".4s",
4298       [(set (v2i64 V128:$dst), (OpNode (v2i64 V128:$Rd),
4299                                       (v4i32 V128:$Rn)))]>;
4300 }
4301
4302 // Supports all element sizes, except 1xD.
4303 multiclass SIMDTwoVectorBHSDTied<bit U, bits<5> opc, string asm,
4304                                   SDPatternOperator OpNode> {
4305   def v8i8  : BaseSIMDTwoSameVectorTied<0, U, 0b00, opc, V64,
4306                                     asm, ".8b", ".8b",
4307     [(set (v8i8 V64:$dst), (OpNode (v8i8 V64:$Rd), (v8i8 V64:$Rn)))]>;
4308   def v16i8 : BaseSIMDTwoSameVectorTied<1, U, 0b00, opc, V128,
4309                                     asm, ".16b", ".16b",
4310     [(set (v16i8 V128:$dst), (OpNode (v16i8 V128:$Rd), (v16i8 V128:$Rn)))]>;
4311   def v4i16 : BaseSIMDTwoSameVectorTied<0, U, 0b01, opc, V64,
4312                                     asm, ".4h", ".4h",
4313     [(set (v4i16 V64:$dst), (OpNode (v4i16 V64:$Rd), (v4i16 V64:$Rn)))]>;
4314   def v8i16 : BaseSIMDTwoSameVectorTied<1, U, 0b01, opc, V128,
4315                                     asm, ".8h", ".8h",
4316     [(set (v8i16 V128:$dst), (OpNode (v8i16 V128:$Rd), (v8i16 V128:$Rn)))]>;
4317   def v2i32 : BaseSIMDTwoSameVectorTied<0, U, 0b10, opc, V64,
4318                                     asm, ".2s", ".2s",
4319     [(set (v2i32 V64:$dst), (OpNode (v2i32 V64:$Rd), (v2i32 V64:$Rn)))]>;
4320   def v4i32 : BaseSIMDTwoSameVectorTied<1, U, 0b10, opc, V128,
4321                                     asm, ".4s", ".4s",
4322     [(set (v4i32 V128:$dst), (OpNode (v4i32 V128:$Rd), (v4i32 V128:$Rn)))]>;
4323   def v2i64 : BaseSIMDTwoSameVectorTied<1, U, 0b11, opc, V128,
4324                                     asm, ".2d", ".2d",
4325     [(set (v2i64 V128:$dst), (OpNode (v2i64 V128:$Rd), (v2i64 V128:$Rn)))]>;
4326 }
4327
4328 multiclass SIMDTwoVectorBHSD<bit U, bits<5> opc, string asm,
4329                              SDPatternOperator OpNode = null_frag> {
4330   def v8i8  : BaseSIMDTwoSameVector<0, U, 0b00, opc, V64,
4331                                 asm, ".8b", ".8b",
4332     [(set (v8i8 V64:$Rd), (OpNode (v8i8 V64:$Rn)))]>;
4333   def v16i8 : BaseSIMDTwoSameVector<1, U, 0b00, opc, V128,
4334                                 asm, ".16b", ".16b",
4335     [(set (v16i8 V128:$Rd), (OpNode (v16i8 V128:$Rn)))]>;
4336   def v4i16 : BaseSIMDTwoSameVector<0, U, 0b01, opc, V64,
4337                                 asm, ".4h", ".4h",
4338     [(set (v4i16 V64:$Rd), (OpNode (v4i16 V64:$Rn)))]>;
4339   def v8i16 : BaseSIMDTwoSameVector<1, U, 0b01, opc, V128,
4340                                 asm, ".8h", ".8h",
4341     [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn)))]>;
4342   def v2i32 : BaseSIMDTwoSameVector<0, U, 0b10, opc, V64,
4343                                 asm, ".2s", ".2s",
4344     [(set (v2i32 V64:$Rd), (OpNode (v2i32 V64:$Rn)))]>;
4345   def v4i32 : BaseSIMDTwoSameVector<1, U, 0b10, opc, V128,
4346                                 asm, ".4s", ".4s",
4347     [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn)))]>;
4348   def v2i64 : BaseSIMDTwoSameVector<1, U, 0b11, opc, V128,
4349                                 asm, ".2d", ".2d",
4350     [(set (v2i64 V128:$Rd), (OpNode (v2i64 V128:$Rn)))]>;
4351 }
4352
4353
4354 // Supports only B element sizes.
4355 multiclass SIMDTwoVectorB<bit U, bits<2> size, bits<5> opc, string asm,
4356                           SDPatternOperator OpNode> {
4357   def v8i8  : BaseSIMDTwoSameVector<0, U, size, opc, V64,
4358                                 asm, ".8b", ".8b",
4359                     [(set (v8i8 V64:$Rd), (OpNode (v8i8 V64:$Rn)))]>;
4360   def v16i8 : BaseSIMDTwoSameVector<1, U, size, opc, V128,
4361                                 asm, ".16b", ".16b",
4362                     [(set (v16i8 V128:$Rd), (OpNode (v16i8 V128:$Rn)))]>;
4363
4364 }
4365
4366 // Supports only B and H element sizes.
4367 multiclass SIMDTwoVectorBH<bit U, bits<5> opc, string asm,
4368                                 SDPatternOperator OpNode> {
4369   def v8i8  : BaseSIMDTwoSameVector<0, U, 0b00, opc, V64,
4370                                 asm, ".8b", ".8b",
4371                     [(set (v8i8 V64:$Rd), (OpNode V64:$Rn))]>;
4372   def v16i8 : BaseSIMDTwoSameVector<1, U, 0b00, opc, V128,
4373                                 asm, ".16b", ".16b",
4374                     [(set (v16i8 V128:$Rd), (OpNode V128:$Rn))]>;
4375   def v4i16 : BaseSIMDTwoSameVector<0, U, 0b01, opc, V64,
4376                                 asm, ".4h", ".4h",
4377                     [(set (v4i16 V64:$Rd), (OpNode V64:$Rn))]>;
4378   def v8i16 : BaseSIMDTwoSameVector<1, U, 0b01, opc, V128,
4379                                 asm, ".8h", ".8h",
4380                     [(set (v8i16 V128:$Rd), (OpNode V128:$Rn))]>;
4381 }
4382
4383 // Supports only S and D element sizes, uses high bit of the size field
4384 // as an extra opcode bit.
4385 multiclass SIMDTwoVectorFP<bit U, bit S, bits<5> opc, string asm,
4386                            SDPatternOperator OpNode> {
4387   def v2f32 : BaseSIMDTwoSameVector<0, U, {S,0}, opc, V64,
4388                                 asm, ".2s", ".2s",
4389                           [(set (v2f32 V64:$Rd), (OpNode (v2f32 V64:$Rn)))]>;
4390   def v4f32 : BaseSIMDTwoSameVector<1, U, {S,0}, opc, V128,
4391                                 asm, ".4s", ".4s",
4392                           [(set (v4f32 V128:$Rd), (OpNode (v4f32 V128:$Rn)))]>;
4393   def v2f64 : BaseSIMDTwoSameVector<1, U, {S,1}, opc, V128,
4394                                 asm, ".2d", ".2d",
4395                           [(set (v2f64 V128:$Rd), (OpNode (v2f64 V128:$Rn)))]>;
4396 }
4397
4398 // Supports only S element size.
4399 multiclass SIMDTwoVectorS<bit U, bit S, bits<5> opc, string asm,
4400                            SDPatternOperator OpNode> {
4401   def v2i32 : BaseSIMDTwoSameVector<0, U, {S,0}, opc, V64,
4402                                 asm, ".2s", ".2s",
4403                           [(set (v2i32 V64:$Rd), (OpNode (v2i32 V64:$Rn)))]>;
4404   def v4i32 : BaseSIMDTwoSameVector<1, U, {S,0}, opc, V128,
4405                                 asm, ".4s", ".4s",
4406                           [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn)))]>;
4407 }
4408
4409
4410 multiclass SIMDTwoVectorFPToInt<bit U, bit S, bits<5> opc, string asm,
4411                            SDPatternOperator OpNode> {
4412   def v2f32 : BaseSIMDTwoSameVector<0, U, {S,0}, opc, V64,
4413                                 asm, ".2s", ".2s",
4414                           [(set (v2i32 V64:$Rd), (OpNode (v2f32 V64:$Rn)))]>;
4415   def v4f32 : BaseSIMDTwoSameVector<1, U, {S,0}, opc, V128,
4416                                 asm, ".4s", ".4s",
4417                           [(set (v4i32 V128:$Rd), (OpNode (v4f32 V128:$Rn)))]>;
4418   def v2f64 : BaseSIMDTwoSameVector<1, U, {S,1}, opc, V128,
4419                                 asm, ".2d", ".2d",
4420                           [(set (v2i64 V128:$Rd), (OpNode (v2f64 V128:$Rn)))]>;
4421 }
4422
4423 multiclass SIMDTwoVectorIntToFP<bit U, bit S, bits<5> opc, string asm,
4424                            SDPatternOperator OpNode> {
4425   def v2f32 : BaseSIMDTwoSameVector<0, U, {S,0}, opc, V64,
4426                                 asm, ".2s", ".2s",
4427                           [(set (v2f32 V64:$Rd), (OpNode (v2i32 V64:$Rn)))]>;
4428   def v4f32 : BaseSIMDTwoSameVector<1, U, {S,0}, opc, V128,
4429                                 asm, ".4s", ".4s",
4430                           [(set (v4f32 V128:$Rd), (OpNode (v4i32 V128:$Rn)))]>;
4431   def v2f64 : BaseSIMDTwoSameVector<1, U, {S,1}, opc, V128,
4432                                 asm, ".2d", ".2d",
4433                           [(set (v2f64 V128:$Rd), (OpNode (v2i64 V128:$Rn)))]>;
4434 }
4435
4436
4437 class BaseSIMDMixedTwoVector<bit Q, bit U, bits<2> size, bits<5> opcode,
4438                            RegisterOperand inreg, RegisterOperand outreg,
4439                            string asm, string outkind, string inkind,
4440                            list<dag> pattern>
4441   : I<(outs outreg:$Rd), (ins inreg:$Rn), asm,
4442       "{\t$Rd" # outkind # ", $Rn" # inkind #
4443       "|" # outkind # "\t$Rd, $Rn}", "", pattern>,
4444     Sched<[WriteV]> {
4445   bits<5> Rd;
4446   bits<5> Rn;
4447   let Inst{31}    = 0;
4448   let Inst{30}    = Q;
4449   let Inst{29}    = U;
4450   let Inst{28-24} = 0b01110;
4451   let Inst{23-22} = size;
4452   let Inst{21-17} = 0b10000;
4453   let Inst{16-12} = opcode;
4454   let Inst{11-10} = 0b10;
4455   let Inst{9-5}   = Rn;
4456   let Inst{4-0}   = Rd;
4457 }
4458
4459 class BaseSIMDMixedTwoVectorTied<bit Q, bit U, bits<2> size, bits<5> opcode,
4460                            RegisterOperand inreg, RegisterOperand outreg,
4461                            string asm, string outkind, string inkind,
4462                            list<dag> pattern>
4463   : I<(outs outreg:$dst), (ins outreg:$Rd, inreg:$Rn), asm,
4464       "{\t$Rd" # outkind # ", $Rn" # inkind #
4465       "|" # outkind # "\t$Rd, $Rn}", "$Rd = $dst", pattern>,
4466     Sched<[WriteV]> {
4467   bits<5> Rd;
4468   bits<5> Rn;
4469   let Inst{31}    = 0;
4470   let Inst{30}    = Q;
4471   let Inst{29}    = U;
4472   let Inst{28-24} = 0b01110;
4473   let Inst{23-22} = size;
4474   let Inst{21-17} = 0b10000;
4475   let Inst{16-12} = opcode;
4476   let Inst{11-10} = 0b10;
4477   let Inst{9-5}   = Rn;
4478   let Inst{4-0}   = Rd;
4479 }
4480
4481 multiclass SIMDMixedTwoVector<bit U, bits<5> opc, string asm,
4482                               SDPatternOperator OpNode> {
4483   def v8i8  : BaseSIMDMixedTwoVector<0, U, 0b00, opc, V128, V64,
4484                                       asm, ".8b", ".8h",
4485         [(set (v8i8 V64:$Rd), (OpNode (v8i16 V128:$Rn)))]>;
4486   def v16i8 : BaseSIMDMixedTwoVectorTied<1, U, 0b00, opc, V128, V128,
4487                                       asm#"2", ".16b", ".8h", []>;
4488   def v4i16 : BaseSIMDMixedTwoVector<0, U, 0b01, opc, V128, V64,
4489                                       asm, ".4h", ".4s",
4490         [(set (v4i16 V64:$Rd), (OpNode (v4i32 V128:$Rn)))]>;
4491   def v8i16 : BaseSIMDMixedTwoVectorTied<1, U, 0b01, opc, V128, V128,
4492                                       asm#"2", ".8h", ".4s", []>;
4493   def v2i32 : BaseSIMDMixedTwoVector<0, U, 0b10, opc, V128, V64,
4494                                       asm, ".2s", ".2d",
4495         [(set (v2i32 V64:$Rd), (OpNode (v2i64 V128:$Rn)))]>;
4496   def v4i32 : BaseSIMDMixedTwoVectorTied<1, U, 0b10, opc, V128, V128,
4497                                       asm#"2", ".4s", ".2d", []>;
4498
4499   def : Pat<(concat_vectors (v8i8 V64:$Rd), (OpNode (v8i16 V128:$Rn))),
4500             (!cast<Instruction>(NAME # "v16i8")
4501                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub), V128:$Rn)>;
4502   def : Pat<(concat_vectors (v4i16 V64:$Rd), (OpNode (v4i32 V128:$Rn))),
4503             (!cast<Instruction>(NAME # "v8i16")
4504                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub), V128:$Rn)>;
4505   def : Pat<(concat_vectors (v2i32 V64:$Rd), (OpNode (v2i64 V128:$Rn))),
4506             (!cast<Instruction>(NAME # "v4i32")
4507                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub), V128:$Rn)>;
4508 }
4509
4510 class BaseSIMDCmpTwoVector<bit Q, bit U, bits<2> size, bits<5> opcode,
4511                            RegisterOperand regtype,
4512                            string asm, string kind, string zero,
4513                            ValueType dty, ValueType sty, SDNode OpNode>
4514   : I<(outs regtype:$Rd), (ins regtype:$Rn), asm,
4515       "{\t$Rd" # kind # ", $Rn" # kind # ", #" # zero #
4516       "|" # kind # "\t$Rd, $Rn, #" # zero # "}", "",
4517       [(set (dty regtype:$Rd), (OpNode (sty regtype:$Rn)))]>,
4518     Sched<[WriteV]> {
4519   bits<5> Rd;
4520   bits<5> Rn;
4521   let Inst{31}    = 0;
4522   let Inst{30}    = Q;
4523   let Inst{29}    = U;
4524   let Inst{28-24} = 0b01110;
4525   let Inst{23-22} = size;
4526   let Inst{21-17} = 0b10000;
4527   let Inst{16-12} = opcode;
4528   let Inst{11-10} = 0b10;
4529   let Inst{9-5}   = Rn;
4530   let Inst{4-0}   = Rd;
4531 }
4532
4533 // Comparisons support all element sizes, except 1xD.
4534 multiclass SIMDCmpTwoVector<bit U, bits<5> opc, string asm,
4535                             SDNode OpNode> {
4536   def v8i8rz  : BaseSIMDCmpTwoVector<0, U, 0b00, opc, V64,
4537                                      asm, ".8b", "0",
4538                                      v8i8, v8i8, OpNode>;
4539   def v16i8rz : BaseSIMDCmpTwoVector<1, U, 0b00, opc, V128,
4540                                      asm, ".16b", "0",
4541                                      v16i8, v16i8, OpNode>;
4542   def v4i16rz : BaseSIMDCmpTwoVector<0, U, 0b01, opc, V64,
4543                                      asm, ".4h", "0",
4544                                      v4i16, v4i16, OpNode>;
4545   def v8i16rz : BaseSIMDCmpTwoVector<1, U, 0b01, opc, V128,
4546                                      asm, ".8h", "0",
4547                                      v8i16, v8i16, OpNode>;
4548   def v2i32rz : BaseSIMDCmpTwoVector<0, U, 0b10, opc, V64,
4549                                      asm, ".2s", "0",
4550                                      v2i32, v2i32, OpNode>;
4551   def v4i32rz : BaseSIMDCmpTwoVector<1, U, 0b10, opc, V128,
4552                                      asm, ".4s", "0",
4553                                      v4i32, v4i32, OpNode>;
4554   def v2i64rz : BaseSIMDCmpTwoVector<1, U, 0b11, opc, V128,
4555                                      asm, ".2d", "0",
4556                                      v2i64, v2i64, OpNode>;
4557 }
4558
4559 // FP Comparisons support only S and D element sizes.
4560 multiclass SIMDFPCmpTwoVector<bit U, bit S, bits<5> opc,
4561                               string asm, SDNode OpNode> {
4562
4563   def v2i32rz : BaseSIMDCmpTwoVector<0, U, {S,0}, opc, V64,
4564                                      asm, ".2s", "0.0",
4565                                      v2i32, v2f32, OpNode>;
4566   def v4i32rz : BaseSIMDCmpTwoVector<1, U, {S,0}, opc, V128,
4567                                      asm, ".4s", "0.0",
4568                                      v4i32, v4f32, OpNode>;
4569   def v2i64rz : BaseSIMDCmpTwoVector<1, U, {S,1}, opc, V128,
4570                                      asm, ".2d", "0.0",
4571                                      v2i64, v2f64, OpNode>;
4572
4573   def : InstAlias<asm # " $Vd.2s, $Vn.2s, #0",
4574                   (!cast<Instruction>(NAME # v2i32rz) V64:$Vd, V64:$Vn), 0>;
4575   def : InstAlias<asm # " $Vd.4s, $Vn.4s, #0",
4576                   (!cast<Instruction>(NAME # v4i32rz) V128:$Vd, V128:$Vn), 0>;
4577   def : InstAlias<asm # " $Vd.2d, $Vn.2d, #0",
4578                   (!cast<Instruction>(NAME # v2i64rz) V128:$Vd, V128:$Vn), 0>;
4579   def : InstAlias<asm # ".2s $Vd, $Vn, #0",
4580                   (!cast<Instruction>(NAME # v2i32rz) V64:$Vd, V64:$Vn), 0>;
4581   def : InstAlias<asm # ".4s $Vd, $Vn, #0",
4582                   (!cast<Instruction>(NAME # v4i32rz) V128:$Vd, V128:$Vn), 0>;
4583   def : InstAlias<asm # ".2d $Vd, $Vn, #0",
4584                   (!cast<Instruction>(NAME # v2i64rz) V128:$Vd, V128:$Vn), 0>;
4585 }
4586
4587 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
4588 class BaseSIMDFPCvtTwoVector<bit Q, bit U, bits<2> size, bits<5> opcode,
4589                              RegisterOperand outtype, RegisterOperand intype,
4590                              string asm, string VdTy, string VnTy,
4591                              list<dag> pattern>
4592   : I<(outs outtype:$Rd), (ins intype:$Rn), asm,
4593       !strconcat("\t$Rd", VdTy, ", $Rn", VnTy), "", pattern>,
4594     Sched<[WriteV]> {
4595   bits<5> Rd;
4596   bits<5> Rn;
4597   let Inst{31}    = 0;
4598   let Inst{30}    = Q;
4599   let Inst{29}    = U;
4600   let Inst{28-24} = 0b01110;
4601   let Inst{23-22} = size;
4602   let Inst{21-17} = 0b10000;
4603   let Inst{16-12} = opcode;
4604   let Inst{11-10} = 0b10;
4605   let Inst{9-5}   = Rn;
4606   let Inst{4-0}   = Rd;
4607 }
4608
4609 class BaseSIMDFPCvtTwoVectorTied<bit Q, bit U, bits<2> size, bits<5> opcode,
4610                              RegisterOperand outtype, RegisterOperand intype,
4611                              string asm, string VdTy, string VnTy,
4612                              list<dag> pattern>
4613   : I<(outs outtype:$dst), (ins outtype:$Rd, intype:$Rn), asm,
4614       !strconcat("\t$Rd", VdTy, ", $Rn", VnTy), "$Rd = $dst", pattern>,
4615     Sched<[WriteV]> {
4616   bits<5> Rd;
4617   bits<5> Rn;
4618   let Inst{31}    = 0;
4619   let Inst{30}    = Q;
4620   let Inst{29}    = U;
4621   let Inst{28-24} = 0b01110;
4622   let Inst{23-22} = size;
4623   let Inst{21-17} = 0b10000;
4624   let Inst{16-12} = opcode;
4625   let Inst{11-10} = 0b10;
4626   let Inst{9-5}   = Rn;
4627   let Inst{4-0}   = Rd;
4628 }
4629
4630 multiclass SIMDFPWidenTwoVector<bit U, bit S, bits<5> opc, string asm> {
4631   def v4i16 : BaseSIMDFPCvtTwoVector<0, U, {S,0}, opc, V128, V64,
4632                                     asm, ".4s", ".4h", []>;
4633   def v8i16 : BaseSIMDFPCvtTwoVector<1, U, {S,0}, opc, V128, V128,
4634                                     asm#"2", ".4s", ".8h", []>;
4635   def v2i32 : BaseSIMDFPCvtTwoVector<0, U, {S,1}, opc, V128, V64,
4636                                     asm, ".2d", ".2s", []>;
4637   def v4i32 : BaseSIMDFPCvtTwoVector<1, U, {S,1}, opc, V128, V128,
4638                                     asm#"2", ".2d", ".4s", []>;
4639 }
4640
4641 multiclass SIMDFPNarrowTwoVector<bit U, bit S, bits<5> opc, string asm> {
4642   def v4i16 : BaseSIMDFPCvtTwoVector<0, U, {S,0}, opc, V64, V128,
4643                                     asm, ".4h", ".4s", []>;
4644   def v8i16 : BaseSIMDFPCvtTwoVectorTied<1, U, {S,0}, opc, V128, V128,
4645                                     asm#"2", ".8h", ".4s", []>;
4646   def v2i32 : BaseSIMDFPCvtTwoVector<0, U, {S,1}, opc, V64, V128,
4647                                     asm, ".2s", ".2d", []>;
4648   def v4i32 : BaseSIMDFPCvtTwoVectorTied<1, U, {S,1}, opc, V128, V128,
4649                                     asm#"2", ".4s", ".2d", []>;
4650 }
4651
4652 multiclass SIMDFPInexactCvtTwoVector<bit U, bit S, bits<5> opc, string asm,
4653                                      Intrinsic OpNode> {
4654   def v2f32 : BaseSIMDFPCvtTwoVector<0, U, {S,1}, opc, V64, V128,
4655                                      asm, ".2s", ".2d",
4656                           [(set (v2f32 V64:$Rd), (OpNode (v2f64 V128:$Rn)))]>;
4657   def v4f32 : BaseSIMDFPCvtTwoVectorTied<1, U, {S,1}, opc, V128, V128,
4658                                     asm#"2", ".4s", ".2d", []>;
4659
4660   def : Pat<(concat_vectors (v2f32 V64:$Rd), (OpNode (v2f64 V128:$Rn))),
4661             (!cast<Instruction>(NAME # "v4f32")
4662                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub), V128:$Rn)>;
4663 }
4664
4665 //----------------------------------------------------------------------------
4666 // AdvSIMD three register different-size vector instructions.
4667 //----------------------------------------------------------------------------
4668
4669 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
4670 class BaseSIMDDifferentThreeVector<bit U, bits<3> size, bits<4> opcode,
4671                       RegisterOperand outtype, RegisterOperand intype1,
4672                       RegisterOperand intype2, string asm,
4673                       string outkind, string inkind1, string inkind2,
4674                       list<dag> pattern>
4675   : I<(outs outtype:$Rd), (ins intype1:$Rn, intype2:$Rm), asm,
4676       "{\t$Rd" # outkind # ", $Rn" # inkind1 # ", $Rm" # inkind2 #
4677       "|" # outkind # "\t$Rd, $Rn, $Rm}", "", pattern>,
4678     Sched<[WriteV]> {
4679   bits<5> Rd;
4680   bits<5> Rn;
4681   bits<5> Rm;
4682   let Inst{31}    = 0;
4683   let Inst{30}    = size{0};
4684   let Inst{29}    = U;
4685   let Inst{28-24} = 0b01110;
4686   let Inst{23-22} = size{2-1};
4687   let Inst{21}    = 1;
4688   let Inst{20-16} = Rm;
4689   let Inst{15-12} = opcode;
4690   let Inst{11-10} = 0b00;
4691   let Inst{9-5}   = Rn;
4692   let Inst{4-0}   = Rd;
4693 }
4694
4695 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
4696 class BaseSIMDDifferentThreeVectorTied<bit U, bits<3> size, bits<4> opcode,
4697                       RegisterOperand outtype, RegisterOperand intype1,
4698                       RegisterOperand intype2, string asm,
4699                       string outkind, string inkind1, string inkind2,
4700                       list<dag> pattern>
4701   : I<(outs outtype:$dst), (ins outtype:$Rd, intype1:$Rn, intype2:$Rm), asm,
4702       "{\t$Rd" # outkind # ", $Rn" # inkind1 # ", $Rm" # inkind2 #
4703       "|" # outkind # "\t$Rd, $Rn, $Rm}", "$Rd = $dst", pattern>,
4704     Sched<[WriteV]> {
4705   bits<5> Rd;
4706   bits<5> Rn;
4707   bits<5> Rm;
4708   let Inst{31}    = 0;
4709   let Inst{30}    = size{0};
4710   let Inst{29}    = U;
4711   let Inst{28-24} = 0b01110;
4712   let Inst{23-22} = size{2-1};
4713   let Inst{21}    = 1;
4714   let Inst{20-16} = Rm;
4715   let Inst{15-12} = opcode;
4716   let Inst{11-10} = 0b00;
4717   let Inst{9-5}   = Rn;
4718   let Inst{4-0}   = Rd;
4719 }
4720
4721 // FIXME: TableGen doesn't know how to deal with expanded types that also
4722 //        change the element count (in this case, placing the results in
4723 //        the high elements of the result register rather than the low
4724 //        elements). Until that's fixed, we can't code-gen those.
4725 multiclass SIMDNarrowThreeVectorBHS<bit U, bits<4> opc, string asm,
4726                                     Intrinsic IntOp> {
4727   def v8i16_v8i8   : BaseSIMDDifferentThreeVector<U, 0b000, opc,
4728                                                   V64, V128, V128,
4729                                                   asm, ".8b", ".8h", ".8h",
4730      [(set (v8i8 V64:$Rd), (IntOp (v8i16 V128:$Rn), (v8i16 V128:$Rm)))]>;
4731   def v8i16_v16i8  : BaseSIMDDifferentThreeVectorTied<U, 0b001, opc,
4732                                                   V128, V128, V128,
4733                                                   asm#"2", ".16b", ".8h", ".8h",
4734      []>;
4735   def v4i32_v4i16  : BaseSIMDDifferentThreeVector<U, 0b010, opc,
4736                                                   V64, V128, V128,
4737                                                   asm, ".4h", ".4s", ".4s",
4738      [(set (v4i16 V64:$Rd), (IntOp (v4i32 V128:$Rn), (v4i32 V128:$Rm)))]>;
4739   def v4i32_v8i16  : BaseSIMDDifferentThreeVectorTied<U, 0b011, opc,
4740                                                   V128, V128, V128,
4741                                                   asm#"2", ".8h", ".4s", ".4s",
4742      []>;
4743   def v2i64_v2i32  : BaseSIMDDifferentThreeVector<U, 0b100, opc,
4744                                                   V64, V128, V128,
4745                                                   asm, ".2s", ".2d", ".2d",
4746      [(set (v2i32 V64:$Rd), (IntOp (v2i64 V128:$Rn), (v2i64 V128:$Rm)))]>;
4747   def v2i64_v4i32  : BaseSIMDDifferentThreeVectorTied<U, 0b101, opc,
4748                                                   V128, V128, V128,
4749                                                   asm#"2", ".4s", ".2d", ".2d",
4750      []>;
4751
4752
4753   // Patterns for the '2' variants involve INSERT_SUBREG, which you can't put in
4754   // a version attached to an instruction.
4755   def : Pat<(concat_vectors (v8i8 V64:$Rd), (IntOp (v8i16 V128:$Rn),
4756                                                    (v8i16 V128:$Rm))),
4757             (!cast<Instruction>(NAME # "v8i16_v16i8")
4758                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub),
4759                 V128:$Rn, V128:$Rm)>;
4760   def : Pat<(concat_vectors (v4i16 V64:$Rd), (IntOp (v4i32 V128:$Rn),
4761                                                     (v4i32 V128:$Rm))),
4762             (!cast<Instruction>(NAME # "v4i32_v8i16")
4763                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub),
4764                 V128:$Rn, V128:$Rm)>;
4765   def : Pat<(concat_vectors (v2i32 V64:$Rd), (IntOp (v2i64 V128:$Rn),
4766                                                     (v2i64 V128:$Rm))),
4767             (!cast<Instruction>(NAME # "v2i64_v4i32")
4768                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub),
4769                 V128:$Rn, V128:$Rm)>;
4770 }
4771
4772 multiclass SIMDDifferentThreeVectorBD<bit U, bits<4> opc, string asm,
4773                                       Intrinsic IntOp> {
4774   def v8i8   : BaseSIMDDifferentThreeVector<U, 0b000, opc,
4775                                             V128, V64, V64,
4776                                             asm, ".8h", ".8b", ".8b",
4777       [(set (v8i16 V128:$Rd), (IntOp (v8i8 V64:$Rn), (v8i8 V64:$Rm)))]>;
4778   def v16i8  : BaseSIMDDifferentThreeVector<U, 0b001, opc,
4779                                             V128, V128, V128,
4780                                             asm#"2", ".8h", ".16b", ".16b", []>;
4781   let Predicates = [HasCrypto] in {
4782     def v1i64  : BaseSIMDDifferentThreeVector<U, 0b110, opc,
4783                                               V128, V64, V64,
4784                                               asm, ".1q", ".1d", ".1d", []>;
4785     def v2i64  : BaseSIMDDifferentThreeVector<U, 0b111, opc,
4786                                               V128, V128, V128,
4787                                               asm#"2", ".1q", ".2d", ".2d", []>;
4788   }
4789
4790   def : Pat<(v8i16 (IntOp (v8i8 (extract_high_v16i8 V128:$Rn)),
4791                           (v8i8 (extract_high_v16i8 V128:$Rm)))),
4792       (!cast<Instruction>(NAME#"v16i8") V128:$Rn, V128:$Rm)>;
4793 }
4794
4795 multiclass SIMDLongThreeVectorHS<bit U, bits<4> opc, string asm,
4796                                  SDPatternOperator OpNode> {
4797   def v4i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b010, opc,
4798                                                   V128, V64, V64,
4799                                                   asm, ".4s", ".4h", ".4h",
4800       [(set (v4i32 V128:$Rd), (OpNode (v4i16 V64:$Rn), (v4i16 V64:$Rm)))]>;
4801   def v8i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b011, opc,
4802                                                   V128, V128, V128,
4803                                                   asm#"2", ".4s", ".8h", ".8h",
4804       [(set (v4i32 V128:$Rd), (OpNode (extract_high_v8i16 V128:$Rn),
4805                                       (extract_high_v8i16 V128:$Rm)))]>;
4806   def v2i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b100, opc,
4807                                                   V128, V64, V64,
4808                                                   asm, ".2d", ".2s", ".2s",
4809       [(set (v2i64 V128:$Rd), (OpNode (v2i32 V64:$Rn), (v2i32 V64:$Rm)))]>;
4810   def v4i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b101, opc,
4811                                                   V128, V128, V128,
4812                                                   asm#"2", ".2d", ".4s", ".4s",
4813       [(set (v2i64 V128:$Rd), (OpNode (extract_high_v4i32 V128:$Rn),
4814                                       (extract_high_v4i32 V128:$Rm)))]>;
4815 }
4816
4817 multiclass SIMDLongThreeVectorBHSabdl<bit U, bits<4> opc, string asm,
4818                                   SDPatternOperator OpNode = null_frag> {
4819   def v8i8_v8i16   : BaseSIMDDifferentThreeVector<U, 0b000, opc,
4820                                                   V128, V64, V64,
4821                                                   asm, ".8h", ".8b", ".8b",
4822       [(set (v8i16 V128:$Rd),
4823             (zext (v8i8 (OpNode (v8i8 V64:$Rn), (v8i8 V64:$Rm)))))]>;
4824   def v16i8_v8i16  : BaseSIMDDifferentThreeVector<U, 0b001, opc,
4825                                                  V128, V128, V128,
4826                                                  asm#"2", ".8h", ".16b", ".16b",
4827       [(set (v8i16 V128:$Rd),
4828             (zext (v8i8 (OpNode (extract_high_v16i8 V128:$Rn),
4829                                 (extract_high_v16i8 V128:$Rm)))))]>;
4830   def v4i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b010, opc,
4831                                                   V128, V64, V64,
4832                                                   asm, ".4s", ".4h", ".4h",
4833       [(set (v4i32 V128:$Rd),
4834             (zext (v4i16 (OpNode (v4i16 V64:$Rn), (v4i16 V64:$Rm)))))]>;
4835   def v8i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b011, opc,
4836                                                   V128, V128, V128,
4837                                                   asm#"2", ".4s", ".8h", ".8h",
4838       [(set (v4i32 V128:$Rd),
4839             (zext (v4i16 (OpNode (extract_high_v8i16 V128:$Rn),
4840                                   (extract_high_v8i16 V128:$Rm)))))]>;
4841   def v2i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b100, opc,
4842                                                   V128, V64, V64,
4843                                                   asm, ".2d", ".2s", ".2s",
4844       [(set (v2i64 V128:$Rd),
4845             (zext (v2i32 (OpNode (v2i32 V64:$Rn), (v2i32 V64:$Rm)))))]>;
4846   def v4i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b101, opc,
4847                                                   V128, V128, V128,
4848                                                   asm#"2", ".2d", ".4s", ".4s",
4849       [(set (v2i64 V128:$Rd),
4850             (zext (v2i32 (OpNode (extract_high_v4i32 V128:$Rn),
4851                                  (extract_high_v4i32 V128:$Rm)))))]>;
4852 }
4853
4854 multiclass SIMDLongThreeVectorTiedBHSabal<bit U, bits<4> opc,
4855                                           string asm,
4856                                           SDPatternOperator OpNode> {
4857   def v8i8_v8i16   : BaseSIMDDifferentThreeVectorTied<U, 0b000, opc,
4858                                                   V128, V64, V64,
4859                                                   asm, ".8h", ".8b", ".8b",
4860     [(set (v8i16 V128:$dst),
4861           (add (v8i16 V128:$Rd),
4862                (zext (v8i8 (OpNode (v8i8 V64:$Rn), (v8i8 V64:$Rm))))))]>;
4863   def v16i8_v8i16  : BaseSIMDDifferentThreeVectorTied<U, 0b001, opc,
4864                                                  V128, V128, V128,
4865                                                  asm#"2", ".8h", ".16b", ".16b",
4866     [(set (v8i16 V128:$dst),
4867           (add (v8i16 V128:$Rd),
4868                (zext (v8i8 (OpNode (extract_high_v16i8 V128:$Rn),
4869                                    (extract_high_v16i8 V128:$Rm))))))]>;
4870   def v4i16_v4i32  : BaseSIMDDifferentThreeVectorTied<U, 0b010, opc,
4871                                                   V128, V64, V64,
4872                                                   asm, ".4s", ".4h", ".4h",
4873     [(set (v4i32 V128:$dst),
4874           (add (v4i32 V128:$Rd),
4875                (zext (v4i16 (OpNode (v4i16 V64:$Rn), (v4i16 V64:$Rm))))))]>;
4876   def v8i16_v4i32  : BaseSIMDDifferentThreeVectorTied<U, 0b011, opc,
4877                                                   V128, V128, V128,
4878                                                   asm#"2", ".4s", ".8h", ".8h",
4879     [(set (v4i32 V128:$dst),
4880           (add (v4i32 V128:$Rd),
4881                (zext (v4i16 (OpNode (extract_high_v8i16 V128:$Rn),
4882                                     (extract_high_v8i16 V128:$Rm))))))]>;
4883   def v2i32_v2i64  : BaseSIMDDifferentThreeVectorTied<U, 0b100, opc,
4884                                                   V128, V64, V64,
4885                                                   asm, ".2d", ".2s", ".2s",
4886     [(set (v2i64 V128:$dst),
4887           (add (v2i64 V128:$Rd),
4888                (zext (v2i32 (OpNode (v2i32 V64:$Rn), (v2i32 V64:$Rm))))))]>;
4889   def v4i32_v2i64  : BaseSIMDDifferentThreeVectorTied<U, 0b101, opc,
4890                                                   V128, V128, V128,
4891                                                   asm#"2", ".2d", ".4s", ".4s",
4892     [(set (v2i64 V128:$dst),
4893           (add (v2i64 V128:$Rd),
4894                (zext (v2i32 (OpNode (extract_high_v4i32 V128:$Rn),
4895                                     (extract_high_v4i32 V128:$Rm))))))]>;
4896 }
4897
4898 multiclass SIMDLongThreeVectorBHS<bit U, bits<4> opc, string asm,
4899                                   SDPatternOperator OpNode = null_frag> {
4900   def v8i8_v8i16   : BaseSIMDDifferentThreeVector<U, 0b000, opc,
4901                                                   V128, V64, V64,
4902                                                   asm, ".8h", ".8b", ".8b",
4903       [(set (v8i16 V128:$Rd), (OpNode (v8i8 V64:$Rn), (v8i8 V64:$Rm)))]>;
4904   def v16i8_v8i16  : BaseSIMDDifferentThreeVector<U, 0b001, opc,
4905                                                  V128, V128, V128,
4906                                                  asm#"2", ".8h", ".16b", ".16b",
4907       [(set (v8i16 V128:$Rd), (OpNode (extract_high_v16i8 V128:$Rn),
4908                                       (extract_high_v16i8 V128:$Rm)))]>;
4909   def v4i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b010, opc,
4910                                                   V128, V64, V64,
4911                                                   asm, ".4s", ".4h", ".4h",
4912       [(set (v4i32 V128:$Rd), (OpNode (v4i16 V64:$Rn), (v4i16 V64:$Rm)))]>;
4913   def v8i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b011, opc,
4914                                                   V128, V128, V128,
4915                                                   asm#"2", ".4s", ".8h", ".8h",
4916       [(set (v4i32 V128:$Rd), (OpNode (extract_high_v8i16 V128:$Rn),
4917                                       (extract_high_v8i16 V128:$Rm)))]>;
4918   def v2i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b100, opc,
4919                                                   V128, V64, V64,
4920                                                   asm, ".2d", ".2s", ".2s",
4921       [(set (v2i64 V128:$Rd), (OpNode (v2i32 V64:$Rn), (v2i32 V64:$Rm)))]>;
4922   def v4i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b101, opc,
4923                                                   V128, V128, V128,
4924                                                   asm#"2", ".2d", ".4s", ".4s",
4925       [(set (v2i64 V128:$Rd), (OpNode (extract_high_v4i32 V128:$Rn),
4926                                       (extract_high_v4i32 V128:$Rm)))]>;
4927 }
4928
4929 multiclass SIMDLongThreeVectorTiedBHS<bit U, bits<4> opc,
4930                                       string asm,
4931                                       SDPatternOperator OpNode> {
4932   def v8i8_v8i16   : BaseSIMDDifferentThreeVectorTied<U, 0b000, opc,
4933                                                   V128, V64, V64,
4934                                                   asm, ".8h", ".8b", ".8b",
4935     [(set (v8i16 V128:$dst),
4936           (OpNode (v8i16 V128:$Rd), (v8i8 V64:$Rn), (v8i8 V64:$Rm)))]>;
4937   def v16i8_v8i16  : BaseSIMDDifferentThreeVectorTied<U, 0b001, opc,
4938                                                  V128, V128, V128,
4939                                                  asm#"2", ".8h", ".16b", ".16b",
4940     [(set (v8i16 V128:$dst),
4941           (OpNode (v8i16 V128:$Rd),
4942                   (extract_high_v16i8 V128:$Rn),
4943                   (extract_high_v16i8 V128:$Rm)))]>;
4944   def v4i16_v4i32  : BaseSIMDDifferentThreeVectorTied<U, 0b010, opc,
4945                                                   V128, V64, V64,
4946                                                   asm, ".4s", ".4h", ".4h",
4947     [(set (v4i32 V128:$dst),
4948           (OpNode (v4i32 V128:$Rd), (v4i16 V64:$Rn), (v4i16 V64:$Rm)))]>;
4949   def v8i16_v4i32  : BaseSIMDDifferentThreeVectorTied<U, 0b011, opc,
4950                                                   V128, V128, V128,
4951                                                   asm#"2", ".4s", ".8h", ".8h",
4952     [(set (v4i32 V128:$dst),
4953           (OpNode (v4i32 V128:$Rd),
4954                   (extract_high_v8i16 V128:$Rn),
4955                   (extract_high_v8i16 V128:$Rm)))]>;
4956   def v2i32_v2i64  : BaseSIMDDifferentThreeVectorTied<U, 0b100, opc,
4957                                                   V128, V64, V64,
4958                                                   asm, ".2d", ".2s", ".2s",
4959     [(set (v2i64 V128:$dst),
4960           (OpNode (v2i64 V128:$Rd), (v2i32 V64:$Rn), (v2i32 V64:$Rm)))]>;
4961   def v4i32_v2i64  : BaseSIMDDifferentThreeVectorTied<U, 0b101, opc,
4962                                                   V128, V128, V128,
4963                                                   asm#"2", ".2d", ".4s", ".4s",
4964     [(set (v2i64 V128:$dst),
4965           (OpNode (v2i64 V128:$Rd),
4966                   (extract_high_v4i32 V128:$Rn),
4967                   (extract_high_v4i32 V128:$Rm)))]>;
4968 }
4969
4970 multiclass SIMDLongThreeVectorSQDMLXTiedHS<bit U, bits<4> opc, string asm,
4971                                            SDPatternOperator Accum> {
4972   def v4i16_v4i32  : BaseSIMDDifferentThreeVectorTied<U, 0b010, opc,
4973                                                   V128, V64, V64,
4974                                                   asm, ".4s", ".4h", ".4h",
4975     [(set (v4i32 V128:$dst),
4976           (Accum (v4i32 V128:$Rd),
4977                  (v4i32 (int_arm64_neon_sqdmull (v4i16 V64:$Rn),
4978                                                 (v4i16 V64:$Rm)))))]>;
4979   def v8i16_v4i32  : BaseSIMDDifferentThreeVectorTied<U, 0b011, opc,
4980                                                   V128, V128, V128,
4981                                                   asm#"2", ".4s", ".8h", ".8h",
4982     [(set (v4i32 V128:$dst),
4983           (Accum (v4i32 V128:$Rd),
4984                  (v4i32 (int_arm64_neon_sqdmull (extract_high_v8i16 V128:$Rn),
4985                                             (extract_high_v8i16 V128:$Rm)))))]>;
4986   def v2i32_v2i64  : BaseSIMDDifferentThreeVectorTied<U, 0b100, opc,
4987                                                   V128, V64, V64,
4988                                                   asm, ".2d", ".2s", ".2s",
4989     [(set (v2i64 V128:$dst),
4990           (Accum (v2i64 V128:$Rd),
4991                  (v2i64 (int_arm64_neon_sqdmull (v2i32 V64:$Rn),
4992                                                 (v2i32 V64:$Rm)))))]>;
4993   def v4i32_v2i64  : BaseSIMDDifferentThreeVectorTied<U, 0b101, opc,
4994                                                   V128, V128, V128,
4995                                                   asm#"2", ".2d", ".4s", ".4s",
4996     [(set (v2i64 V128:$dst),
4997           (Accum (v2i64 V128:$Rd),
4998                  (v2i64 (int_arm64_neon_sqdmull (extract_high_v4i32 V128:$Rn),
4999                                             (extract_high_v4i32 V128:$Rm)))))]>;
5000 }
5001
5002 multiclass SIMDWideThreeVectorBHS<bit U, bits<4> opc, string asm,
5003                                   SDPatternOperator OpNode> {
5004   def v8i8_v8i16   : BaseSIMDDifferentThreeVector<U, 0b000, opc,
5005                                                   V128, V128, V64,
5006                                                   asm, ".8h", ".8h", ".8b",
5007        [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn), (v8i8 V64:$Rm)))]>;
5008   def v16i8_v8i16  : BaseSIMDDifferentThreeVector<U, 0b001, opc,
5009                                                   V128, V128, V128,
5010                                                   asm#"2", ".8h", ".8h", ".16b",
5011        [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn),
5012                                        (extract_high_v16i8 V128:$Rm)))]>;
5013   def v4i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b010, opc,
5014                                                   V128, V128, V64,
5015                                                   asm, ".4s", ".4s", ".4h",
5016        [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn), (v4i16 V64:$Rm)))]>;
5017   def v8i16_v4i32  : BaseSIMDDifferentThreeVector<U, 0b011, opc,
5018                                                   V128, V128, V128,
5019                                                   asm#"2", ".4s", ".4s", ".8h",
5020        [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn),
5021                                        (extract_high_v8i16 V128:$Rm)))]>;
5022   def v2i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b100, opc,
5023                                                   V128, V128, V64,
5024                                                   asm, ".2d", ".2d", ".2s",
5025        [(set (v2i64 V128:$Rd), (OpNode (v2i64 V128:$Rn), (v2i32 V64:$Rm)))]>;
5026   def v4i32_v2i64  : BaseSIMDDifferentThreeVector<U, 0b101, opc,
5027                                                   V128, V128, V128,
5028                                                   asm#"2", ".2d", ".2d", ".4s",
5029        [(set (v2i64 V128:$Rd), (OpNode (v2i64 V128:$Rn),
5030                                        (extract_high_v4i32 V128:$Rm)))]>;
5031 }
5032
5033 //----------------------------------------------------------------------------
5034 // AdvSIMD bitwise extract from vector
5035 //----------------------------------------------------------------------------
5036
5037 class BaseSIMDBitwiseExtract<bit size, RegisterOperand regtype, ValueType vty,
5038                              string asm, string kind>
5039   : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm, i32imm:$imm), asm,
5040       "{\t$Rd" # kind # ", $Rn" # kind # ", $Rm" # kind # ", $imm" #
5041       "|" # kind # "\t$Rd, $Rn, $Rm, $imm}", "",
5042       [(set (vty regtype:$Rd),
5043             (ARM64ext regtype:$Rn, regtype:$Rm, (i32 imm:$imm)))]>,
5044     Sched<[WriteV]> {
5045   bits<5> Rd;
5046   bits<5> Rn;
5047   bits<5> Rm;
5048   bits<4> imm;
5049   let Inst{31}    = 0;
5050   let Inst{30}    = size;
5051   let Inst{29-21} = 0b101110000;
5052   let Inst{20-16} = Rm;
5053   let Inst{15}    = 0;
5054   let Inst{14-11} = imm;
5055   let Inst{10}    = 0;
5056   let Inst{9-5}   = Rn;
5057   let Inst{4-0}   = Rd;
5058 }
5059
5060
5061 multiclass SIMDBitwiseExtract<string asm> {
5062   def v8i8  : BaseSIMDBitwiseExtract<0, V64, v8i8, asm, ".8b"> {
5063     let imm{3} = 0;
5064   }
5065   def v16i8 : BaseSIMDBitwiseExtract<1, V128, v16i8, asm, ".16b">;
5066 }
5067
5068 //----------------------------------------------------------------------------
5069 // AdvSIMD zip vector
5070 //----------------------------------------------------------------------------
5071
5072 class BaseSIMDZipVector<bits<3> size, bits<3> opc, RegisterOperand regtype,
5073                         string asm, string kind, SDNode OpNode, ValueType valty>
5074   : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm), asm,
5075       "{\t$Rd" # kind # ", $Rn" # kind # ", $Rm" # kind #
5076       "|" # kind # "\t$Rd, $Rn, $Rm}", "",
5077       [(set (valty regtype:$Rd), (OpNode regtype:$Rn, regtype:$Rm))]>,
5078     Sched<[WriteV]> {
5079   bits<5> Rd;
5080   bits<5> Rn;
5081   bits<5> Rm;
5082   let Inst{31}    = 0;
5083   let Inst{30}    = size{0};
5084   let Inst{29-24} = 0b001110;
5085   let Inst{23-22} = size{2-1};
5086   let Inst{21}    = 0;
5087   let Inst{20-16} = Rm;
5088   let Inst{15}    = 0;
5089   let Inst{14-12} = opc;
5090   let Inst{11-10} = 0b10;
5091   let Inst{9-5}   = Rn;
5092   let Inst{4-0}   = Rd;
5093 }
5094
5095 multiclass SIMDZipVector<bits<3>opc, string asm,
5096                          SDNode OpNode> {
5097   def v8i8   : BaseSIMDZipVector<0b000, opc, V64,
5098       asm, ".8b", OpNode, v8i8>;
5099   def v16i8  : BaseSIMDZipVector<0b001, opc, V128,
5100       asm, ".16b", OpNode, v16i8>;
5101   def v4i16  : BaseSIMDZipVector<0b010, opc, V64,
5102       asm, ".4h", OpNode, v4i16>;
5103   def v8i16  : BaseSIMDZipVector<0b011, opc, V128,
5104       asm, ".8h", OpNode, v8i16>;
5105   def v2i32  : BaseSIMDZipVector<0b100, opc, V64,
5106       asm, ".2s", OpNode, v2i32>;
5107   def v4i32  : BaseSIMDZipVector<0b101, opc, V128,
5108       asm, ".4s", OpNode, v4i32>;
5109   def v2i64  : BaseSIMDZipVector<0b111, opc, V128,
5110       asm, ".2d", OpNode, v2i64>;
5111
5112   def : Pat<(v2f32 (OpNode V64:$Rn, V64:$Rm)),
5113         (!cast<Instruction>(NAME#"v2i32") V64:$Rn, V64:$Rm)>;
5114   def : Pat<(v4f32 (OpNode V128:$Rn, V128:$Rm)),
5115         (!cast<Instruction>(NAME#"v4i32") V128:$Rn, V128:$Rm)>;
5116   def : Pat<(v2f64 (OpNode V128:$Rn, V128:$Rm)),
5117         (!cast<Instruction>(NAME#"v2i64") V128:$Rn, V128:$Rm)>;
5118 }
5119
5120 //----------------------------------------------------------------------------
5121 // AdvSIMD three register scalar instructions
5122 //----------------------------------------------------------------------------
5123
5124 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
5125 class BaseSIMDThreeScalar<bit U, bits<2> size, bits<5> opcode,
5126                         RegisterClass regtype, string asm,
5127                         list<dag> pattern>
5128   : I<(outs regtype:$Rd), (ins regtype:$Rn, regtype:$Rm), asm,
5129       "\t$Rd, $Rn, $Rm", "", pattern>,
5130     Sched<[WriteV]> {
5131   bits<5> Rd;
5132   bits<5> Rn;
5133   bits<5> Rm;
5134   let Inst{31-30} = 0b01;
5135   let Inst{29}    = U;
5136   let Inst{28-24} = 0b11110;
5137   let Inst{23-22} = size;
5138   let Inst{21}    = 1;
5139   let Inst{20-16} = Rm;
5140   let Inst{15-11} = opcode;
5141   let Inst{10}    = 1;
5142   let Inst{9-5}   = Rn;
5143   let Inst{4-0}   = Rd;
5144 }
5145
5146 multiclass SIMDThreeScalarD<bit U, bits<5> opc, string asm,
5147                             SDPatternOperator OpNode> {
5148   def v1i64  : BaseSIMDThreeScalar<U, 0b11, opc, FPR64, asm,
5149     [(set (v1i64 FPR64:$Rd), (OpNode (v1i64 FPR64:$Rn), (v1i64 FPR64:$Rm)))]>;
5150 }
5151
5152 multiclass SIMDThreeScalarBHSD<bit U, bits<5> opc, string asm,
5153                                SDPatternOperator OpNode> {
5154   def v1i64  : BaseSIMDThreeScalar<U, 0b11, opc, FPR64, asm,
5155     [(set (v1i64 FPR64:$Rd), (OpNode (v1i64 FPR64:$Rn), (v1i64 FPR64:$Rm)))]>;
5156   def v1i32  : BaseSIMDThreeScalar<U, 0b10, opc, FPR32, asm, []>;
5157   def v1i16  : BaseSIMDThreeScalar<U, 0b01, opc, FPR16, asm, []>;
5158   def v1i8   : BaseSIMDThreeScalar<U, 0b00, opc, FPR8 , asm, []>;
5159
5160   def : Pat<(i64 (OpNode (i64 FPR64:$Rn), (i64 FPR64:$Rm))),
5161             (!cast<Instruction>(NAME#"v1i64") FPR64:$Rn, FPR64:$Rm)>;
5162   def : Pat<(i32 (OpNode (i32 FPR32:$Rn), (i32 FPR32:$Rm))),
5163             (!cast<Instruction>(NAME#"v1i32") FPR32:$Rn, FPR32:$Rm)>;
5164 }
5165
5166 multiclass SIMDThreeScalarHS<bit U, bits<5> opc, string asm,
5167                              SDPatternOperator OpNode> {
5168   def v1i32  : BaseSIMDThreeScalar<U, 0b10, opc, FPR32, asm,
5169                              [(set FPR32:$Rd, (OpNode FPR32:$Rn, FPR32:$Rm))]>;
5170   def v1i16  : BaseSIMDThreeScalar<U, 0b01, opc, FPR16, asm, []>;
5171 }
5172
5173 multiclass SIMDThreeScalarSD<bit U, bit S, bits<5> opc, string asm,
5174                              SDPatternOperator OpNode = null_frag> {
5175   let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
5176     def #NAME#64 : BaseSIMDThreeScalar<U, {S,1}, opc, FPR64, asm,
5177       [(set (f64 FPR64:$Rd), (OpNode (f64 FPR64:$Rn), (f64 FPR64:$Rm)))]>;
5178     def #NAME#32 : BaseSIMDThreeScalar<U, {S,0}, opc, FPR32, asm,
5179       [(set FPR32:$Rd, (OpNode FPR32:$Rn, FPR32:$Rm))]>;
5180   }
5181
5182   def : Pat<(v1f64 (OpNode (v1f64 FPR64:$Rn), (v1f64 FPR64:$Rm))),
5183             (!cast<Instruction>(NAME # "64") FPR64:$Rn, FPR64:$Rm)>;
5184 }
5185
5186 multiclass SIMDThreeScalarFPCmp<bit U, bit S, bits<5> opc, string asm,
5187                                 SDPatternOperator OpNode = null_frag> {
5188   let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
5189     def #NAME#64 : BaseSIMDThreeScalar<U, {S,1}, opc, FPR64, asm,
5190       [(set (i64 FPR64:$Rd), (OpNode (f64 FPR64:$Rn), (f64 FPR64:$Rm)))]>;
5191     def #NAME#32 : BaseSIMDThreeScalar<U, {S,0}, opc, FPR32, asm,
5192       [(set (i32 FPR32:$Rd), (OpNode (f32 FPR32:$Rn), (f32 FPR32:$Rm)))]>;
5193   }
5194
5195   def : Pat<(v1i64 (OpNode (v1f64 FPR64:$Rn), (v1f64 FPR64:$Rm))),
5196             (!cast<Instruction>(NAME # "64") FPR64:$Rn, FPR64:$Rm)>;
5197 }
5198
5199 class BaseSIMDThreeScalarMixed<bit U, bits<2> size, bits<5> opcode,
5200               dag oops, dag iops, string asm, string cstr, list<dag> pat>
5201   : I<oops, iops, asm,
5202       "\t$Rd, $Rn, $Rm", cstr, pat>,
5203     Sched<[WriteV]> {
5204   bits<5> Rd;
5205   bits<5> Rn;
5206   bits<5> Rm;
5207   let Inst{31-30} = 0b01;
5208   let Inst{29}    = U;
5209   let Inst{28-24} = 0b11110;
5210   let Inst{23-22} = size;
5211   let Inst{21}    = 1;
5212   let Inst{20-16} = Rm;
5213   let Inst{15-11} = opcode;
5214   let Inst{10}    = 0;
5215   let Inst{9-5}   = Rn;
5216   let Inst{4-0}   = Rd;
5217 }
5218
5219 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5220 multiclass SIMDThreeScalarMixedHS<bit U, bits<5> opc, string asm,
5221                                   SDPatternOperator OpNode = null_frag> {
5222   def i16  : BaseSIMDThreeScalarMixed<U, 0b01, opc,
5223                                       (outs FPR32:$Rd),
5224                                       (ins FPR16:$Rn, FPR16:$Rm), asm, "", []>;
5225   def i32  : BaseSIMDThreeScalarMixed<U, 0b10, opc,
5226                                       (outs FPR64:$Rd),
5227                                       (ins FPR32:$Rn, FPR32:$Rm), asm, "",
5228             [(set (i64 FPR64:$Rd), (OpNode (i32 FPR32:$Rn), (i32 FPR32:$Rm)))]>;
5229 }
5230
5231 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5232 multiclass SIMDThreeScalarMixedTiedHS<bit U, bits<5> opc, string asm,
5233                                   SDPatternOperator OpNode = null_frag> {
5234   def i16  : BaseSIMDThreeScalarMixed<U, 0b01, opc,
5235                                       (outs FPR32:$dst),
5236                                       (ins FPR32:$Rd, FPR16:$Rn, FPR16:$Rm),
5237                                       asm, "$Rd = $dst", []>;
5238   def i32  : BaseSIMDThreeScalarMixed<U, 0b10, opc,
5239                                       (outs FPR64:$dst),
5240                                       (ins FPR64:$Rd, FPR32:$Rn, FPR32:$Rm),
5241                                       asm, "$Rd = $dst",
5242             [(set (i64 FPR64:$dst),
5243                   (OpNode (i64 FPR64:$Rd), (i32 FPR32:$Rn), (i32 FPR32:$Rm)))]>;
5244 }
5245
5246 //----------------------------------------------------------------------------
5247 // AdvSIMD two register scalar instructions
5248 //----------------------------------------------------------------------------
5249
5250 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5251 class BaseSIMDTwoScalar<bit U, bits<2> size, bits<5> opcode,
5252                         RegisterClass regtype, RegisterClass regtype2,
5253                         string asm, list<dag> pat>
5254   : I<(outs regtype:$Rd), (ins regtype2:$Rn), asm,
5255       "\t$Rd, $Rn", "", pat>,
5256     Sched<[WriteV]> {
5257   bits<5> Rd;
5258   bits<5> Rn;
5259   let Inst{31-30} = 0b01;
5260   let Inst{29}    = U;
5261   let Inst{28-24} = 0b11110;
5262   let Inst{23-22} = size;
5263   let Inst{21-17} = 0b10000;
5264   let Inst{16-12} = opcode;
5265   let Inst{11-10} = 0b10;
5266   let Inst{9-5}   = Rn;
5267   let Inst{4-0}   = Rd;
5268 }
5269
5270 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5271 class BaseSIMDTwoScalarTied<bit U, bits<2> size, bits<5> opcode,
5272                         RegisterClass regtype, RegisterClass regtype2,
5273                         string asm, list<dag> pat>
5274   : I<(outs regtype:$dst), (ins regtype:$Rd, regtype2:$Rn), asm,
5275       "\t$Rd, $Rn", "$Rd = $dst", pat>,
5276     Sched<[WriteV]> {
5277   bits<5> Rd;
5278   bits<5> Rn;
5279   let Inst{31-30} = 0b01;
5280   let Inst{29}    = U;
5281   let Inst{28-24} = 0b11110;
5282   let Inst{23-22} = size;
5283   let Inst{21-17} = 0b10000;
5284   let Inst{16-12} = opcode;
5285   let Inst{11-10} = 0b10;
5286   let Inst{9-5}   = Rn;
5287   let Inst{4-0}   = Rd;
5288 }
5289
5290
5291 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5292 class BaseSIMDCmpTwoScalar<bit U, bits<2> size, bits<5> opcode,
5293                         RegisterClass regtype, string asm, string zero>
5294   : I<(outs regtype:$Rd), (ins regtype:$Rn), asm,
5295       "\t$Rd, $Rn, #" # zero, "", []>,
5296     Sched<[WriteV]> {
5297   bits<5> Rd;
5298   bits<5> Rn;
5299   let Inst{31-30} = 0b01;
5300   let Inst{29}    = U;
5301   let Inst{28-24} = 0b11110;
5302   let Inst{23-22} = size;
5303   let Inst{21-17} = 0b10000;
5304   let Inst{16-12} = opcode;
5305   let Inst{11-10} = 0b10;
5306   let Inst{9-5}   = Rn;
5307   let Inst{4-0}   = Rd;
5308 }
5309
5310 class SIMDInexactCvtTwoScalar<bits<5> opcode, string asm>
5311   : I<(outs FPR32:$Rd), (ins FPR64:$Rn), asm, "\t$Rd, $Rn", "",
5312      [(set (f32 FPR32:$Rd), (int_arm64_sisd_fcvtxn (f64 FPR64:$Rn)))]>,
5313     Sched<[WriteV]> {
5314   bits<5> Rd;
5315   bits<5> Rn;
5316   let Inst{31-17} = 0b011111100110000;
5317   let Inst{16-12} = opcode;
5318   let Inst{11-10} = 0b10;
5319   let Inst{9-5}   = Rn;
5320   let Inst{4-0}   = Rd;
5321 }
5322
5323 multiclass SIMDCmpTwoScalarD<bit U, bits<5> opc, string asm,
5324                              SDPatternOperator OpNode> {
5325   def v1i64rz  : BaseSIMDCmpTwoScalar<U, 0b11, opc, FPR64, asm, "0">;
5326
5327   def : Pat<(v1i64 (OpNode FPR64:$Rn)),
5328             (!cast<Instruction>(NAME # v1i64rz) FPR64:$Rn)>;
5329 }
5330
5331 multiclass SIMDCmpTwoScalarSD<bit U, bit S, bits<5> opc, string asm,
5332                               SDPatternOperator OpNode> {
5333   def v1i64rz  : BaseSIMDCmpTwoScalar<U, {S,1}, opc, FPR64, asm, "0.0">;
5334   def v1i32rz  : BaseSIMDCmpTwoScalar<U, {S,0}, opc, FPR32, asm, "0.0">;
5335
5336   def : InstAlias<asm # " $Rd, $Rn, #0",
5337                   (!cast<Instruction>(NAME # v1i64rz) FPR64:$Rd, FPR64:$Rn)>;
5338   def : InstAlias<asm # " $Rd, $Rn, #0",
5339                   (!cast<Instruction>(NAME # v1i32rz) FPR32:$Rd, FPR32:$Rn)>;
5340
5341   def : Pat<(v1i64 (OpNode (v1f64 FPR64:$Rn))),
5342             (!cast<Instruction>(NAME # v1i64rz) FPR64:$Rn)>;
5343 }
5344
5345 multiclass SIMDTwoScalarD<bit U, bits<5> opc, string asm,
5346                           SDPatternOperator OpNode = null_frag> {
5347   def v1i64       : BaseSIMDTwoScalar<U, 0b11, opc, FPR64, FPR64, asm,
5348     [(set (v1i64 FPR64:$Rd), (OpNode (v1i64 FPR64:$Rn)))]>;
5349
5350   def : Pat<(i64 (OpNode (i64 FPR64:$Rn))),
5351             (!cast<Instruction>(NAME # "v1i64") FPR64:$Rn)>;
5352 }
5353
5354 multiclass SIMDTwoScalarSD<bit U, bit S, bits<5> opc, string asm> {
5355   def v1i64       : BaseSIMDTwoScalar<U, {S,1}, opc, FPR64, FPR64, asm,[]>;
5356   def v1i32       : BaseSIMDTwoScalar<U, {S,0}, opc, FPR32, FPR32, asm,[]>;
5357 }
5358
5359 multiclass SIMDTwoScalarCVTSD<bit U, bit S, bits<5> opc, string asm,
5360                               SDPatternOperator OpNode> {
5361   def v1i64 : BaseSIMDTwoScalar<U, {S,1}, opc, FPR64, FPR64, asm,
5362                                 [(set FPR64:$Rd, (OpNode (f64 FPR64:$Rn)))]>;
5363   def v1i32 : BaseSIMDTwoScalar<U, {S,0}, opc, FPR32, FPR32, asm,
5364                                 [(set FPR32:$Rd, (OpNode (f32 FPR32:$Rn)))]>;
5365 }
5366
5367 multiclass SIMDTwoScalarBHSD<bit U, bits<5> opc, string asm,
5368                              SDPatternOperator OpNode = null_frag> {
5369   let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
5370     def v1i64  : BaseSIMDTwoScalar<U, 0b11, opc, FPR64, FPR64, asm,
5371            [(set (i64 FPR64:$Rd), (OpNode (i64 FPR64:$Rn)))]>;
5372     def v1i32  : BaseSIMDTwoScalar<U, 0b10, opc, FPR32, FPR32, asm,
5373            [(set (i32 FPR32:$Rd), (OpNode (i32 FPR32:$Rn)))]>;
5374     def v1i16  : BaseSIMDTwoScalar<U, 0b01, opc, FPR16, FPR16, asm, []>;
5375     def v1i8   : BaseSIMDTwoScalar<U, 0b00, opc, FPR8 , FPR8 , asm, []>;
5376   }
5377
5378   def : Pat<(v1i64 (OpNode (v1i64 FPR64:$Rn))),
5379             (!cast<Instruction>(NAME # v1i64) FPR64:$Rn)>;
5380 }
5381
5382 multiclass SIMDTwoScalarBHSDTied<bit U, bits<5> opc, string asm,
5383                                  Intrinsic OpNode> {
5384   let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
5385     def v1i64  : BaseSIMDTwoScalarTied<U, 0b11, opc, FPR64, FPR64, asm,
5386         [(set (i64 FPR64:$dst), (OpNode (i64 FPR64:$Rd), (i64 FPR64:$Rn)))]>;
5387     def v1i32  : BaseSIMDTwoScalarTied<U, 0b10, opc, FPR32, FPR32, asm,
5388         [(set (i32 FPR32:$dst), (OpNode (i32 FPR32:$Rd), (i32 FPR32:$Rn)))]>;
5389     def v1i16  : BaseSIMDTwoScalarTied<U, 0b01, opc, FPR16, FPR16, asm, []>;
5390     def v1i8   : BaseSIMDTwoScalarTied<U, 0b00, opc, FPR8 , FPR8 , asm, []>;
5391   }
5392
5393   def : Pat<(v1i64 (OpNode (v1i64 FPR64:$Rd), (v1i64 FPR64:$Rn))),
5394             (!cast<Instruction>(NAME # v1i64) FPR64:$Rd, FPR64:$Rn)>;
5395 }
5396
5397
5398
5399 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5400 multiclass SIMDTwoScalarMixedBHS<bit U, bits<5> opc, string asm,
5401                                  SDPatternOperator OpNode = null_frag> {
5402   def v1i32  : BaseSIMDTwoScalar<U, 0b10, opc, FPR32, FPR64, asm,
5403         [(set (i32 FPR32:$Rd), (OpNode (i64 FPR64:$Rn)))]>;
5404   def v1i16  : BaseSIMDTwoScalar<U, 0b01, opc, FPR16, FPR32, asm, []>;
5405   def v1i8   : BaseSIMDTwoScalar<U, 0b00, opc, FPR8 , FPR16, asm, []>;
5406 }
5407
5408 //----------------------------------------------------------------------------
5409 // AdvSIMD scalar pairwise instructions
5410 //----------------------------------------------------------------------------
5411
5412 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5413 class BaseSIMDPairwiseScalar<bit U, bits<2> size, bits<5> opcode,
5414                         RegisterOperand regtype, RegisterOperand vectype,
5415                         string asm, string kind>
5416   : I<(outs regtype:$Rd), (ins vectype:$Rn), asm,
5417       "{\t$Rd, $Rn" # kind # "|" # kind # "\t$Rd, $Rn}", "", []>,
5418     Sched<[WriteV]> {
5419   bits<5> Rd;
5420   bits<5> Rn;
5421   let Inst{31-30} = 0b01;
5422   let Inst{29}    = U;
5423   let Inst{28-24} = 0b11110;
5424   let Inst{23-22} = size;
5425   let Inst{21-17} = 0b11000;
5426   let Inst{16-12} = opcode;
5427   let Inst{11-10} = 0b10;
5428   let Inst{9-5}   = Rn;
5429   let Inst{4-0}   = Rd;
5430 }
5431
5432 multiclass SIMDPairwiseScalarD<bit U, bits<5> opc, string asm> {
5433   def v2i64p : BaseSIMDPairwiseScalar<U, 0b11, opc, FPR64Op, V128,
5434                                       asm, ".2d">;
5435 }
5436
5437 multiclass SIMDPairwiseScalarSD<bit U, bit S, bits<5> opc, string asm> {
5438   def v2i32p : BaseSIMDPairwiseScalar<U, {S,0}, opc, FPR32Op, V64,
5439                                       asm, ".2s">;
5440   def v2i64p : BaseSIMDPairwiseScalar<U, {S,1}, opc, FPR64Op, V128,
5441                                       asm, ".2d">;
5442 }
5443
5444 //----------------------------------------------------------------------------
5445 // AdvSIMD across lanes instructions
5446 //----------------------------------------------------------------------------
5447
5448 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5449 class BaseSIMDAcrossLanes<bit Q, bit U, bits<2> size, bits<5> opcode,
5450                           RegisterClass regtype, RegisterOperand vectype,
5451                           string asm, string kind, list<dag> pattern>
5452   : I<(outs regtype:$Rd), (ins vectype:$Rn), asm,
5453       "{\t$Rd, $Rn" # kind # "|" # kind # "\t$Rd, $Rn}", "", pattern>,
5454     Sched<[WriteV]> {
5455   bits<5> Rd;
5456   bits<5> Rn;
5457   let Inst{31}    = 0;
5458   let Inst{30}    = Q;
5459   let Inst{29}    = U;
5460   let Inst{28-24} = 0b01110;
5461   let Inst{23-22} = size;
5462   let Inst{21-17} = 0b11000;
5463   let Inst{16-12} = opcode;
5464   let Inst{11-10} = 0b10;
5465   let Inst{9-5}   = Rn;
5466   let Inst{4-0}   = Rd;
5467 }
5468
5469 multiclass SIMDAcrossLanesBHS<bit U, bits<5> opcode,
5470                               string asm> {
5471   def v8i8v  : BaseSIMDAcrossLanes<0, U, 0b00, opcode, FPR8,  V64,
5472                                    asm, ".8b", []>;
5473   def v16i8v : BaseSIMDAcrossLanes<1, U, 0b00, opcode, FPR8,  V128,
5474                                    asm, ".16b", []>;
5475   def v4i16v : BaseSIMDAcrossLanes<0, U, 0b01, opcode, FPR16, V64,
5476                                    asm, ".4h", []>;
5477   def v8i16v : BaseSIMDAcrossLanes<1, U, 0b01, opcode, FPR16, V128,
5478                                    asm, ".8h", []>;
5479   def v4i32v : BaseSIMDAcrossLanes<1, U, 0b10, opcode, FPR32, V128,
5480                                    asm, ".4s", []>;
5481 }
5482
5483 multiclass SIMDAcrossLanesHSD<bit U, bits<5> opcode, string asm> {
5484   def v8i8v  : BaseSIMDAcrossLanes<0, U, 0b00, opcode, FPR16, V64,
5485                                    asm, ".8b", []>;
5486   def v16i8v : BaseSIMDAcrossLanes<1, U, 0b00, opcode, FPR16, V128,
5487                                    asm, ".16b", []>;
5488   def v4i16v : BaseSIMDAcrossLanes<0, U, 0b01, opcode, FPR32, V64,
5489                                    asm, ".4h", []>;
5490   def v8i16v : BaseSIMDAcrossLanes<1, U, 0b01, opcode, FPR32, V128,
5491                                    asm, ".8h", []>;
5492   def v4i32v : BaseSIMDAcrossLanes<1, U, 0b10, opcode, FPR64, V128,
5493                                    asm, ".4s", []>;
5494 }
5495
5496 multiclass SIMDAcrossLanesS<bits<5> opcode, bit sz1, string asm,
5497                             Intrinsic intOp> {
5498   def v4i32v : BaseSIMDAcrossLanes<1, 1, {sz1, 0}, opcode, FPR32, V128,
5499                                    asm, ".4s",
5500         [(set FPR32:$Rd, (intOp (v4f32 V128:$Rn)))]>;
5501 }
5502
5503 //----------------------------------------------------------------------------
5504 // AdvSIMD INS/DUP instructions
5505 //----------------------------------------------------------------------------
5506
5507 // FIXME: There has got to be a better way to factor these. ugh.
5508
5509 class BaseSIMDInsDup<bit Q, bit op, dag outs, dag ins, string asm,
5510                      string operands, string constraints, list<dag> pattern>
5511   : I<outs, ins, asm, operands, constraints, pattern>,
5512     Sched<[WriteV]> {
5513   bits<5> Rd;
5514   bits<5> Rn;
5515   let Inst{31} = 0;
5516   let Inst{30} = Q;
5517   let Inst{29} = op;
5518   let Inst{28-21} = 0b01110000;
5519   let Inst{15} = 0;
5520   let Inst{10} = 1;
5521   let Inst{9-5} = Rn;
5522   let Inst{4-0} = Rd;
5523 }
5524
5525 class SIMDDupFromMain<bit Q, bits<5> imm5, string size, ValueType vectype,
5526                       RegisterOperand vecreg, RegisterClass regtype>
5527   : BaseSIMDInsDup<Q, 0, (outs vecreg:$Rd), (ins regtype:$Rn), "dup",
5528                    "{\t$Rd" # size # ", $Rn" #
5529                    "|" # size # "\t$Rd, $Rn}", "",
5530                    [(set (vectype vecreg:$Rd), (ARM64dup regtype:$Rn))]> {
5531   let Inst{20-16} = imm5;
5532   let Inst{14-11} = 0b0001;
5533 }
5534
5535 class SIMDDupFromElement<bit Q, string dstkind, string srckind,
5536                          ValueType vectype, ValueType insreg,
5537                          RegisterOperand vecreg, Operand idxtype,
5538                          ValueType elttype, SDNode OpNode>
5539   : BaseSIMDInsDup<Q, 0, (outs vecreg:$Rd), (ins V128:$Rn, idxtype:$idx), "dup",
5540                    "{\t$Rd" # dstkind # ", $Rn" # srckind # "$idx" #
5541                    "|" # dstkind # "\t$Rd, $Rn$idx}", "",
5542                  [(set (vectype vecreg:$Rd),
5543                        (OpNode (insreg V128:$Rn), idxtype:$idx))]> {
5544   let Inst{14-11} = 0b0000;
5545 }
5546
5547 class SIMDDup64FromElement
5548   : SIMDDupFromElement<1, ".2d", ".d", v2i64, v2i64, V128,
5549                        VectorIndexD, i64, ARM64duplane64> {
5550   bits<1> idx;
5551   let Inst{20} = idx;
5552   let Inst{19-16} = 0b1000;
5553 }
5554
5555 class SIMDDup32FromElement<bit Q, string size, ValueType vectype,
5556                            RegisterOperand vecreg>
5557   : SIMDDupFromElement<Q, size, ".s", vectype, v4i32, vecreg,
5558                        VectorIndexS, i64, ARM64duplane32> {
5559   bits<2> idx;
5560   let Inst{20-19} = idx;
5561   let Inst{18-16} = 0b100;
5562 }
5563
5564 class SIMDDup16FromElement<bit Q, string size, ValueType vectype,
5565                            RegisterOperand vecreg>
5566   : SIMDDupFromElement<Q, size, ".h", vectype, v8i16, vecreg,
5567                        VectorIndexH, i64, ARM64duplane16> {
5568   bits<3> idx;
5569   let Inst{20-18} = idx;
5570   let Inst{17-16} = 0b10;
5571 }
5572
5573 class SIMDDup8FromElement<bit Q, string size, ValueType vectype,
5574                           RegisterOperand vecreg>
5575   : SIMDDupFromElement<Q, size, ".b", vectype, v16i8, vecreg,
5576                        VectorIndexB, i64, ARM64duplane8> {
5577   bits<4> idx;
5578   let Inst{20-17} = idx;
5579   let Inst{16} = 1;
5580 }
5581
5582 class BaseSIMDMov<bit Q, string size, bits<4> imm4, RegisterClass regtype,
5583                   Operand idxtype, string asm, list<dag> pattern>
5584   : BaseSIMDInsDup<Q, 0, (outs regtype:$Rd), (ins V128:$Rn, idxtype:$idx), asm,
5585                    "{\t$Rd, $Rn" # size # "$idx" #
5586                    "|" # size # "\t$Rd, $Rn$idx}", "", pattern> {
5587   let Inst{14-11} = imm4;
5588 }
5589
5590 class SIMDSMov<bit Q, string size, RegisterClass regtype,
5591                Operand idxtype>
5592   : BaseSIMDMov<Q, size, 0b0101, regtype, idxtype, "smov", []>;
5593 class SIMDUMov<bit Q, string size, ValueType vectype, RegisterClass regtype,
5594                Operand idxtype>
5595   : BaseSIMDMov<Q, size, 0b0111, regtype, idxtype, "umov",
5596       [(set regtype:$Rd, (vector_extract (vectype V128:$Rn), idxtype:$idx))]>;
5597
5598 class SIMDMovAlias<string asm, string size, Instruction inst,
5599                    RegisterClass regtype, Operand idxtype>
5600     : InstAlias<asm#"{\t$dst, $src"#size#"$idx" #
5601                     "|" # size # "\t$dst, $src$idx}",
5602                 (inst regtype:$dst, V128:$src, idxtype:$idx)>;
5603
5604 multiclass SMov {
5605   def vi8to32 : SIMDSMov<0, ".b", GPR32, VectorIndexB> {
5606     bits<4> idx;
5607     let Inst{20-17} = idx;
5608     let Inst{16} = 1;
5609   }
5610   def vi8to64 : SIMDSMov<1, ".b", GPR64, VectorIndexB> {
5611     bits<4> idx;
5612     let Inst{20-17} = idx;
5613     let Inst{16} = 1;
5614   }
5615   def vi16to32 : SIMDSMov<0, ".h", GPR32, VectorIndexH> {
5616     bits<3> idx;
5617     let Inst{20-18} = idx;
5618     let Inst{17-16} = 0b10;
5619   }
5620   def vi16to64 : SIMDSMov<1, ".h", GPR64, VectorIndexH> {
5621     bits<3> idx;
5622     let Inst{20-18} = idx;
5623     let Inst{17-16} = 0b10;
5624   }
5625   def vi32to64 : SIMDSMov<1, ".s", GPR64, VectorIndexS> {
5626     bits<2> idx;
5627     let Inst{20-19} = idx;
5628     let Inst{18-16} = 0b100;
5629   }
5630 }
5631
5632 multiclass UMov {
5633   def vi8 : SIMDUMov<0, ".b", v16i8, GPR32, VectorIndexB> {
5634     bits<4> idx;
5635     let Inst{20-17} = idx;
5636     let Inst{16} = 1;
5637   }
5638   def vi16 : SIMDUMov<0, ".h", v8i16, GPR32, VectorIndexH> {
5639     bits<3> idx;
5640     let Inst{20-18} = idx;
5641     let Inst{17-16} = 0b10;
5642   }
5643   def vi32 : SIMDUMov<0, ".s", v4i32, GPR32, VectorIndexS> {
5644     bits<2> idx;
5645     let Inst{20-19} = idx;
5646     let Inst{18-16} = 0b100;
5647   }
5648   def vi64 : SIMDUMov<1, ".d", v2i64, GPR64, VectorIndexD> {
5649     bits<1> idx;
5650     let Inst{20} = idx;
5651     let Inst{19-16} = 0b1000;
5652   }
5653   def : SIMDMovAlias<"mov", ".s",
5654                      !cast<Instruction>(NAME#"vi32"),
5655                      GPR32, VectorIndexS>;
5656   def : SIMDMovAlias<"mov", ".d",
5657                      !cast<Instruction>(NAME#"vi64"),
5658                      GPR64, VectorIndexD>;
5659 }
5660
5661 class SIMDInsFromMain<string size, ValueType vectype,
5662                       RegisterClass regtype, Operand idxtype>
5663   : BaseSIMDInsDup<1, 0, (outs V128:$dst),
5664                    (ins V128:$Rd, idxtype:$idx, regtype:$Rn), "ins",
5665                    "{\t$Rd" # size # "$idx, $Rn" #
5666                    "|" # size # "\t$Rd$idx, $Rn}",
5667                    "$Rd = $dst",
5668             [(set V128:$dst,
5669               (vector_insert (vectype V128:$Rd), regtype:$Rn, idxtype:$idx))]> {
5670   let Inst{14-11} = 0b0011;
5671 }
5672
5673 class SIMDInsFromElement<string size, ValueType vectype,
5674                          ValueType elttype, Operand idxtype>
5675   : BaseSIMDInsDup<1, 1, (outs V128:$dst),
5676                    (ins V128:$Rd, idxtype:$idx, V128:$Rn, idxtype:$idx2), "ins",
5677                    "{\t$Rd" # size # "$idx, $Rn" # size # "$idx2" #
5678                    "|" # size # "\t$Rd$idx, $Rn$idx2}",
5679                    "$Rd = $dst",
5680          [(set V128:$dst,
5681                (vector_insert
5682                  (vectype V128:$Rd),
5683                  (elttype (vector_extract (vectype V128:$Rn), idxtype:$idx2)),
5684                  idxtype:$idx))]>;
5685
5686 class SIMDInsMainMovAlias<string size, Instruction inst,
5687                           RegisterClass regtype, Operand idxtype>
5688     : InstAlias<"mov" # "{\t$dst" # size # "$idx, $src" #
5689                         "|" # size #"\t$dst$idx, $src}",
5690                 (inst V128:$dst, idxtype:$idx, regtype:$src)>;
5691 class SIMDInsElementMovAlias<string size, Instruction inst,
5692                              Operand idxtype>
5693     : InstAlias<"mov" # "{\t$dst" # size # "$idx, $src" # size # "$idx2" #
5694                       # "|" # size #" $dst$idx, $src$idx2}",
5695                 (inst V128:$dst, idxtype:$idx, V128:$src, idxtype:$idx2)>;
5696
5697
5698 multiclass SIMDIns {
5699   def vi8gpr : SIMDInsFromMain<".b", v16i8, GPR32, VectorIndexB> {
5700     bits<4> idx;
5701     let Inst{20-17} = idx;
5702     let Inst{16} = 1;
5703   }
5704   def vi16gpr : SIMDInsFromMain<".h", v8i16, GPR32, VectorIndexH> {
5705     bits<3> idx;
5706     let Inst{20-18} = idx;
5707     let Inst{17-16} = 0b10;
5708   }
5709   def vi32gpr : SIMDInsFromMain<".s", v4i32, GPR32, VectorIndexS> {
5710     bits<2> idx;
5711     let Inst{20-19} = idx;
5712     let Inst{18-16} = 0b100;
5713   }
5714   def vi64gpr : SIMDInsFromMain<".d", v2i64, GPR64, VectorIndexD> {
5715     bits<1> idx;
5716     let Inst{20} = idx;
5717     let Inst{19-16} = 0b1000;
5718   }
5719
5720   def vi8lane : SIMDInsFromElement<".b", v16i8, i32, VectorIndexB> {
5721     bits<4> idx;
5722     bits<4> idx2;
5723     let Inst{20-17} = idx;
5724     let Inst{16} = 1;
5725     let Inst{14-11} = idx2;
5726   }
5727   def vi16lane : SIMDInsFromElement<".h", v8i16, i32, VectorIndexH> {
5728     bits<3> idx;
5729     bits<3> idx2;
5730     let Inst{20-18} = idx;
5731     let Inst{17-16} = 0b10;
5732     let Inst{14-12} = idx2;
5733     let Inst{11} = 0;
5734   }
5735   def vi32lane : SIMDInsFromElement<".s", v4i32, i32, VectorIndexS> {
5736     bits<2> idx;
5737     bits<2> idx2;
5738     let Inst{20-19} = idx;
5739     let Inst{18-16} = 0b100;
5740     let Inst{14-13} = idx2;
5741     let Inst{12-11} = 0;
5742   }
5743   def vi64lane : SIMDInsFromElement<".d", v2i64, i64, VectorIndexD> {
5744     bits<1> idx;
5745     bits<1> idx2;
5746     let Inst{20} = idx;
5747     let Inst{19-16} = 0b1000;
5748     let Inst{14} = idx2;
5749     let Inst{13-11} = 0;
5750   }
5751
5752   // For all forms of the INS instruction, the "mov" mnemonic is the
5753   // preferred alias. Why they didn't just call the instruction "mov" in
5754   // the first place is a very good question indeed...
5755   def : SIMDInsMainMovAlias<".b", !cast<Instruction>(NAME#"vi8gpr"),
5756                          GPR32, VectorIndexB>;
5757   def : SIMDInsMainMovAlias<".h", !cast<Instruction>(NAME#"vi16gpr"),
5758                          GPR32, VectorIndexH>;
5759   def : SIMDInsMainMovAlias<".s", !cast<Instruction>(NAME#"vi32gpr"),
5760                          GPR32, VectorIndexS>;
5761   def : SIMDInsMainMovAlias<".d", !cast<Instruction>(NAME#"vi64gpr"),
5762                          GPR64, VectorIndexD>;
5763
5764   def : SIMDInsElementMovAlias<".b", !cast<Instruction>(NAME#"vi8lane"),
5765                          VectorIndexB>;
5766   def : SIMDInsElementMovAlias<".h", !cast<Instruction>(NAME#"vi16lane"),
5767                          VectorIndexH>;
5768   def : SIMDInsElementMovAlias<".s", !cast<Instruction>(NAME#"vi32lane"),
5769                          VectorIndexS>;
5770   def : SIMDInsElementMovAlias<".d", !cast<Instruction>(NAME#"vi64lane"),
5771                          VectorIndexD>;
5772 }
5773
5774 //----------------------------------------------------------------------------
5775 // AdvSIMD TBL/TBX
5776 //----------------------------------------------------------------------------
5777
5778 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
5779 class BaseSIMDTableLookup<bit Q, bits<2> len, bit op, RegisterOperand vectype,
5780                           RegisterOperand listtype, string asm, string kind>
5781   : I<(outs vectype:$Vd), (ins listtype:$Vn, vectype:$Vm), asm,
5782        "\t$Vd" # kind # ", $Vn, $Vm" # kind, "", []>,
5783     Sched<[WriteV]> {
5784   bits<5> Vd;
5785   bits<5> Vn;
5786   bits<5> Vm;
5787   let Inst{31}    = 0;
5788   let Inst{30}    = Q;
5789   let Inst{29-21} = 0b001110000;
5790   let Inst{20-16} = Vm;
5791   let Inst{15}    = 0;
5792   let Inst{14-13} = len;
5793   let Inst{12}    = op;
5794   let Inst{11-10} = 0b00;
5795   let Inst{9-5}   = Vn;
5796   let Inst{4-0}   = Vd;
5797 }
5798
5799 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
5800 class BaseSIMDTableLookupTied<bit Q, bits<2> len, bit op, RegisterOperand vectype,
5801                           RegisterOperand listtype, string asm, string kind>
5802   : I<(outs vectype:$dst), (ins vectype:$Vd, listtype:$Vn, vectype:$Vm), asm,
5803        "\t$Vd" # kind # ", $Vn, $Vm" # kind, "$Vd = $dst", []>,
5804     Sched<[WriteV]> {
5805   bits<5> Vd;
5806   bits<5> Vn;
5807   bits<5> Vm;
5808   let Inst{31}    = 0;
5809   let Inst{30}    = Q;
5810   let Inst{29-21} = 0b001110000;
5811   let Inst{20-16} = Vm;
5812   let Inst{15}    = 0;
5813   let Inst{14-13} = len;
5814   let Inst{12}    = op;
5815   let Inst{11-10} = 0b00;
5816   let Inst{9-5}   = Vn;
5817   let Inst{4-0}   = Vd;
5818 }
5819
5820 class SIMDTableLookupAlias<string asm, Instruction inst,
5821                           RegisterOperand vectype, RegisterOperand listtype>
5822     : InstAlias<!strconcat(asm, "\t$dst, $lst, $index"),
5823                 (inst vectype:$dst, listtype:$lst, vectype:$index), 0>;
5824
5825 multiclass SIMDTableLookup<bit op, string asm> {
5826   def v8i8One   : BaseSIMDTableLookup<0, 0b00, op, V64, VecListOne16b,
5827                                       asm, ".8b">;
5828   def v8i8Two   : BaseSIMDTableLookup<0, 0b01, op, V64, VecListTwo16b,
5829                                       asm, ".8b">;
5830   def v8i8Three : BaseSIMDTableLookup<0, 0b10, op, V64, VecListThree16b,
5831                                       asm, ".8b">;
5832   def v8i8Four  : BaseSIMDTableLookup<0, 0b11, op, V64, VecListFour16b,
5833                                       asm, ".8b">;
5834   def v16i8One  : BaseSIMDTableLookup<1, 0b00, op, V128, VecListOne16b,
5835                                       asm, ".16b">;
5836   def v16i8Two  : BaseSIMDTableLookup<1, 0b01, op, V128, VecListTwo16b,
5837                                       asm, ".16b">;
5838   def v16i8Three: BaseSIMDTableLookup<1, 0b10, op, V128, VecListThree16b,
5839                                       asm, ".16b">;
5840   def v16i8Four : BaseSIMDTableLookup<1, 0b11, op, V128, VecListFour16b,
5841                                       asm, ".16b">;
5842
5843   def : SIMDTableLookupAlias<asm # ".8b",
5844                          !cast<Instruction>(NAME#"v8i8One"),
5845                          V64, VecListOne128>;
5846   def : SIMDTableLookupAlias<asm # ".8b",
5847                          !cast<Instruction>(NAME#"v8i8Two"),
5848                          V64, VecListTwo128>;
5849   def : SIMDTableLookupAlias<asm # ".8b",
5850                          !cast<Instruction>(NAME#"v8i8Three"),
5851                          V64, VecListThree128>;
5852   def : SIMDTableLookupAlias<asm # ".8b",
5853                          !cast<Instruction>(NAME#"v8i8Four"),
5854                          V64, VecListFour128>;
5855   def : SIMDTableLookupAlias<asm # ".16b",
5856                          !cast<Instruction>(NAME#"v16i8One"),
5857                          V128, VecListOne128>;
5858   def : SIMDTableLookupAlias<asm # ".16b",
5859                          !cast<Instruction>(NAME#"v16i8Two"),
5860                          V128, VecListTwo128>;
5861   def : SIMDTableLookupAlias<asm # ".16b",
5862                          !cast<Instruction>(NAME#"v16i8Three"),
5863                          V128, VecListThree128>;
5864   def : SIMDTableLookupAlias<asm # ".16b",
5865                          !cast<Instruction>(NAME#"v16i8Four"),
5866                          V128, VecListFour128>;
5867 }
5868
5869 multiclass SIMDTableLookupTied<bit op, string asm> {
5870   def v8i8One   : BaseSIMDTableLookupTied<0, 0b00, op, V64, VecListOne16b,
5871                                       asm, ".8b">;
5872   def v8i8Two   : BaseSIMDTableLookupTied<0, 0b01, op, V64, VecListTwo16b,
5873                                       asm, ".8b">;
5874   def v8i8Three : BaseSIMDTableLookupTied<0, 0b10, op, V64, VecListThree16b,
5875                                       asm, ".8b">;
5876   def v8i8Four  : BaseSIMDTableLookupTied<0, 0b11, op, V64, VecListFour16b,
5877                                       asm, ".8b">;
5878   def v16i8One  : BaseSIMDTableLookupTied<1, 0b00, op, V128, VecListOne16b,
5879                                       asm, ".16b">;
5880   def v16i8Two  : BaseSIMDTableLookupTied<1, 0b01, op, V128, VecListTwo16b,
5881                                       asm, ".16b">;
5882   def v16i8Three: BaseSIMDTableLookupTied<1, 0b10, op, V128, VecListThree16b,
5883                                       asm, ".16b">;
5884   def v16i8Four : BaseSIMDTableLookupTied<1, 0b11, op, V128, VecListFour16b,
5885                                       asm, ".16b">;
5886
5887   def : SIMDTableLookupAlias<asm # ".8b",
5888                          !cast<Instruction>(NAME#"v8i8One"),
5889                          V64, VecListOne128>;
5890   def : SIMDTableLookupAlias<asm # ".8b",
5891                          !cast<Instruction>(NAME#"v8i8Two"),
5892                          V64, VecListTwo128>;
5893   def : SIMDTableLookupAlias<asm # ".8b",
5894                          !cast<Instruction>(NAME#"v8i8Three"),
5895                          V64, VecListThree128>;
5896   def : SIMDTableLookupAlias<asm # ".8b",
5897                          !cast<Instruction>(NAME#"v8i8Four"),
5898                          V64, VecListFour128>;
5899   def : SIMDTableLookupAlias<asm # ".16b",
5900                          !cast<Instruction>(NAME#"v16i8One"),
5901                          V128, VecListOne128>;
5902   def : SIMDTableLookupAlias<asm # ".16b",
5903                          !cast<Instruction>(NAME#"v16i8Two"),
5904                          V128, VecListTwo128>;
5905   def : SIMDTableLookupAlias<asm # ".16b",
5906                          !cast<Instruction>(NAME#"v16i8Three"),
5907                          V128, VecListThree128>;
5908   def : SIMDTableLookupAlias<asm # ".16b",
5909                          !cast<Instruction>(NAME#"v16i8Four"),
5910                          V128, VecListFour128>;
5911 }
5912
5913
5914 //----------------------------------------------------------------------------
5915 // AdvSIMD scalar CPY
5916 //----------------------------------------------------------------------------
5917 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
5918 class BaseSIMDScalarCPY<RegisterClass regtype, RegisterOperand vectype,
5919                         string kind, Operand idxtype>
5920   : I<(outs regtype:$dst), (ins vectype:$src, idxtype:$idx), "mov",
5921        "{\t$dst, $src" # kind # "$idx" #
5922        "|\t$dst, $src$idx}", "", []>,
5923     Sched<[WriteV]> {
5924   bits<5> dst;
5925   bits<5> src;
5926   let Inst{31-21} = 0b01011110000;
5927   let Inst{15-10} = 0b000001;
5928   let Inst{9-5}   = src;
5929   let Inst{4-0}   = dst;
5930 }
5931
5932 class SIMDScalarCPYAlias<string asm, string size, Instruction inst,
5933       RegisterClass regtype, RegisterOperand vectype, Operand idxtype>
5934     : InstAlias<asm # "{\t$dst, $src" # size # "$index" #
5935                     # "|\t$dst, $src$index}",
5936                 (inst regtype:$dst, vectype:$src, idxtype:$index), 0>;
5937
5938
5939 multiclass SIMDScalarCPY<string asm> {
5940   def i8  : BaseSIMDScalarCPY<FPR8,  V128, ".b", VectorIndexB> {
5941     bits<4> idx;
5942     let Inst{20-17} = idx;
5943     let Inst{16} = 1;
5944   }
5945   def i16 : BaseSIMDScalarCPY<FPR16, V128, ".h", VectorIndexH> {
5946     bits<3> idx;
5947     let Inst{20-18} = idx;
5948     let Inst{17-16} = 0b10;
5949   }
5950   def i32 : BaseSIMDScalarCPY<FPR32, V128, ".s", VectorIndexS> {
5951     bits<2> idx;
5952     let Inst{20-19} = idx;
5953     let Inst{18-16} = 0b100;
5954   }
5955   def i64 : BaseSIMDScalarCPY<FPR64, V128, ".d", VectorIndexD> {
5956     bits<1> idx;
5957     let Inst{20} = idx;
5958     let Inst{19-16} = 0b1000;
5959   }
5960
5961   def : Pat<(v1i64 (scalar_to_vector (i64 (vector_extract (v2i64 V128:$src),
5962                                                           VectorIndexD:$idx)))),
5963             (!cast<Instruction>(NAME # i64) V128:$src, VectorIndexD:$idx)>;
5964
5965   // 'DUP' mnemonic aliases.
5966   def : SIMDScalarCPYAlias<"dup", ".b",
5967                            !cast<Instruction>(NAME#"i8"),
5968                            FPR8, V128, VectorIndexB>;
5969   def : SIMDScalarCPYAlias<"dup", ".h",
5970                            !cast<Instruction>(NAME#"i16"),
5971                            FPR16, V128, VectorIndexH>;
5972   def : SIMDScalarCPYAlias<"dup", ".s",
5973                            !cast<Instruction>(NAME#"i32"),
5974                            FPR32, V128, VectorIndexS>;
5975   def : SIMDScalarCPYAlias<"dup", ".d",
5976                            !cast<Instruction>(NAME#"i64"),
5977                            FPR64, V128, VectorIndexD>;
5978 }
5979
5980 //----------------------------------------------------------------------------
5981 // AdvSIMD modified immediate instructions
5982 //----------------------------------------------------------------------------
5983
5984 class BaseSIMDModifiedImm<bit Q, bit op, dag oops, dag iops,
5985                           string asm, string op_string,
5986                           string cstr, list<dag> pattern>
5987   : I<oops, iops, asm, op_string, cstr, pattern>,
5988     Sched<[WriteV]> {
5989   bits<5> Rd;
5990   bits<8> imm8;
5991   let Inst{31}    = 0;
5992   let Inst{30}    = Q;
5993   let Inst{29}    = op;
5994   let Inst{28-19} = 0b0111100000;
5995   let Inst{18-16} = imm8{7-5};
5996   let Inst{11-10} = 0b01;
5997   let Inst{9-5}   = imm8{4-0};
5998   let Inst{4-0}   = Rd;
5999 }
6000
6001 class BaseSIMDModifiedImmVector<bit Q, bit op, RegisterOperand vectype,
6002                                 Operand immtype, dag opt_shift_iop,
6003                                 string opt_shift, string asm, string kind,
6004                                 list<dag> pattern>
6005   : BaseSIMDModifiedImm<Q, op, (outs vectype:$Rd),
6006                         !con((ins immtype:$imm8), opt_shift_iop), asm,
6007                         "{\t$Rd" # kind # ", $imm8" # opt_shift #
6008                         "|" # kind # "\t$Rd, $imm8" # opt_shift # "}",
6009                         "", pattern> {
6010   let DecoderMethod = "DecodeModImmInstruction";
6011 }
6012
6013 class BaseSIMDModifiedImmVectorTied<bit Q, bit op, RegisterOperand vectype,
6014                                 Operand immtype, dag opt_shift_iop,
6015                                 string opt_shift, string asm, string kind,
6016                                 list<dag> pattern>
6017   : BaseSIMDModifiedImm<Q, op, (outs vectype:$dst),
6018                         !con((ins vectype:$Rd, immtype:$imm8), opt_shift_iop),
6019                         asm, "{\t$Rd" # kind # ", $imm8" # opt_shift #
6020                              "|" # kind # "\t$Rd, $imm8" # opt_shift # "}",
6021                         "$Rd = $dst", pattern> {
6022   let DecoderMethod = "DecodeModImmTiedInstruction";
6023 }
6024
6025 class BaseSIMDModifiedImmVectorShift<bit Q, bit op, bits<2> b15_b12,
6026                                      RegisterOperand vectype, string asm,
6027                                      string kind, list<dag> pattern>
6028   : BaseSIMDModifiedImmVector<Q, op, vectype, imm0_255,
6029                               (ins logical_vec_shift:$shift),
6030                               "$shift", asm, kind, pattern> {
6031   bits<2> shift;
6032   let Inst{15}    = b15_b12{1};
6033   let Inst{14-13} = shift;
6034   let Inst{12}    = b15_b12{0};
6035 }
6036
6037 class BaseSIMDModifiedImmVectorShiftTied<bit Q, bit op, bits<2> b15_b12,
6038                                      RegisterOperand vectype, string asm,
6039                                      string kind, list<dag> pattern>
6040   : BaseSIMDModifiedImmVectorTied<Q, op, vectype, imm0_255,
6041                               (ins logical_vec_shift:$shift),
6042                               "$shift", asm, kind, pattern> {
6043   bits<2> shift;
6044   let Inst{15}    = b15_b12{1};
6045   let Inst{14-13} = shift;
6046   let Inst{12}    = b15_b12{0};
6047 }
6048
6049
6050 class BaseSIMDModifiedImmVectorShiftHalf<bit Q, bit op, bits<2> b15_b12,
6051                                          RegisterOperand vectype, string asm,
6052                                          string kind, list<dag> pattern>
6053   : BaseSIMDModifiedImmVector<Q, op, vectype, imm0_255,
6054                               (ins logical_vec_hw_shift:$shift),
6055                               "$shift", asm, kind, pattern> {
6056   bits<2> shift;
6057   let Inst{15} = b15_b12{1};
6058   let Inst{14} = 0;
6059   let Inst{13} = shift{0};
6060   let Inst{12} = b15_b12{0};
6061 }
6062
6063 class BaseSIMDModifiedImmVectorShiftHalfTied<bit Q, bit op, bits<2> b15_b12,
6064                                          RegisterOperand vectype, string asm,
6065                                          string kind, list<dag> pattern>
6066   : BaseSIMDModifiedImmVectorTied<Q, op, vectype, imm0_255,
6067                               (ins logical_vec_hw_shift:$shift),
6068                               "$shift", asm, kind, pattern> {
6069   bits<2> shift;
6070   let Inst{15} = b15_b12{1};
6071   let Inst{14} = 0;
6072   let Inst{13} = shift{0};
6073   let Inst{12} = b15_b12{0};
6074 }
6075
6076 multiclass SIMDModifiedImmVectorShift<bit op, bits<2> hw_cmode, bits<2> w_cmode,
6077                                       string asm> {
6078   def v4i16 : BaseSIMDModifiedImmVectorShiftHalf<0, op, hw_cmode, V64,
6079                                                  asm, ".4h", []>;
6080   def v8i16 : BaseSIMDModifiedImmVectorShiftHalf<1, op, hw_cmode, V128,
6081                                                  asm, ".8h", []>;
6082
6083   def v2i32 : BaseSIMDModifiedImmVectorShift<0, op, w_cmode, V64,
6084                                              asm, ".2s", []>;
6085   def v4i32 : BaseSIMDModifiedImmVectorShift<1, op, w_cmode, V128,
6086                                              asm, ".4s", []>;
6087 }
6088
6089 multiclass SIMDModifiedImmVectorShiftTied<bit op, bits<2> hw_cmode,
6090                                       bits<2> w_cmode, string asm,
6091                                       SDNode OpNode> {
6092   def v4i16 : BaseSIMDModifiedImmVectorShiftHalfTied<0, op, hw_cmode, V64,
6093                                                  asm, ".4h",
6094              [(set (v4i16 V64:$dst), (OpNode V64:$Rd,
6095                                              imm0_255:$imm8,
6096                                              (i32 imm:$shift)))]>;
6097   def v8i16 : BaseSIMDModifiedImmVectorShiftHalfTied<1, op, hw_cmode, V128,
6098                                                  asm, ".8h",
6099              [(set (v8i16 V128:$dst), (OpNode V128:$Rd,
6100                                               imm0_255:$imm8,
6101                                               (i32 imm:$shift)))]>;
6102
6103   def v2i32 : BaseSIMDModifiedImmVectorShiftTied<0, op, w_cmode, V64,
6104                                              asm, ".2s",
6105              [(set (v2i32 V64:$dst), (OpNode V64:$Rd,
6106                                              imm0_255:$imm8,
6107                                              (i32 imm:$shift)))]>;
6108   def v4i32 : BaseSIMDModifiedImmVectorShiftTied<1, op, w_cmode, V128,
6109                                              asm, ".4s",
6110              [(set (v4i32 V128:$dst), (OpNode V128:$Rd,
6111                                               imm0_255:$imm8,
6112                                               (i32 imm:$shift)))]>;
6113 }
6114
6115 class SIMDModifiedImmMoveMSL<bit Q, bit op, bits<4> cmode,
6116                              RegisterOperand vectype, string asm,
6117                              string kind, list<dag> pattern>
6118   : BaseSIMDModifiedImmVector<Q, op, vectype, imm0_255,
6119                               (ins move_vec_shift:$shift),
6120                               "$shift", asm, kind, pattern> {
6121   bits<1> shift;
6122   let Inst{15-13} = cmode{3-1};
6123   let Inst{12}    = shift;
6124 }
6125
6126 class SIMDModifiedImmVectorNoShift<bit Q, bit op, bits<4> cmode,
6127                                    RegisterOperand vectype,
6128                                    Operand imm_type, string asm,
6129                                    string kind, list<dag> pattern>
6130   : BaseSIMDModifiedImmVector<Q, op, vectype, imm_type, (ins), "",
6131                               asm, kind, pattern> {
6132   let Inst{15-12} = cmode;
6133 }
6134
6135 class SIMDModifiedImmScalarNoShift<bit Q, bit op, bits<4> cmode, string asm,
6136                                    list<dag> pattern>
6137   : BaseSIMDModifiedImm<Q, op, (outs FPR64:$Rd), (ins simdimmtype10:$imm8), asm,
6138                         "\t$Rd, $imm8", "", pattern> {
6139   let Inst{15-12} = cmode;
6140   let DecoderMethod = "DecodeModImmInstruction";
6141 }
6142
6143 //----------------------------------------------------------------------------
6144 // AdvSIMD indexed element
6145 //----------------------------------------------------------------------------
6146
6147 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
6148 class BaseSIMDIndexed<bit Q, bit U, bit Scalar, bits<2> size, bits<4> opc,
6149                       RegisterOperand dst_reg, RegisterOperand lhs_reg,
6150                       RegisterOperand rhs_reg, Operand vec_idx, string asm,
6151                       string apple_kind, string dst_kind, string lhs_kind,
6152                       string rhs_kind, list<dag> pattern>
6153   : I<(outs dst_reg:$Rd), (ins lhs_reg:$Rn, rhs_reg:$Rm, vec_idx:$idx),
6154       asm,
6155       "{\t$Rd" # dst_kind # ", $Rn" # lhs_kind # ", $Rm" # rhs_kind # "$idx" #
6156       "|" # apple_kind # "\t$Rd, $Rn, $Rm$idx}", "", pattern>,
6157     Sched<[WriteV]> {
6158   bits<5> Rd;
6159   bits<5> Rn;
6160   bits<5> Rm;
6161
6162   let Inst{31}    = 0;
6163   let Inst{30}    = Q;
6164   let Inst{29}    = U;
6165   let Inst{28}    = Scalar;
6166   let Inst{27-24} = 0b1111;
6167   let Inst{23-22} = size;
6168   // Bit 21 must be set by the derived class.
6169   let Inst{20-16} = Rm;
6170   let Inst{15-12} = opc;
6171   // Bit 11 must be set by the derived class.
6172   let Inst{10}    = 0;
6173   let Inst{9-5}   = Rn;
6174   let Inst{4-0}   = Rd;
6175 }
6176
6177 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
6178 class BaseSIMDIndexedTied<bit Q, bit U, bit Scalar, bits<2> size, bits<4> opc,
6179                       RegisterOperand dst_reg, RegisterOperand lhs_reg,
6180                       RegisterOperand rhs_reg, Operand vec_idx, string asm,
6181                       string apple_kind, string dst_kind, string lhs_kind,
6182                       string rhs_kind, list<dag> pattern>
6183   : I<(outs dst_reg:$dst),
6184       (ins dst_reg:$Rd, lhs_reg:$Rn, rhs_reg:$Rm, vec_idx:$idx), asm,
6185       "{\t$Rd" # dst_kind # ", $Rn" # lhs_kind # ", $Rm" # rhs_kind # "$idx" #
6186       "|" # apple_kind # "\t$Rd, $Rn, $Rm$idx}", "$Rd = $dst", pattern>,
6187     Sched<[WriteV]> {
6188   bits<5> Rd;
6189   bits<5> Rn;
6190   bits<5> Rm;
6191
6192   let Inst{31}    = 0;
6193   let Inst{30}    = Q;
6194   let Inst{29}    = U;
6195   let Inst{28}    = Scalar;
6196   let Inst{27-24} = 0b1111;
6197   let Inst{23-22} = size;
6198   // Bit 21 must be set by the derived class.
6199   let Inst{20-16} = Rm;
6200   let Inst{15-12} = opc;
6201   // Bit 11 must be set by the derived class.
6202   let Inst{10}    = 0;
6203   let Inst{9-5}   = Rn;
6204   let Inst{4-0}   = Rd;
6205 }
6206
6207 multiclass SIMDFPIndexedSD<bit U, bits<4> opc, string asm,
6208                            SDPatternOperator OpNode> {
6209   def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
6210                                       V64, V64,
6211                                       V128, VectorIndexS,
6212                                       asm, ".2s", ".2s", ".2s", ".s",
6213     [(set (v2f32 V64:$Rd),
6214         (OpNode (v2f32 V64:$Rn),
6215          (v2f32 (ARM64duplane32 (v4f32 V128:$Rm), VectorIndexS:$idx))))]> {
6216     bits<2> idx;
6217     let Inst{11} = idx{1};
6218     let Inst{21} = idx{0};
6219   }
6220
6221   def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
6222                                       V128, V128,
6223                                       V128, VectorIndexS,
6224                                       asm, ".4s", ".4s", ".4s", ".s",
6225     [(set (v4f32 V128:$Rd),
6226         (OpNode (v4f32 V128:$Rn),
6227          (v4f32 (ARM64duplane32 (v4f32 V128:$Rm), VectorIndexS:$idx))))]> {
6228     bits<2> idx;
6229     let Inst{11} = idx{1};
6230     let Inst{21} = idx{0};
6231   }
6232
6233   def v2i64_indexed : BaseSIMDIndexed<1, U, 0, 0b11, opc,
6234                                       V128, V128,
6235                                       V128, VectorIndexD,
6236                                       asm, ".2d", ".2d", ".2d", ".d",
6237     [(set (v2f64 V128:$Rd),
6238         (OpNode (v2f64 V128:$Rn),
6239          (v2f64 (ARM64duplane64 (v2f64 V128:$Rm), VectorIndexD:$idx))))]> {
6240     bits<1> idx;
6241     let Inst{11} = idx{0};
6242     let Inst{21} = 0;
6243   }
6244
6245   def v1i32_indexed : BaseSIMDIndexed<1, U, 1, 0b10, opc,
6246                                       FPR32Op, FPR32Op, V128, VectorIndexS,
6247                                       asm, ".s", "", "", ".s",
6248     [(set (f32 FPR32Op:$Rd),
6249           (OpNode (f32 FPR32Op:$Rn),
6250                   (f32 (vector_extract (v4f32 V128:$Rm),
6251                                        VectorIndexS:$idx))))]> {
6252     bits<2> idx;
6253     let Inst{11} = idx{1};
6254     let Inst{21} = idx{0};
6255   }
6256
6257   def v1i64_indexed : BaseSIMDIndexed<1, U, 1, 0b11, opc,
6258                                       FPR64Op, FPR64Op, V128, VectorIndexD,
6259                                       asm, ".d", "", "", ".d",
6260     [(set (f64 FPR64Op:$Rd),
6261           (OpNode (f64 FPR64Op:$Rn),
6262                   (f64 (vector_extract (v2f64 V128:$Rm),
6263                                        VectorIndexD:$idx))))]> {
6264     bits<1> idx;
6265     let Inst{11} = idx{0};
6266     let Inst{21} = 0;
6267   }
6268 }
6269
6270 multiclass SIMDFPIndexedSDTiedPatterns<string INST, SDPatternOperator OpNode> {
6271   // 2 variants for the .2s version: DUPLANE from 128-bit and DUP scalar.
6272   def : Pat<(v2f32 (OpNode (v2f32 V64:$Rd), (v2f32 V64:$Rn),
6273                            (ARM64duplane32 (v4f32 V128:$Rm),
6274                                            VectorIndexS:$idx))),
6275             (!cast<Instruction>(INST # v2i32_indexed)
6276                 V64:$Rd, V64:$Rn, V128:$Rm, VectorIndexS:$idx)>;
6277   def : Pat<(v2f32 (OpNode (v2f32 V64:$Rd), (v2f32 V64:$Rn),
6278                            (ARM64dup (f32 FPR32Op:$Rm)))),
6279             (!cast<Instruction>(INST # "v2i32_indexed") V64:$Rd, V64:$Rn,
6280                 (SUBREG_TO_REG (i32 0), FPR32Op:$Rm, ssub), (i64 0))>;
6281
6282
6283   // 2 variants for the .4s version: DUPLANE from 128-bit and DUP scalar.
6284   def : Pat<(v4f32 (OpNode (v4f32 V128:$Rd), (v4f32 V128:$Rn),
6285                            (ARM64duplane32 (v4f32 V128:$Rm),
6286                                            VectorIndexS:$idx))),
6287             (!cast<Instruction>(INST # "v4i32_indexed")
6288                 V128:$Rd, V128:$Rn, V128:$Rm, VectorIndexS:$idx)>;
6289   def : Pat<(v4f32 (OpNode (v4f32 V128:$Rd), (v4f32 V128:$Rn),
6290                            (ARM64dup (f32 FPR32Op:$Rm)))),
6291             (!cast<Instruction>(INST # "v4i32_indexed") V128:$Rd, V128:$Rn,
6292                 (SUBREG_TO_REG (i32 0), FPR32Op:$Rm, ssub), (i64 0))>;
6293
6294   // 2 variants for the .2d version: DUPLANE from 128-bit and DUP scalar.
6295   def : Pat<(v2f64 (OpNode (v2f64 V128:$Rd), (v2f64 V128:$Rn),
6296                            (ARM64duplane64 (v2f64 V128:$Rm),
6297                                            VectorIndexD:$idx))),
6298             (!cast<Instruction>(INST # "v2i64_indexed")
6299                 V128:$Rd, V128:$Rn, V128:$Rm, VectorIndexS:$idx)>;
6300   def : Pat<(v2f64 (OpNode (v2f64 V128:$Rd), (v2f64 V128:$Rn),
6301                            (ARM64dup (f64 FPR64Op:$Rm)))),
6302             (!cast<Instruction>(INST # "v2i64_indexed") V128:$Rd, V128:$Rn,
6303                 (SUBREG_TO_REG (i32 0), FPR64Op:$Rm, dsub), (i64 0))>;
6304
6305   // 2 variants for 32-bit scalar version: extract from .2s or from .4s
6306   def : Pat<(f32 (OpNode (f32 FPR32:$Rd), (f32 FPR32:$Rn),
6307                          (vector_extract (v4f32 V128:$Rm), VectorIndexS:$idx))),
6308             (!cast<Instruction>(INST # "v1i32_indexed") FPR32:$Rd, FPR32:$Rn,
6309                 V128:$Rm, VectorIndexS:$idx)>;
6310   def : Pat<(f32 (OpNode (f32 FPR32:$Rd), (f32 FPR32:$Rn),
6311                          (vector_extract (v2f32 V64:$Rm), VectorIndexS:$idx))),
6312             (!cast<Instruction>(INST # "v1i32_indexed") FPR32:$Rd, FPR32:$Rn,
6313                 (SUBREG_TO_REG (i32 0), V64:$Rm, dsub), VectorIndexS:$idx)>;
6314
6315   // 1 variant for 64-bit scalar version: extract from .1d or from .2d
6316   def : Pat<(f64 (OpNode (f64 FPR64:$Rd), (f64 FPR64:$Rn),
6317                          (vector_extract (v2f64 V128:$Rm), VectorIndexD:$idx))),
6318             (!cast<Instruction>(INST # "v1i64_indexed") FPR64:$Rd, FPR64:$Rn,
6319                 V128:$Rm, VectorIndexD:$idx)>;
6320 }
6321
6322 multiclass SIMDFPIndexedSDTied<bit U, bits<4> opc, string asm> {
6323   def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc, V64, V64,
6324                                           V128, VectorIndexS,
6325                                           asm, ".2s", ".2s", ".2s", ".s", []> {
6326     bits<2> idx;
6327     let Inst{11} = idx{1};
6328     let Inst{21} = idx{0};
6329   }
6330
6331   def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
6332                                       V128, V128,
6333                                       V128, VectorIndexS,
6334                                       asm, ".4s", ".4s", ".4s", ".s", []> {
6335     bits<2> idx;
6336     let Inst{11} = idx{1};
6337     let Inst{21} = idx{0};
6338   }
6339
6340   def v2i64_indexed : BaseSIMDIndexedTied<1, U, 0, 0b11, opc,
6341                                       V128, V128,
6342                                       V128, VectorIndexD,
6343                                       asm, ".2d", ".2d", ".2d", ".d", []> {
6344     bits<1> idx;
6345     let Inst{11} = idx{0};
6346     let Inst{21} = 0;
6347   }
6348
6349
6350   def v1i32_indexed : BaseSIMDIndexedTied<1, U, 1, 0b10, opc,
6351                                       FPR32Op, FPR32Op, V128, VectorIndexS,
6352                                       asm, ".s", "", "", ".s", []> {
6353     bits<2> idx;
6354     let Inst{11} = idx{1};
6355     let Inst{21} = idx{0};
6356   }
6357
6358   def v1i64_indexed : BaseSIMDIndexedTied<1, U, 1, 0b11, opc,
6359                                       FPR64Op, FPR64Op, V128, VectorIndexD,
6360                                       asm, ".d", "", "", ".d", []> {
6361     bits<1> idx;
6362     let Inst{11} = idx{0};
6363     let Inst{21} = 0;
6364   }
6365 }
6366
6367 multiclass SIMDIndexedHS<bit U, bits<4> opc, string asm,
6368                          SDPatternOperator OpNode> {
6369   def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc, V64, V64,
6370                                       V128_lo, VectorIndexH,
6371                                       asm, ".4h", ".4h", ".4h", ".h",
6372     [(set (v4i16 V64:$Rd),
6373         (OpNode (v4i16 V64:$Rn),
6374          (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6375     bits<3> idx;
6376     let Inst{11} = idx{2};
6377     let Inst{21} = idx{1};
6378     let Inst{20} = idx{0};
6379   }
6380
6381   def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
6382                                       V128, V128,
6383                                       V128_lo, VectorIndexH,
6384                                       asm, ".8h", ".8h", ".8h", ".h",
6385     [(set (v8i16 V128:$Rd),
6386        (OpNode (v8i16 V128:$Rn),
6387          (v8i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6388     bits<3> idx;
6389     let Inst{11} = idx{2};
6390     let Inst{21} = idx{1};
6391     let Inst{20} = idx{0};
6392   }
6393
6394   def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
6395                                       V64, V64,
6396                                       V128, VectorIndexS,
6397                                       asm, ".2s", ".2s", ".2s",  ".s",
6398     [(set (v2i32 V64:$Rd),
6399        (OpNode (v2i32 V64:$Rn),
6400           (v2i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6401     bits<2> idx;
6402     let Inst{11} = idx{1};
6403     let Inst{21} = idx{0};
6404   }
6405
6406   def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
6407                                       V128, V128,
6408                                       V128, VectorIndexS,
6409                                       asm, ".4s", ".4s", ".4s", ".s",
6410     [(set (v4i32 V128:$Rd),
6411        (OpNode (v4i32 V128:$Rn),
6412           (v4i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6413     bits<2> idx;
6414     let Inst{11} = idx{1};
6415     let Inst{21} = idx{0};
6416   }
6417
6418   def v1i16_indexed : BaseSIMDIndexed<1, U, 1, 0b01, opc,
6419                                       FPR16Op, FPR16Op, V128_lo, VectorIndexH,
6420                                       asm, ".h", "", "", ".h", []> {
6421     bits<3> idx;
6422     let Inst{11} = idx{2};
6423     let Inst{21} = idx{1};
6424     let Inst{20} = idx{0};
6425   }
6426
6427   def v1i32_indexed : BaseSIMDIndexed<1, U, 1, 0b10, opc,
6428                                       FPR32Op, FPR32Op, V128, VectorIndexS,
6429                                       asm, ".s", "", "", ".s",
6430       [(set (i32 FPR32Op:$Rd),
6431             (OpNode FPR32Op:$Rn,
6432                     (i32 (vector_extract (v4i32 V128:$Rm),
6433                                          VectorIndexS:$idx))))]> {
6434     bits<2> idx;
6435     let Inst{11} = idx{1};
6436     let Inst{21} = idx{0};
6437   }
6438 }
6439
6440 multiclass SIMDVectorIndexedHS<bit U, bits<4> opc, string asm,
6441                                SDPatternOperator OpNode> {
6442   def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,
6443                                       V64, V64,
6444                                       V128_lo, VectorIndexH,
6445                                       asm, ".4h", ".4h", ".4h", ".h",
6446     [(set (v4i16 V64:$Rd),
6447         (OpNode (v4i16 V64:$Rn),
6448          (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6449     bits<3> idx;
6450     let Inst{11} = idx{2};
6451     let Inst{21} = idx{1};
6452     let Inst{20} = idx{0};
6453   }
6454
6455   def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
6456                                       V128, V128,
6457                                       V128_lo, VectorIndexH,
6458                                       asm, ".8h", ".8h", ".8h", ".h",
6459     [(set (v8i16 V128:$Rd),
6460        (OpNode (v8i16 V128:$Rn),
6461          (v8i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6462     bits<3> idx;
6463     let Inst{11} = idx{2};
6464     let Inst{21} = idx{1};
6465     let Inst{20} = idx{0};
6466   }
6467
6468   def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
6469                                       V64, V64,
6470                                       V128, VectorIndexS,
6471                                       asm, ".2s", ".2s", ".2s", ".s",
6472     [(set (v2i32 V64:$Rd),
6473        (OpNode (v2i32 V64:$Rn),
6474           (v2i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6475     bits<2> idx;
6476     let Inst{11} = idx{1};
6477     let Inst{21} = idx{0};
6478   }
6479
6480   def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
6481                                       V128, V128,
6482                                       V128, VectorIndexS,
6483                                       asm, ".4s", ".4s", ".4s", ".s",
6484     [(set (v4i32 V128:$Rd),
6485        (OpNode (v4i32 V128:$Rn),
6486           (v4i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6487     bits<2> idx;
6488     let Inst{11} = idx{1};
6489     let Inst{21} = idx{0};
6490   }
6491 }
6492
6493 multiclass SIMDVectorIndexedHSTied<bit U, bits<4> opc, string asm,
6494                                    SDPatternOperator OpNode> {
6495   def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc, V64, V64,
6496                                           V128_lo, VectorIndexH,
6497                                           asm, ".4h", ".4h", ".4h", ".h",
6498     [(set (v4i16 V64:$dst),
6499         (OpNode (v4i16 V64:$Rd),(v4i16 V64:$Rn),
6500          (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6501     bits<3> idx;
6502     let Inst{11} = idx{2};
6503     let Inst{21} = idx{1};
6504     let Inst{20} = idx{0};
6505   }
6506
6507   def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,
6508                                       V128, V128,
6509                                       V128_lo, VectorIndexH,
6510                                       asm, ".8h", ".8h", ".8h", ".h",
6511     [(set (v8i16 V128:$dst),
6512        (OpNode (v8i16 V128:$Rd), (v8i16 V128:$Rn),
6513          (v8i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6514     bits<3> idx;
6515     let Inst{11} = idx{2};
6516     let Inst{21} = idx{1};
6517     let Inst{20} = idx{0};
6518   }
6519
6520   def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,
6521                                       V64, V64,
6522                                       V128, VectorIndexS,
6523                                       asm, ".2s", ".2s", ".2s", ".s",
6524     [(set (v2i32 V64:$dst),
6525        (OpNode (v2i32 V64:$Rd), (v2i32 V64:$Rn),
6526           (v2i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6527     bits<2> idx;
6528     let Inst{11} = idx{1};
6529     let Inst{21} = idx{0};
6530   }
6531
6532   def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
6533                                       V128, V128,
6534                                       V128, VectorIndexS,
6535                                       asm, ".4s", ".4s", ".4s", ".s",
6536     [(set (v4i32 V128:$dst),
6537        (OpNode (v4i32 V128:$Rd), (v4i32 V128:$Rn),
6538           (v4i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6539     bits<2> idx;
6540     let Inst{11} = idx{1};
6541     let Inst{21} = idx{0};
6542   }
6543 }
6544
6545 multiclass SIMDIndexedLongSD<bit U, bits<4> opc, string asm,
6546                              SDPatternOperator OpNode> {
6547   def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,
6548                                       V128, V64,
6549                                       V128_lo, VectorIndexH,
6550                                       asm, ".4s", ".4s", ".4h", ".h",
6551     [(set (v4i32 V128:$Rd),
6552         (OpNode (v4i16 V64:$Rn),
6553          (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6554     bits<3> idx;
6555     let Inst{11} = idx{2};
6556     let Inst{21} = idx{1};
6557     let Inst{20} = idx{0};
6558   }
6559
6560   def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
6561                                       V128, V128,
6562                                       V128_lo, VectorIndexH,
6563                                       asm#"2", ".4s", ".4s", ".8h", ".h",
6564     [(set (v4i32 V128:$Rd),
6565           (OpNode (extract_high_v8i16 V128:$Rn),
6566                   (extract_high_v8i16 (ARM64duplane16 (v8i16 V128_lo:$Rm),
6567                                                       VectorIndexH:$idx))))]> {
6568
6569     bits<3> idx;
6570     let Inst{11} = idx{2};
6571     let Inst{21} = idx{1};
6572     let Inst{20} = idx{0};
6573   }
6574
6575   def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
6576                                       V128, V64,
6577                                       V128, VectorIndexS,
6578                                       asm, ".2d", ".2d", ".2s", ".s",
6579     [(set (v2i64 V128:$Rd),
6580         (OpNode (v2i32 V64:$Rn),
6581          (v2i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6582     bits<2> idx;
6583     let Inst{11} = idx{1};
6584     let Inst{21} = idx{0};
6585   }
6586
6587   def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
6588                                       V128, V128,
6589                                       V128, VectorIndexS,
6590                                       asm#"2", ".2d", ".2d", ".4s", ".s",
6591     [(set (v2i64 V128:$Rd),
6592           (OpNode (extract_high_v4i32 V128:$Rn),
6593                   (extract_high_v4i32 (ARM64duplane32 (v4i32 V128:$Rm),
6594                                                       VectorIndexS:$idx))))]> {
6595     bits<2> idx;
6596     let Inst{11} = idx{1};
6597     let Inst{21} = idx{0};
6598   }
6599
6600   def v1i32_indexed : BaseSIMDIndexed<1, U, 1, 0b01, opc,
6601                                       FPR32Op, FPR16Op, V128_lo, VectorIndexH,
6602                                       asm, ".h", "", "", ".h", []> {
6603     bits<3> idx;
6604     let Inst{11} = idx{2};
6605     let Inst{21} = idx{1};
6606     let Inst{20} = idx{0};
6607   }
6608
6609   def v1i64_indexed : BaseSIMDIndexed<1, U, 1, 0b10, opc,
6610                                       FPR64Op, FPR32Op, V128, VectorIndexS,
6611                                       asm, ".s", "", "", ".s", []> {
6612     bits<2> idx;
6613     let Inst{11} = idx{1};
6614     let Inst{21} = idx{0};
6615   }
6616 }
6617
6618 multiclass SIMDIndexedLongSQDMLXSDTied<bit U, bits<4> opc, string asm,
6619                                        SDPatternOperator Accum> {
6620   def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,
6621                                       V128, V64,
6622                                       V128_lo, VectorIndexH,
6623                                       asm, ".4s", ".4s", ".4h", ".h",
6624     [(set (v4i32 V128:$dst),
6625           (Accum (v4i32 V128:$Rd),
6626                  (v4i32 (int_arm64_neon_sqdmull
6627                              (v4i16 V64:$Rn),
6628                              (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm),
6629                                                     VectorIndexH:$idx))))))]> {
6630     bits<3> idx;
6631     let Inst{11} = idx{2};
6632     let Inst{21} = idx{1};
6633     let Inst{20} = idx{0};
6634   }
6635
6636   // FIXME: it would be nice to use the scalar (v1i32) instruction here, but an
6637   // intermediate EXTRACT_SUBREG would be untyped.
6638   def : Pat<(i32 (Accum (i32 FPR32Op:$Rd),
6639                 (i32 (vector_extract (v4i32
6640                          (int_arm64_neon_sqdmull (v4i16 V64:$Rn),
6641                              (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm),
6642                                                     VectorIndexH:$idx)))),
6643                          (i64 0))))),
6644             (EXTRACT_SUBREG
6645                 (!cast<Instruction>(NAME # v4i16_indexed)
6646                     (SUBREG_TO_REG (i32 0), FPR32Op:$Rd, ssub), V64:$Rn,
6647                     V128_lo:$Rm, VectorIndexH:$idx),
6648                 ssub)>;
6649
6650   def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,
6651                                       V128, V128,
6652                                       V128_lo, VectorIndexH,
6653                                       asm#"2", ".4s", ".4s", ".8h", ".h",
6654     [(set (v4i32 V128:$dst),
6655           (Accum (v4i32 V128:$Rd),
6656                  (v4i32 (int_arm64_neon_sqdmull
6657                             (extract_high_v8i16 V128:$Rn),
6658                             (extract_high_v8i16
6659                                 (ARM64duplane16 (v8i16 V128_lo:$Rm),
6660                                                 VectorIndexH:$idx))))))]> {
6661     bits<3> idx;
6662     let Inst{11} = idx{2};
6663     let Inst{21} = idx{1};
6664     let Inst{20} = idx{0};
6665   }
6666
6667   def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,
6668                                       V128, V64,
6669                                       V128, VectorIndexS,
6670                                       asm, ".2d", ".2d", ".2s", ".s",
6671     [(set (v2i64 V128:$dst),
6672         (Accum (v2i64 V128:$Rd),
6673                (v2i64 (int_arm64_neon_sqdmull
6674                           (v2i32 V64:$Rn),
6675                           (v2i32 (ARM64duplane32 (v4i32 V128:$Rm),
6676                                                  VectorIndexS:$idx))))))]> {
6677     bits<2> idx;
6678     let Inst{11} = idx{1};
6679     let Inst{21} = idx{0};
6680   }
6681
6682   def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
6683                                       V128, V128,
6684                                       V128, VectorIndexS,
6685                                       asm#"2", ".2d", ".2d", ".4s", ".s",
6686     [(set (v2i64 V128:$dst),
6687           (Accum (v2i64 V128:$Rd),
6688                  (v2i64 (int_arm64_neon_sqdmull
6689                             (extract_high_v4i32 V128:$Rn),
6690                             (extract_high_v4i32
6691                                 (ARM64duplane32 (v4i32 V128:$Rm),
6692                                                 VectorIndexS:$idx))))))]> {
6693     bits<2> idx;
6694     let Inst{11} = idx{1};
6695     let Inst{21} = idx{0};
6696   }
6697
6698   def v1i32_indexed : BaseSIMDIndexedTied<1, U, 1, 0b01, opc,
6699                                       FPR32Op, FPR16Op, V128_lo, VectorIndexH,
6700                                       asm, ".h", "", "", ".h", []> {
6701     bits<3> idx;
6702     let Inst{11} = idx{2};
6703     let Inst{21} = idx{1};
6704     let Inst{20} = idx{0};
6705   }
6706
6707
6708   def v1i64_indexed : BaseSIMDIndexedTied<1, U, 1, 0b10, opc,
6709                                       FPR64Op, FPR32Op, V128, VectorIndexS,
6710                                       asm, ".s", "", "", ".s",
6711     [(set (i64 FPR64Op:$dst),
6712           (Accum (i64 FPR64Op:$Rd),
6713                  (i64 (int_arm64_neon_sqdmulls_scalar
6714                             (i32 FPR32Op:$Rn),
6715                             (i32 (vector_extract (v4i32 V128:$Rm),
6716                                                  VectorIndexS:$idx))))))]> {
6717
6718     bits<2> idx;
6719     let Inst{11} = idx{1};
6720     let Inst{21} = idx{0};
6721   }
6722 }
6723
6724 multiclass SIMDVectorIndexedLongSD<bit U, bits<4> opc, string asm,
6725                                    SDPatternOperator OpNode> {
6726   let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
6727   def v4i16_indexed : BaseSIMDIndexed<0, U, 0, 0b01, opc,
6728                                       V128, V64,
6729                                       V128_lo, VectorIndexH,
6730                                       asm, ".4s", ".4s", ".4h", ".h",
6731     [(set (v4i32 V128:$Rd),
6732         (OpNode (v4i16 V64:$Rn),
6733          (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6734     bits<3> idx;
6735     let Inst{11} = idx{2};
6736     let Inst{21} = idx{1};
6737     let Inst{20} = idx{0};
6738   }
6739
6740   def v8i16_indexed : BaseSIMDIndexed<1, U, 0, 0b01, opc,
6741                                       V128, V128,
6742                                       V128_lo, VectorIndexH,
6743                                       asm#"2", ".4s", ".4s", ".8h", ".h",
6744     [(set (v4i32 V128:$Rd),
6745           (OpNode (extract_high_v8i16 V128:$Rn),
6746                   (extract_high_v8i16 (ARM64duplane16 (v8i16 V128_lo:$Rm),
6747                                                       VectorIndexH:$idx))))]> {
6748
6749     bits<3> idx;
6750     let Inst{11} = idx{2};
6751     let Inst{21} = idx{1};
6752     let Inst{20} = idx{0};
6753   }
6754
6755   def v2i32_indexed : BaseSIMDIndexed<0, U, 0, 0b10, opc,
6756                                       V128, V64,
6757                                       V128, VectorIndexS,
6758                                       asm, ".2d", ".2d", ".2s", ".s",
6759     [(set (v2i64 V128:$Rd),
6760         (OpNode (v2i32 V64:$Rn),
6761          (v2i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6762     bits<2> idx;
6763     let Inst{11} = idx{1};
6764     let Inst{21} = idx{0};
6765   }
6766
6767   def v4i32_indexed : BaseSIMDIndexed<1, U, 0, 0b10, opc,
6768                                       V128, V128,
6769                                       V128, VectorIndexS,
6770                                       asm#"2", ".2d", ".2d", ".4s", ".s",
6771     [(set (v2i64 V128:$Rd),
6772           (OpNode (extract_high_v4i32 V128:$Rn),
6773                   (extract_high_v4i32 (ARM64duplane32 (v4i32 V128:$Rm),
6774                                                       VectorIndexS:$idx))))]> {
6775     bits<2> idx;
6776     let Inst{11} = idx{1};
6777     let Inst{21} = idx{0};
6778   }
6779   }
6780 }
6781
6782 multiclass SIMDVectorIndexedLongSDTied<bit U, bits<4> opc, string asm,
6783                                        SDPatternOperator OpNode> {
6784   let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in {
6785   def v4i16_indexed : BaseSIMDIndexedTied<0, U, 0, 0b01, opc,
6786                                       V128, V64,
6787                                       V128_lo, VectorIndexH,
6788                                       asm, ".4s", ".4s", ".4h", ".h",
6789     [(set (v4i32 V128:$dst),
6790         (OpNode (v4i32 V128:$Rd), (v4i16 V64:$Rn),
6791          (v4i16 (ARM64duplane16 (v8i16 V128_lo:$Rm), VectorIndexH:$idx))))]> {
6792     bits<3> idx;
6793     let Inst{11} = idx{2};
6794     let Inst{21} = idx{1};
6795     let Inst{20} = idx{0};
6796   }
6797
6798   def v8i16_indexed : BaseSIMDIndexedTied<1, U, 0, 0b01, opc,
6799                                       V128, V128,
6800                                       V128_lo, VectorIndexH,
6801                                       asm#"2", ".4s", ".4s", ".8h", ".h",
6802     [(set (v4i32 V128:$dst),
6803           (OpNode (v4i32 V128:$Rd),
6804                   (extract_high_v8i16 V128:$Rn),
6805                   (extract_high_v8i16 (ARM64duplane16 (v8i16 V128_lo:$Rm),
6806                                                       VectorIndexH:$idx))))]> {
6807     bits<3> idx;
6808     let Inst{11} = idx{2};
6809     let Inst{21} = idx{1};
6810     let Inst{20} = idx{0};
6811   }
6812
6813   def v2i32_indexed : BaseSIMDIndexedTied<0, U, 0, 0b10, opc,
6814                                       V128, V64,
6815                                       V128, VectorIndexS,
6816                                       asm, ".2d", ".2d", ".2s", ".s",
6817     [(set (v2i64 V128:$dst),
6818         (OpNode (v2i64 V128:$Rd), (v2i32 V64:$Rn),
6819          (v2i32 (ARM64duplane32 (v4i32 V128:$Rm), VectorIndexS:$idx))))]> {
6820     bits<2> idx;
6821     let Inst{11} = idx{1};
6822     let Inst{21} = idx{0};
6823   }
6824
6825   def v4i32_indexed : BaseSIMDIndexedTied<1, U, 0, 0b10, opc,
6826                                       V128, V128,
6827                                       V128, VectorIndexS,
6828                                       asm#"2", ".2d", ".2d", ".4s", ".s",
6829     [(set (v2i64 V128:$dst),
6830           (OpNode (v2i64 V128:$Rd),
6831                   (extract_high_v4i32 V128:$Rn),
6832                   (extract_high_v4i32 (ARM64duplane32 (v4i32 V128:$Rm),
6833                                                       VectorIndexS:$idx))))]> {
6834     bits<2> idx;
6835     let Inst{11} = idx{1};
6836     let Inst{21} = idx{0};
6837   }
6838   }
6839 }
6840
6841 //----------------------------------------------------------------------------
6842 // AdvSIMD scalar shift by immediate
6843 //----------------------------------------------------------------------------
6844
6845 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
6846 class BaseSIMDScalarShift<bit U, bits<5> opc, bits<7> fixed_imm,
6847                      RegisterClass regtype1, RegisterClass regtype2,
6848                      Operand immtype, string asm, list<dag> pattern>
6849   : I<(outs regtype1:$Rd), (ins regtype2:$Rn, immtype:$imm),
6850       asm, "\t$Rd, $Rn, $imm", "", pattern>,
6851     Sched<[WriteV]> {
6852   bits<5> Rd;
6853   bits<5> Rn;
6854   bits<7> imm;
6855   let Inst{31-30} = 0b01;
6856   let Inst{29}    = U;
6857   let Inst{28-23} = 0b111110;
6858   let Inst{22-16} = fixed_imm;
6859   let Inst{15-11} = opc;
6860   let Inst{10}    = 1;
6861   let Inst{9-5} = Rn;
6862   let Inst{4-0} = Rd;
6863 }
6864
6865 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
6866 class BaseSIMDScalarShiftTied<bit U, bits<5> opc, bits<7> fixed_imm,
6867                      RegisterClass regtype1, RegisterClass regtype2,
6868                      Operand immtype, string asm, list<dag> pattern>
6869   : I<(outs regtype1:$dst), (ins regtype1:$Rd, regtype2:$Rn, immtype:$imm),
6870       asm, "\t$Rd, $Rn, $imm", "$Rd = $dst", pattern>,
6871     Sched<[WriteV]> {
6872   bits<5> Rd;
6873   bits<5> Rn;
6874   bits<7> imm;
6875   let Inst{31-30} = 0b01;
6876   let Inst{29}    = U;
6877   let Inst{28-23} = 0b111110;
6878   let Inst{22-16} = fixed_imm;
6879   let Inst{15-11} = opc;
6880   let Inst{10}    = 1;
6881   let Inst{9-5} = Rn;
6882   let Inst{4-0} = Rd;
6883 }
6884
6885
6886 multiclass SIMDScalarRShiftSD<bit U, bits<5> opc, string asm> {
6887   def s : BaseSIMDScalarShift<U, opc, {0,1,?,?,?,?,?},
6888                               FPR32, FPR32, vecshiftR32, asm, []> {
6889     let Inst{20-16} = imm{4-0};
6890   }
6891
6892   def d : BaseSIMDScalarShift<U, opc, {1,?,?,?,?,?,?},
6893                               FPR64, FPR64, vecshiftR64, asm, []> {
6894     let Inst{21-16} = imm{5-0};
6895   }
6896 }
6897
6898 multiclass SIMDScalarRShiftD<bit U, bits<5> opc, string asm,
6899                              SDPatternOperator OpNode> {
6900   def d : BaseSIMDScalarShift<U, opc, {1,?,?,?,?,?,?},
6901                               FPR64, FPR64, vecshiftR64, asm,
6902   [(set (i64 FPR64:$Rd),
6903      (OpNode (i64 FPR64:$Rn), (i32 vecshiftR64:$imm)))]> {
6904     let Inst{21-16} = imm{5-0};
6905   }
6906
6907   def : Pat<(v1i64 (OpNode (v1i64 FPR64:$Rn), (i32 vecshiftR64:$imm))),
6908             (!cast<Instruction>(NAME # "d") FPR64:$Rn, vecshiftR64:$imm)>;
6909 }
6910
6911 multiclass SIMDScalarRShiftDTied<bit U, bits<5> opc, string asm,
6912                                  SDPatternOperator OpNode = null_frag> {
6913   def d : BaseSIMDScalarShiftTied<U, opc, {1,?,?,?,?,?,?},
6914                               FPR64, FPR64, vecshiftR64, asm,
6915   [(set (i64 FPR64:$dst), (OpNode (i64 FPR64:$Rd), (i64 FPR64:$Rn),
6916                                                    (i32 vecshiftR64:$imm)))]> {
6917     let Inst{21-16} = imm{5-0};
6918   }
6919
6920   def : Pat<(v1i64 (OpNode (v1i64 FPR64:$Rd), (v1i64 FPR64:$Rn),
6921                            (i32 vecshiftR64:$imm))),
6922             (!cast<Instruction>(NAME # "d") FPR64:$Rd, FPR64:$Rn,
6923                                             vecshiftR64:$imm)>;
6924 }
6925
6926 multiclass SIMDScalarLShiftD<bit U, bits<5> opc, string asm,
6927                              SDPatternOperator OpNode> {
6928   def d : BaseSIMDScalarShift<U, opc, {1,?,?,?,?,?,?},
6929                               FPR64, FPR64, vecshiftL64, asm,
6930     [(set (v1i64 FPR64:$Rd),
6931        (OpNode (v1i64 FPR64:$Rn), (i32 vecshiftL64:$imm)))]> {
6932     let Inst{21-16} = imm{5-0};
6933   }
6934 }
6935
6936 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
6937 multiclass SIMDScalarLShiftDTied<bit U, bits<5> opc, string asm> {
6938   def d : BaseSIMDScalarShiftTied<U, opc, {1,?,?,?,?,?,?},
6939                               FPR64, FPR64, vecshiftL64, asm, []> {
6940     let Inst{21-16} = imm{5-0};
6941   }
6942 }
6943
6944 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
6945 multiclass SIMDScalarRShiftBHS<bit U, bits<5> opc, string asm,
6946                                SDPatternOperator OpNode = null_frag> {
6947   def b : BaseSIMDScalarShift<U, opc, {0,0,0,1,?,?,?},
6948                               FPR8, FPR16, vecshiftR8, asm, []> {
6949     let Inst{18-16} = imm{2-0};
6950   }
6951
6952   def h : BaseSIMDScalarShift<U, opc, {0,0,1,?,?,?,?},
6953                               FPR16, FPR32, vecshiftR16, asm, []> {
6954     let Inst{19-16} = imm{3-0};
6955   }
6956
6957   def s : BaseSIMDScalarShift<U, opc, {0,1,?,?,?,?,?},
6958                               FPR32, FPR64, vecshiftR32, asm,
6959     [(set (i32 FPR32:$Rd), (OpNode (i64 FPR64:$Rn), vecshiftR32:$imm))]> {
6960     let Inst{20-16} = imm{4-0};
6961   }
6962 }
6963
6964 multiclass SIMDScalarLShiftBHSD<bit U, bits<5> opc, string asm,
6965                                 SDPatternOperator OpNode> {
6966   def b : BaseSIMDScalarShift<U, opc, {0,0,0,1,?,?,?},
6967                               FPR8, FPR8, vecshiftL8, asm, []> {
6968     let Inst{18-16} = imm{2-0};
6969   }
6970
6971   def h : BaseSIMDScalarShift<U, opc, {0,0,1,?,?,?,?},
6972                               FPR16, FPR16, vecshiftL16, asm, []> {
6973     let Inst{19-16} = imm{3-0};
6974   }
6975
6976   def s : BaseSIMDScalarShift<U, opc, {0,1,?,?,?,?,?},
6977                               FPR32, FPR32, vecshiftL32, asm,
6978     [(set (i32 FPR32:$Rd), (OpNode (i32 FPR32:$Rn), (i32 vecshiftL32:$imm)))]> {
6979     let Inst{20-16} = imm{4-0};
6980   }
6981
6982   def d : BaseSIMDScalarShift<U, opc, {1,?,?,?,?,?,?},
6983                               FPR64, FPR64, vecshiftL64, asm,
6984     [(set (i64 FPR64:$Rd), (OpNode (i64 FPR64:$Rn), (i32 vecshiftL64:$imm)))]> {
6985     let Inst{21-16} = imm{5-0};
6986   }
6987
6988   def : Pat<(v1i64 (OpNode (v1i64 FPR64:$Rn), (i32 vecshiftL64:$imm))),
6989             (!cast<Instruction>(NAME # "d") FPR64:$Rn, vecshiftL64:$imm)>;
6990 }
6991
6992 multiclass SIMDScalarRShiftBHSD<bit U, bits<5> opc, string asm> {
6993   def b : BaseSIMDScalarShift<U, opc, {0,0,0,1,?,?,?},
6994                               FPR8, FPR8, vecshiftR8, asm, []> {
6995     let Inst{18-16} = imm{2-0};
6996   }
6997
6998   def h : BaseSIMDScalarShift<U, opc, {0,0,1,?,?,?,?},
6999                               FPR16, FPR16, vecshiftR16, asm, []> {
7000     let Inst{19-16} = imm{3-0};
7001   }
7002
7003   def s : BaseSIMDScalarShift<U, opc, {0,1,?,?,?,?,?},
7004                               FPR32, FPR32, vecshiftR32, asm, []> {
7005     let Inst{20-16} = imm{4-0};
7006   }
7007
7008   def d : BaseSIMDScalarShift<U, opc, {1,?,?,?,?,?,?},
7009                               FPR64, FPR64, vecshiftR64, asm, []> {
7010     let Inst{21-16} = imm{5-0};
7011   }
7012 }
7013
7014 //----------------------------------------------------------------------------
7015 // AdvSIMD vector x indexed element
7016 //----------------------------------------------------------------------------
7017
7018 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
7019 class BaseSIMDVectorShift<bit Q, bit U, bits<5> opc, bits<7> fixed_imm,
7020                      RegisterOperand dst_reg, RegisterOperand src_reg,
7021                      Operand immtype,
7022                      string asm, string dst_kind, string src_kind,
7023                      list<dag> pattern>
7024   : I<(outs dst_reg:$Rd), (ins src_reg:$Rn, immtype:$imm),
7025       asm, "{\t$Rd" # dst_kind # ", $Rn" # src_kind # ", $imm" #
7026            "|" # dst_kind # "\t$Rd, $Rn, $imm}", "", pattern>,
7027     Sched<[WriteV]> {
7028   bits<5> Rd;
7029   bits<5> Rn;
7030   let Inst{31}    = 0;
7031   let Inst{30}    = Q;
7032   let Inst{29}    = U;
7033   let Inst{28-23} = 0b011110;
7034   let Inst{22-16} = fixed_imm;
7035   let Inst{15-11} = opc;
7036   let Inst{10}    = 1;
7037   let Inst{9-5}   = Rn;
7038   let Inst{4-0}   = Rd;
7039 }
7040
7041 let mayStore = 0, mayLoad = 0, hasSideEffects = 0 in
7042 class BaseSIMDVectorShiftTied<bit Q, bit U, bits<5> opc, bits<7> fixed_imm,
7043                      RegisterOperand vectype1, RegisterOperand vectype2,
7044                      Operand immtype,
7045                      string asm, string dst_kind, string src_kind,
7046                      list<dag> pattern>
7047   : I<(outs vectype1:$dst), (ins vectype1:$Rd, vectype2:$Rn, immtype:$imm),
7048       asm, "{\t$Rd" # dst_kind # ", $Rn" # src_kind # ", $imm" #
7049            "|" # dst_kind # "\t$Rd, $Rn, $imm}", "$Rd = $dst", pattern>,
7050     Sched<[WriteV]> {
7051   bits<5> Rd;
7052   bits<5> Rn;
7053   let Inst{31}    = 0;
7054   let Inst{30}    = Q;
7055   let Inst{29}    = U;
7056   let Inst{28-23} = 0b011110;
7057   let Inst{22-16} = fixed_imm;
7058   let Inst{15-11} = opc;
7059   let Inst{10}    = 1;
7060   let Inst{9-5}   = Rn;
7061   let Inst{4-0}   = Rd;
7062 }
7063
7064 multiclass SIMDVectorRShiftSD<bit U, bits<5> opc, string asm,
7065                               Intrinsic OpNode> {
7066   def v2i32_shift : BaseSIMDVectorShift<0, U, opc, {0,1,?,?,?,?,?},
7067                                   V64, V64, vecshiftR32,
7068                                   asm, ".2s", ".2s",
7069       [(set (v2i32 V64:$Rd), (OpNode (v2f32 V64:$Rn), (i32 imm:$imm)))]> {
7070     bits<5> imm;
7071     let Inst{20-16} = imm;
7072   }
7073
7074   def v4i32_shift : BaseSIMDVectorShift<1, U, opc, {0,1,?,?,?,?,?},
7075                                   V128, V128, vecshiftR32,
7076                                   asm, ".4s", ".4s",
7077       [(set (v4i32 V128:$Rd), (OpNode (v4f32 V128:$Rn), (i32 imm:$imm)))]> {
7078     bits<5> imm;
7079     let Inst{20-16} = imm;
7080   }
7081
7082   def v2i64_shift : BaseSIMDVectorShift<1, U, opc, {1,?,?,?,?,?,?},
7083                                   V128, V128, vecshiftR64,
7084                                   asm, ".2d", ".2d",
7085       [(set (v2i64 V128:$Rd), (OpNode (v2f64 V128:$Rn), (i32 imm:$imm)))]> {
7086     bits<6> imm;
7087     let Inst{21-16} = imm;
7088   }
7089 }
7090
7091 multiclass SIMDVectorRShiftSDToFP<bit U, bits<5> opc, string asm,
7092                                   Intrinsic OpNode> {
7093   def v2i32_shift : BaseSIMDVectorShift<0, U, opc, {0,1,?,?,?,?,?},
7094                                   V64, V64, vecshiftR32,
7095                                   asm, ".2s", ".2s",
7096       [(set (v2f32 V64:$Rd), (OpNode (v2i32 V64:$Rn), (i32 imm:$imm)))]> {
7097     bits<5> imm;
7098     let Inst{20-16} = imm;
7099   }
7100
7101   def v4i32_shift : BaseSIMDVectorShift<1, U, opc, {0,1,?,?,?,?,?},
7102                                   V128, V128, vecshiftR32,
7103                                   asm, ".4s", ".4s",
7104       [(set (v4f32 V128:$Rd), (OpNode (v4i32 V128:$Rn), (i32 imm:$imm)))]> {
7105     bits<5> imm;
7106     let Inst{20-16} = imm;
7107   }
7108
7109   def v2i64_shift : BaseSIMDVectorShift<1, U, opc, {1,?,?,?,?,?,?},
7110                                   V128, V128, vecshiftR64,
7111                                   asm, ".2d", ".2d",
7112       [(set (v2f64 V128:$Rd), (OpNode (v2i64 V128:$Rn), (i32 imm:$imm)))]> {
7113     bits<6> imm;
7114     let Inst{21-16} = imm;
7115   }
7116 }
7117
7118 multiclass SIMDVectorRShiftNarrowBHS<bit U, bits<5> opc, string asm,
7119                                      SDPatternOperator OpNode> {
7120   def v8i8_shift : BaseSIMDVectorShift<0, U, opc, {0,0,0,1,?,?,?},
7121                                   V64, V128, vecshiftR16Narrow,
7122                                   asm, ".8b", ".8h",
7123       [(set (v8i8 V64:$Rd), (OpNode (v8i16 V128:$Rn), vecshiftR16Narrow:$imm))]> {
7124     bits<3> imm;
7125     let Inst{18-16} = imm;
7126   }
7127
7128   def v16i8_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,0,0,1,?,?,?},
7129                                   V128, V128, vecshiftR16Narrow,
7130                                   asm#"2", ".16b", ".8h", []> {
7131     bits<3> imm;
7132     let Inst{18-16} = imm;
7133     let hasSideEffects = 0;
7134   }
7135
7136   def v4i16_shift : BaseSIMDVectorShift<0, U, opc, {0,0,1,?,?,?,?},
7137                                   V64, V128, vecshiftR32Narrow,
7138                                   asm, ".4h", ".4s",
7139       [(set (v4i16 V64:$Rd), (OpNode (v4i32 V128:$Rn), vecshiftR32Narrow:$imm))]> {
7140     bits<4> imm;
7141     let Inst{19-16} = imm;
7142   }
7143
7144   def v8i16_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,0,1,?,?,?,?},
7145                                   V128, V128, vecshiftR32Narrow,
7146                                   asm#"2", ".8h", ".4s", []> {
7147     bits<4> imm;
7148     let Inst{19-16} = imm;
7149     let hasSideEffects = 0;
7150   }
7151
7152   def v2i32_shift : BaseSIMDVectorShift<0, U, opc, {0,1,?,?,?,?,?},
7153                                   V64, V128, vecshiftR64Narrow,
7154                                   asm, ".2s", ".2d",
7155       [(set (v2i32 V64:$Rd), (OpNode (v2i64 V128:$Rn), vecshiftR64Narrow:$imm))]> {
7156     bits<5> imm;
7157     let Inst{20-16} = imm;
7158   }
7159
7160   def v4i32_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,1,?,?,?,?,?},
7161                                   V128, V128, vecshiftR64Narrow,
7162                                   asm#"2", ".4s", ".2d", []> {
7163     bits<5> imm;
7164     let Inst{20-16} = imm;
7165     let hasSideEffects = 0;
7166   }
7167
7168   // TableGen doesn't like patters w/ INSERT_SUBREG on the instructions
7169   // themselves, so put them here instead.
7170
7171   // Patterns involving what's effectively an insert high and a normal
7172   // intrinsic, represented by CONCAT_VECTORS.
7173   def : Pat<(concat_vectors (v8i8 V64:$Rd),(OpNode (v8i16 V128:$Rn),
7174                                                    vecshiftR16Narrow:$imm)),
7175             (!cast<Instruction>(NAME # "v16i8_shift")
7176                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub),
7177                 V128:$Rn, vecshiftR16Narrow:$imm)>;
7178   def : Pat<(concat_vectors (v4i16 V64:$Rd), (OpNode (v4i32 V128:$Rn),
7179                                                      vecshiftR32Narrow:$imm)),
7180             (!cast<Instruction>(NAME # "v8i16_shift")
7181                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub),
7182                 V128:$Rn, vecshiftR32Narrow:$imm)>;
7183   def : Pat<(concat_vectors (v2i32 V64:$Rd), (OpNode (v2i64 V128:$Rn),
7184                                                      vecshiftR64Narrow:$imm)),
7185             (!cast<Instruction>(NAME # "v4i32_shift")
7186                 (INSERT_SUBREG (IMPLICIT_DEF), V64:$Rd, dsub),
7187                 V128:$Rn, vecshiftR64Narrow:$imm)>;
7188 }
7189
7190 multiclass SIMDVectorLShiftBHSD<bit U, bits<5> opc, string asm,
7191                                 SDPatternOperator OpNode> {
7192   def v8i8_shift : BaseSIMDVectorShift<0, U, opc, {0,0,0,1,?,?,?},
7193                                   V64, V64, vecshiftL8,
7194                                   asm, ".8b", ".8b",
7195                  [(set (v8i8 V64:$Rd), (OpNode (v8i8 V64:$Rn),
7196                        (i32 vecshiftL8:$imm)))]> {
7197     bits<3> imm;
7198     let Inst{18-16} = imm;
7199   }
7200
7201   def v16i8_shift : BaseSIMDVectorShift<1, U, opc, {0,0,0,1,?,?,?},
7202                                   V128, V128, vecshiftL8,
7203                                   asm, ".16b", ".16b",
7204              [(set (v16i8 V128:$Rd), (OpNode (v16i8 V128:$Rn),
7205                    (i32 vecshiftL8:$imm)))]> {
7206     bits<3> imm;
7207     let Inst{18-16} = imm;
7208   }
7209
7210   def v4i16_shift : BaseSIMDVectorShift<0, U, opc, {0,0,1,?,?,?,?},
7211                                   V64, V64, vecshiftL16,
7212                                   asm, ".4h", ".4h",
7213               [(set (v4i16 V64:$Rd), (OpNode (v4i16 V64:$Rn),
7214                     (i32 vecshiftL16:$imm)))]> {
7215     bits<4> imm;
7216     let Inst{19-16} = imm;
7217   }
7218
7219   def v8i16_shift : BaseSIMDVectorShift<1, U, opc, {0,0,1,?,?,?,?},
7220                                   V128, V128, vecshiftL16,
7221                                   asm, ".8h", ".8h",
7222             [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn),
7223                   (i32 vecshiftL16:$imm)))]> {
7224     bits<4> imm;
7225     let Inst{19-16} = imm;
7226   }
7227
7228   def v2i32_shift : BaseSIMDVectorShift<0, U, opc, {0,1,?,?,?,?,?},
7229                                   V64, V64, vecshiftL32,
7230                                   asm, ".2s", ".2s",
7231               [(set (v2i32 V64:$Rd), (OpNode (v2i32 V64:$Rn),
7232                     (i32 vecshiftL32:$imm)))]> {
7233     bits<5> imm;
7234     let Inst{20-16} = imm;
7235   }
7236
7237   def v4i32_shift : BaseSIMDVectorShift<1, U, opc, {0,1,?,?,?,?,?},
7238                                   V128, V128, vecshiftL32,
7239                                   asm, ".4s", ".4s",
7240             [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn),
7241                   (i32 vecshiftL32:$imm)))]> {
7242     bits<5> imm;
7243     let Inst{20-16} = imm;
7244   }
7245
7246   def v2i64_shift : BaseSIMDVectorShift<1, U, opc, {1,?,?,?,?,?,?},
7247                                   V128, V128, vecshiftL64,
7248                                   asm, ".2d", ".2d",
7249             [(set (v2i64 V128:$Rd), (OpNode (v2i64 V128:$Rn),
7250                   (i32 vecshiftL64:$imm)))]> {
7251     bits<6> imm;
7252     let Inst{21-16} = imm;
7253   }
7254 }
7255
7256 multiclass SIMDVectorRShiftBHSD<bit U, bits<5> opc, string asm,
7257                                 SDPatternOperator OpNode> {
7258   def v8i8_shift : BaseSIMDVectorShift<0, U, opc, {0,0,0,1,?,?,?},
7259                                   V64, V64, vecshiftR8,
7260                                   asm, ".8b", ".8b",
7261                  [(set (v8i8 V64:$Rd), (OpNode (v8i8 V64:$Rn),
7262                        (i32 vecshiftR8:$imm)))]> {
7263     bits<3> imm;
7264     let Inst{18-16} = imm;
7265   }
7266
7267   def v16i8_shift : BaseSIMDVectorShift<1, U, opc, {0,0,0,1,?,?,?},
7268                                   V128, V128, vecshiftR8,
7269                                   asm, ".16b", ".16b",
7270              [(set (v16i8 V128:$Rd), (OpNode (v16i8 V128:$Rn),
7271                    (i32 vecshiftR8:$imm)))]> {
7272     bits<3> imm;
7273     let Inst{18-16} = imm;
7274   }
7275
7276   def v4i16_shift : BaseSIMDVectorShift<0, U, opc, {0,0,1,?,?,?,?},
7277                                   V64, V64, vecshiftR16,
7278                                   asm, ".4h", ".4h",
7279               [(set (v4i16 V64:$Rd), (OpNode (v4i16 V64:$Rn),
7280                     (i32 vecshiftR16:$imm)))]> {
7281     bits<4> imm;
7282     let Inst{19-16} = imm;
7283   }
7284
7285   def v8i16_shift : BaseSIMDVectorShift<1, U, opc, {0,0,1,?,?,?,?},
7286                                   V128, V128, vecshiftR16,
7287                                   asm, ".8h", ".8h",
7288             [(set (v8i16 V128:$Rd), (OpNode (v8i16 V128:$Rn),
7289                   (i32 vecshiftR16:$imm)))]> {
7290     bits<4> imm;
7291     let Inst{19-16} = imm;
7292   }
7293
7294   def v2i32_shift : BaseSIMDVectorShift<0, U, opc, {0,1,?,?,?,?,?},
7295                                   V64, V64, vecshiftR32,
7296                                   asm, ".2s", ".2s",
7297               [(set (v2i32 V64:$Rd), (OpNode (v2i32 V64:$Rn),
7298                     (i32 vecshiftR32:$imm)))]> {
7299     bits<5> imm;
7300     let Inst{20-16} = imm;
7301   }
7302
7303   def v4i32_shift : BaseSIMDVectorShift<1, U, opc, {0,1,?,?,?,?,?},
7304                                   V128, V128, vecshiftR32,
7305                                   asm, ".4s", ".4s",
7306             [(set (v4i32 V128:$Rd), (OpNode (v4i32 V128:$Rn),
7307                   (i32 vecshiftR32:$imm)))]> {
7308     bits<5> imm;
7309     let Inst{20-16} = imm;
7310   }
7311
7312   def v2i64_shift : BaseSIMDVectorShift<1, U, opc, {1,?,?,?,?,?,?},
7313                                   V128, V128, vecshiftR64,
7314                                   asm, ".2d", ".2d",
7315             [(set (v2i64 V128:$Rd), (OpNode (v2i64 V128:$Rn),
7316                   (i32 vecshiftR64:$imm)))]> {
7317     bits<6> imm;
7318     let Inst{21-16} = imm;
7319   }
7320 }
7321
7322 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
7323 multiclass SIMDVectorRShiftBHSDTied<bit U, bits<5> opc, string asm,
7324                                     SDPatternOperator OpNode = null_frag> {
7325   def v8i8_shift : BaseSIMDVectorShiftTied<0, U, opc, {0,0,0,1,?,?,?},
7326                                   V64, V64, vecshiftR8, asm, ".8b", ".8b",
7327                  [(set (v8i8 V64:$dst),
7328                    (OpNode (v8i8 V64:$Rd), (v8i8 V64:$Rn),
7329                            (i32 vecshiftR8:$imm)))]> {
7330     bits<3> imm;
7331     let Inst{18-16} = imm;
7332   }
7333
7334   def v16i8_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,0,0,1,?,?,?},
7335                                   V128, V128, vecshiftR8, asm, ".16b", ".16b",
7336              [(set (v16i8 V128:$dst),
7337                (OpNode (v16i8 V128:$Rd), (v16i8 V128:$Rn),
7338                        (i32 vecshiftR8:$imm)))]> {
7339     bits<3> imm;
7340     let Inst{18-16} = imm;
7341   }
7342
7343   def v4i16_shift : BaseSIMDVectorShiftTied<0, U, opc, {0,0,1,?,?,?,?},
7344                                   V64, V64, vecshiftR16, asm, ".4h", ".4h",
7345               [(set (v4i16 V64:$dst),
7346                 (OpNode (v4i16 V64:$Rd), (v4i16 V64:$Rn),
7347                         (i32 vecshiftR16:$imm)))]> {
7348     bits<4> imm;
7349     let Inst{19-16} = imm;
7350   }
7351
7352   def v8i16_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,0,1,?,?,?,?},
7353                                   V128, V128, vecshiftR16, asm, ".8h", ".8h",
7354             [(set (v8i16 V128:$dst),
7355               (OpNode (v8i16 V128:$Rd), (v8i16 V128:$Rn),
7356                       (i32 vecshiftR16:$imm)))]> {
7357     bits<4> imm;
7358     let Inst{19-16} = imm;
7359   }
7360
7361   def v2i32_shift : BaseSIMDVectorShiftTied<0, U, opc, {0,1,?,?,?,?,?},
7362                                   V64, V64, vecshiftR32, asm, ".2s", ".2s",
7363               [(set (v2i32 V64:$dst),
7364                 (OpNode (v2i32 V64:$Rd), (v2i32 V64:$Rn),
7365                         (i32 vecshiftR32:$imm)))]> {
7366     bits<5> imm;
7367     let Inst{20-16} = imm;
7368   }
7369
7370   def v4i32_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,1,?,?,?,?,?},
7371                                   V128, V128, vecshiftR32, asm, ".4s", ".4s",
7372             [(set (v4i32 V128:$dst),
7373               (OpNode (v4i32 V128:$Rd), (v4i32 V128:$Rn),
7374                       (i32 vecshiftR32:$imm)))]> {
7375     bits<5> imm;
7376     let Inst{20-16} = imm;
7377   }
7378
7379   def v2i64_shift : BaseSIMDVectorShiftTied<1, U, opc, {1,?,?,?,?,?,?},
7380                                   V128, V128, vecshiftR64,
7381                                   asm, ".2d", ".2d", [(set (v2i64 V128:$dst),
7382               (OpNode (v2i64 V128:$Rd), (v2i64 V128:$Rn),
7383                       (i32 vecshiftR64:$imm)))]> {
7384     bits<6> imm;
7385     let Inst{21-16} = imm;
7386   }
7387 }
7388
7389 multiclass SIMDVectorLShiftBHSDTied<bit U, bits<5> opc, string asm,
7390                                     SDPatternOperator OpNode = null_frag> {
7391   def v8i8_shift : BaseSIMDVectorShiftTied<0, U, opc, {0,0,0,1,?,?,?},
7392                                   V64, V64, vecshiftL8,
7393                                   asm, ".8b", ".8b",
7394                     [(set (v8i8 V64:$dst),
7395                           (OpNode (v8i8 V64:$Rd), (v8i8 V64:$Rn),
7396                                   (i32 vecshiftL8:$imm)))]> {
7397     bits<3> imm;
7398     let Inst{18-16} = imm;
7399   }
7400
7401   def v16i8_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,0,0,1,?,?,?},
7402                                   V128, V128, vecshiftL8,
7403                                   asm, ".16b", ".16b",
7404                     [(set (v16i8 V128:$dst),
7405                           (OpNode (v16i8 V128:$Rd), (v16i8 V128:$Rn),
7406                                   (i32 vecshiftL8:$imm)))]> {
7407     bits<3> imm;
7408     let Inst{18-16} = imm;
7409   }
7410
7411   def v4i16_shift : BaseSIMDVectorShiftTied<0, U, opc, {0,0,1,?,?,?,?},
7412                                   V64, V64, vecshiftL16,
7413                                   asm, ".4h", ".4h",
7414                     [(set (v4i16 V64:$dst),
7415                            (OpNode (v4i16 V64:$Rd), (v4i16 V64:$Rn),
7416                                    (i32 vecshiftL16:$imm)))]> {
7417     bits<4> imm;
7418     let Inst{19-16} = imm;
7419   }
7420
7421   def v8i16_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,0,1,?,?,?,?},
7422                                   V128, V128, vecshiftL16,
7423                                   asm, ".8h", ".8h",
7424                     [(set (v8i16 V128:$dst),
7425                           (OpNode (v8i16 V128:$Rd), (v8i16 V128:$Rn),
7426                                   (i32 vecshiftL16:$imm)))]> {
7427     bits<4> imm;
7428     let Inst{19-16} = imm;
7429   }
7430
7431   def v2i32_shift : BaseSIMDVectorShiftTied<0, U, opc, {0,1,?,?,?,?,?},
7432                                   V64, V64, vecshiftL32,
7433                                   asm, ".2s", ".2s",
7434                     [(set (v2i32 V64:$dst),
7435                           (OpNode (v2i32 V64:$Rd), (v2i32 V64:$Rn),
7436                                   (i32 vecshiftL32:$imm)))]> {
7437     bits<5> imm;
7438     let Inst{20-16} = imm;
7439   }
7440
7441   def v4i32_shift : BaseSIMDVectorShiftTied<1, U, opc, {0,1,?,?,?,?,?},
7442                                   V128, V128, vecshiftL32,
7443                                   asm, ".4s", ".4s",
7444                     [(set (v4i32 V128:$dst),
7445                           (OpNode (v4i32 V128:$Rd), (v4i32 V128:$Rn),
7446                                   (i32 vecshiftL32:$imm)))]> {
7447     bits<5> imm;
7448     let Inst{20-16} = imm;
7449   }
7450
7451   def v2i64_shift : BaseSIMDVectorShiftTied<1, U, opc, {1,?,?,?,?,?,?},
7452                                   V128, V128, vecshiftL64,
7453                                   asm, ".2d", ".2d",
7454                     [(set (v2i64 V128:$dst),
7455                           (OpNode (v2i64 V128:$Rd), (v2i64 V128:$Rn),
7456                                   (i32 vecshiftL64:$imm)))]> {
7457     bits<6> imm;
7458     let Inst{21-16} = imm;
7459   }
7460 }
7461
7462 multiclass SIMDVectorLShiftLongBHSD<bit U, bits<5> opc, string asm,
7463                                    SDPatternOperator OpNode> {
7464   def v8i8_shift : BaseSIMDVectorShift<0, U, opc, {0,0,0,1,?,?,?},
7465                                   V128, V64, vecshiftL8, asm, ".8h", ".8b",
7466       [(set (v8i16 V128:$Rd), (OpNode (v8i8 V64:$Rn), vecshiftL8:$imm))]> {
7467     bits<3> imm;
7468     let Inst{18-16} = imm;
7469   }
7470
7471   def v16i8_shift : BaseSIMDVectorShift<1, U, opc, {0,0,0,1,?,?,?},
7472                                   V128, V128, vecshiftL8,
7473                                   asm#"2", ".8h", ".16b",
7474       [(set (v8i16 V128:$Rd),
7475             (OpNode (extract_high_v16i8 V128:$Rn), vecshiftL8:$imm))]> {
7476     bits<3> imm;
7477     let Inst{18-16} = imm;
7478   }
7479
7480   def v4i16_shift : BaseSIMDVectorShift<0, U, opc, {0,0,1,?,?,?,?},
7481                                   V128, V64, vecshiftL16, asm, ".4s", ".4h",
7482       [(set (v4i32 V128:$Rd), (OpNode (v4i16 V64:$Rn), vecshiftL16:$imm))]> {
7483     bits<4> imm;
7484     let Inst{19-16} = imm;
7485   }
7486
7487   def v8i16_shift : BaseSIMDVectorShift<1, U, opc, {0,0,1,?,?,?,?},
7488                                   V128, V128, vecshiftL16,
7489                                   asm#"2", ".4s", ".8h",
7490       [(set (v4i32 V128:$Rd),
7491             (OpNode (extract_high_v8i16 V128:$Rn), vecshiftL16:$imm))]> {
7492
7493     bits<4> imm;
7494     let Inst{19-16} = imm;
7495   }
7496
7497   def v2i32_shift : BaseSIMDVectorShift<0, U, opc, {0,1,?,?,?,?,?},
7498                                   V128, V64, vecshiftL32, asm, ".2d", ".2s",
7499       [(set (v2i64 V128:$Rd), (OpNode (v2i32 V64:$Rn), vecshiftL32:$imm))]> {
7500     bits<5> imm;
7501     let Inst{20-16} = imm;
7502   }
7503
7504   def v4i32_shift : BaseSIMDVectorShift<1, U, opc, {0,1,?,?,?,?,?},
7505                                   V128, V128, vecshiftL32,
7506                                   asm#"2", ".2d", ".4s",
7507       [(set (v2i64 V128:$Rd),
7508             (OpNode (extract_high_v4i32 V128:$Rn), vecshiftL32:$imm))]> {
7509     bits<5> imm;
7510     let Inst{20-16} = imm;
7511   }
7512 }
7513
7514
7515 //---
7516 // Vector load/store
7517 //---
7518 // SIMD ldX/stX no-index memory references don't allow the optional
7519 // ", #0" constant and handle post-indexing explicitly, so we use
7520 // a more specialized parse method for them. Otherwise, it's the same as
7521 // the general am_noindex handling.
7522
7523 class BaseSIMDLdSt<bit Q, bit L, bits<4> opcode, bits<2> size,
7524                    string asm, dag oops, dag iops, list<dag> pattern>
7525   : I<oops, iops, asm, "\t$Vt, $vaddr", "", pattern> {
7526   bits<5> Vt;
7527   bits<5> vaddr;
7528   let Inst{31} = 0;
7529   let Inst{30} = Q;
7530   let Inst{29-23} = 0b0011000;
7531   let Inst{22} = L;
7532   let Inst{21-16} = 0b000000;
7533   let Inst{15-12} = opcode;
7534   let Inst{11-10} = size;
7535   let Inst{9-5} = vaddr;
7536   let Inst{4-0} = Vt;
7537 }
7538
7539 class BaseSIMDLdStPost<bit Q, bit L, bits<4> opcode, bits<2> size,
7540                        string asm, dag oops, dag iops>
7541   : I<oops, iops, asm, "\t$Vt, $vaddr, $Xm", "$vaddr = $wback", []> {
7542   bits<5> Vt;
7543   bits<5> vaddr;
7544   bits<5> Xm;
7545   let Inst{31} = 0;
7546   let Inst{30} = Q;
7547   let Inst{29-23} = 0b0011001;
7548   let Inst{22} = L;
7549   let Inst{21} = 0;
7550   let Inst{20-16} = Xm;
7551   let Inst{15-12} = opcode;
7552   let Inst{11-10} = size;
7553   let Inst{9-5} = vaddr;
7554   let Inst{4-0} = Vt;
7555 }
7556
7557 // The immediate form of AdvSIMD post-indexed addressing is encoded with
7558 // register post-index addressing from the zero register.
7559 multiclass SIMDLdStAliases<string asm, string layout, string Count,
7560                            int Offset, int Size> {
7561   // E.g. "ld1 { v0.8b, v1.8b }, [x1], #16"
7562   //      "ld1\t$Vt, $vaddr, #16"
7563   // may get mapped to
7564   //      (LD1Twov8b_POST VecListTwo8b:$Vt, am_simdnoindex:$vaddr, XZR)
7565   def : InstAlias<asm # "\t$Vt, $vaddr, #" # Offset,
7566                   (!cast<Instruction>(NAME # Count # "v" # layout # "_POST")
7567                       am_simdnoindex:$vaddr,
7568                       !cast<RegisterOperand>("VecList" # Count # layout):$Vt,
7569                       XZR), 1>;
7570
7571   // E.g. "ld1.8b { v0, v1 }, [x1], #16"
7572   //      "ld1.8b\t$Vt, $vaddr, #16"
7573   // may get mapped to
7574   //      (LD1Twov8b_POST VecListTwo64:$Vt, am_simdnoindex:$vaddr, XZR)
7575   def : InstAlias<asm # "." # layout # "\t$Vt, $vaddr, #" # Offset,
7576                   (!cast<Instruction>(NAME # Count # "v" # layout # "_POST")
7577                       am_simdnoindex:$vaddr,
7578                       !cast<RegisterOperand>("VecList" # Count # Size):$Vt,
7579                       XZR), 0>;
7580
7581   // E.g. "ld1.8b { v0, v1 }, [x1]"
7582   //      "ld1\t$Vt, $vaddr"
7583   // may get mapped to
7584   //      (LD1Twov8b VecListTwo64:$Vt, am_simdnoindex:$vaddr)
7585   def : InstAlias<asm # "." # layout # "\t$Vt, $vaddr",
7586                   (!cast<Instruction>(NAME # Count # "v" # layout)
7587                       !cast<RegisterOperand>("VecList" # Count # Size):$Vt,
7588                       am_simdnoindex:$vaddr), 0>;
7589
7590   // E.g. "ld1.8b { v0, v1 }, [x1], x2"
7591   //      "ld1\t$Vt, $vaddr, $Xm"
7592   // may get mapped to
7593   //      (LD1Twov8b_POST VecListTwo64:$Vt, am_simdnoindex:$vaddr, GPR64pi8:$Xm)
7594   def : InstAlias<asm # "." # layout # "\t$Vt, $vaddr, $Xm",
7595                   (!cast<Instruction>(NAME # Count # "v" # layout # "_POST")
7596                       am_simdnoindex:$vaddr,
7597                       !cast<RegisterOperand>("VecList" # Count # Size):$Vt,
7598                       !cast<RegisterOperand>("GPR64pi" # Offset):$Xm), 0>;
7599 }
7600
7601 multiclass BaseSIMDLdN<string Count, string asm, string veclist, int Offset128,
7602                        int Offset64, bits<4> opcode> {
7603   let hasSideEffects = 0, mayLoad = 1, mayStore = 0 in {
7604     def v16b: BaseSIMDLdSt<1, 1, opcode, 0b00, asm,
7605                            (outs !cast<RegisterOperand>(veclist # "16b"):$Vt),
7606                            (ins am_simdnoindex:$vaddr), []>;
7607     def v8h : BaseSIMDLdSt<1, 1, opcode, 0b01, asm,
7608                            (outs !cast<RegisterOperand>(veclist # "8h"):$Vt),
7609                            (ins am_simdnoindex:$vaddr), []>;
7610     def v4s : BaseSIMDLdSt<1, 1, opcode, 0b10, asm,
7611                            (outs !cast<RegisterOperand>(veclist # "4s"):$Vt),
7612                            (ins am_simdnoindex:$vaddr), []>;
7613     def v2d : BaseSIMDLdSt<1, 1, opcode, 0b11, asm,
7614                            (outs !cast<RegisterOperand>(veclist # "2d"):$Vt),
7615                            (ins am_simdnoindex:$vaddr), []>;
7616     def v8b : BaseSIMDLdSt<0, 1, opcode, 0b00, asm,
7617                            (outs !cast<RegisterOperand>(veclist # "8b"):$Vt),
7618                            (ins am_simdnoindex:$vaddr), []>;
7619     def v4h : BaseSIMDLdSt<0, 1, opcode, 0b01, asm,
7620                            (outs !cast<RegisterOperand>(veclist # "4h"):$Vt),
7621                            (ins am_simdnoindex:$vaddr), []>;
7622     def v2s : BaseSIMDLdSt<0, 1, opcode, 0b10, asm,
7623                            (outs !cast<RegisterOperand>(veclist # "2s"):$Vt),
7624                            (ins am_simdnoindex:$vaddr), []>;
7625
7626
7627     def v16b_POST: BaseSIMDLdStPost<1, 1, opcode, 0b00, asm,
7628                        (outs am_simdnoindex:$wback,
7629                              !cast<RegisterOperand>(veclist # "16b"):$Vt),
7630                        (ins am_simdnoindex:$vaddr,
7631                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7632     def v8h_POST : BaseSIMDLdStPost<1, 1, opcode, 0b01, asm,
7633                        (outs am_simdnoindex:$wback,
7634                              !cast<RegisterOperand>(veclist # "8h"):$Vt),
7635                        (ins am_simdnoindex:$vaddr,
7636                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7637     def v4s_POST : BaseSIMDLdStPost<1, 1, opcode, 0b10, asm,
7638                        (outs am_simdnoindex:$wback,
7639                              !cast<RegisterOperand>(veclist # "4s"):$Vt),
7640                        (ins am_simdnoindex:$vaddr,
7641                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7642     def v2d_POST : BaseSIMDLdStPost<1, 1, opcode, 0b11, asm,
7643                        (outs am_simdnoindex:$wback,
7644                              !cast<RegisterOperand>(veclist # "2d"):$Vt),
7645                        (ins am_simdnoindex:$vaddr,
7646                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7647     def v8b_POST : BaseSIMDLdStPost<0, 1, opcode, 0b00, asm,
7648                        (outs am_simdnoindex:$wback,
7649                              !cast<RegisterOperand>(veclist # "8b"):$Vt),
7650                        (ins am_simdnoindex:$vaddr,
7651                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7652     def v4h_POST : BaseSIMDLdStPost<0, 1, opcode, 0b01, asm,
7653                        (outs am_simdnoindex:$wback,
7654                              !cast<RegisterOperand>(veclist # "4h"):$Vt),
7655                        (ins am_simdnoindex:$vaddr,
7656                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7657     def v2s_POST : BaseSIMDLdStPost<0, 1, opcode, 0b10, asm,
7658                        (outs am_simdnoindex:$wback,
7659                              !cast<RegisterOperand>(veclist # "2s"):$Vt),
7660                        (ins am_simdnoindex:$vaddr,
7661                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7662   }
7663
7664   defm : SIMDLdStAliases<asm, "16b", Count, Offset128, 128>;
7665   defm : SIMDLdStAliases<asm, "8h", Count, Offset128, 128>;
7666   defm : SIMDLdStAliases<asm, "4s", Count, Offset128, 128>;
7667   defm : SIMDLdStAliases<asm, "2d", Count, Offset128, 128>;
7668   defm : SIMDLdStAliases<asm, "8b", Count, Offset64, 64>;
7669   defm : SIMDLdStAliases<asm, "4h", Count, Offset64, 64>;
7670   defm : SIMDLdStAliases<asm, "2s", Count, Offset64, 64>;
7671 }
7672
7673 // Only ld1/st1 has a v1d version.
7674 multiclass BaseSIMDStN<string Count, string asm, string veclist, int Offset128,
7675                        int Offset64, bits<4> opcode> {
7676   let hasSideEffects = 0, mayStore = 1, mayLoad = 0 in {
7677     def v16b : BaseSIMDLdSt<1, 0, opcode, 0b00, asm, (outs),
7678                             (ins !cast<RegisterOperand>(veclist # "16b"):$Vt,
7679                                  am_simdnoindex:$vaddr), []>;
7680     def v8h : BaseSIMDLdSt<1, 0, opcode, 0b01, asm, (outs),
7681                            (ins !cast<RegisterOperand>(veclist # "8h"):$Vt,
7682                                 am_simdnoindex:$vaddr), []>;
7683     def v4s : BaseSIMDLdSt<1, 0, opcode, 0b10, asm, (outs),
7684                            (ins !cast<RegisterOperand>(veclist # "4s"):$Vt,
7685                                 am_simdnoindex:$vaddr), []>;
7686     def v2d : BaseSIMDLdSt<1, 0, opcode, 0b11, asm, (outs),
7687                            (ins !cast<RegisterOperand>(veclist # "2d"):$Vt,
7688                                 am_simdnoindex:$vaddr), []>;
7689     def v8b : BaseSIMDLdSt<0, 0, opcode, 0b00, asm, (outs),
7690                            (ins !cast<RegisterOperand>(veclist # "8b"):$Vt,
7691                                 am_simdnoindex:$vaddr), []>;
7692     def v4h : BaseSIMDLdSt<0, 0, opcode, 0b01, asm, (outs),
7693                            (ins !cast<RegisterOperand>(veclist # "4h"):$Vt,
7694                                 am_simdnoindex:$vaddr), []>;
7695     def v2s : BaseSIMDLdSt<0, 0, opcode, 0b10, asm, (outs),
7696                            (ins !cast<RegisterOperand>(veclist # "2s"):$Vt,
7697                                 am_simdnoindex:$vaddr), []>;
7698
7699     def v16b_POST : BaseSIMDLdStPost<1, 0, opcode, 0b00, asm,
7700                        (outs am_simdnoindex:$wback),
7701                        (ins !cast<RegisterOperand>(veclist # "16b"):$Vt,
7702                             am_simdnoindex:$vaddr,
7703                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7704     def v8h_POST : BaseSIMDLdStPost<1, 0, opcode, 0b01, asm,
7705                        (outs am_simdnoindex:$wback),
7706                        (ins !cast<RegisterOperand>(veclist # "8h"):$Vt,
7707                             am_simdnoindex:$vaddr,
7708                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7709     def v4s_POST : BaseSIMDLdStPost<1, 0, opcode, 0b10, asm,
7710                        (outs am_simdnoindex:$wback),
7711                        (ins !cast<RegisterOperand>(veclist # "4s"):$Vt,
7712                             am_simdnoindex:$vaddr,
7713                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7714     def v2d_POST : BaseSIMDLdStPost<1, 0, opcode, 0b11, asm,
7715                        (outs am_simdnoindex:$wback),
7716                        (ins !cast<RegisterOperand>(veclist # "2d"):$Vt,
7717                             am_simdnoindex:$vaddr,
7718                             !cast<RegisterOperand>("GPR64pi" # Offset128):$Xm)>;
7719     def v8b_POST : BaseSIMDLdStPost<0, 0, opcode, 0b00, asm,
7720                        (outs am_simdnoindex:$wback),
7721                        (ins !cast<RegisterOperand>(veclist # "8b"):$Vt,
7722                             am_simdnoindex:$vaddr,
7723                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7724     def v4h_POST : BaseSIMDLdStPost<0, 0, opcode, 0b01, asm,
7725                        (outs am_simdnoindex:$wback),
7726                        (ins !cast<RegisterOperand>(veclist # "4h"):$Vt,
7727                             am_simdnoindex:$vaddr,
7728                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7729     def v2s_POST : BaseSIMDLdStPost<0, 0, opcode, 0b10, asm,
7730                        (outs am_simdnoindex:$wback),
7731                        (ins !cast<RegisterOperand>(veclist # "2s"):$Vt,
7732                             am_simdnoindex:$vaddr,
7733                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7734   }
7735
7736   defm : SIMDLdStAliases<asm, "16b", Count, Offset128, 128>;
7737   defm : SIMDLdStAliases<asm, "8h", Count, Offset128, 128>;
7738   defm : SIMDLdStAliases<asm, "4s", Count, Offset128, 128>;
7739   defm : SIMDLdStAliases<asm, "2d", Count, Offset128, 128>;
7740   defm : SIMDLdStAliases<asm, "8b", Count, Offset64, 64>;
7741   defm : SIMDLdStAliases<asm, "4h", Count, Offset64, 64>;
7742   defm : SIMDLdStAliases<asm, "2s", Count, Offset64, 64>;
7743 }
7744
7745 multiclass BaseSIMDLd1<string Count, string asm, string veclist,
7746                        int Offset128, int Offset64, bits<4> opcode>
7747   : BaseSIMDLdN<Count, asm, veclist, Offset128, Offset64, opcode> {
7748
7749   // LD1 instructions have extra "1d" variants.
7750   let hasSideEffects = 0, mayLoad = 1, mayStore = 0 in {
7751     def v1d : BaseSIMDLdSt<0, 1, opcode, 0b11, asm,
7752                            (outs !cast<RegisterOperand>(veclist # "1d"):$Vt),
7753                            (ins am_simdnoindex:$vaddr), []>;
7754
7755     def v1d_POST : BaseSIMDLdStPost<0, 1, opcode, 0b11, asm,
7756                        (outs am_simdnoindex:$wback,
7757                              !cast<RegisterOperand>(veclist # "1d"):$Vt),
7758                        (ins am_simdnoindex:$vaddr,
7759                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7760   }
7761
7762   defm : SIMDLdStAliases<asm, "1d", Count, Offset64, 64>;
7763 }
7764
7765 multiclass BaseSIMDSt1<string Count, string asm, string veclist,
7766                        int Offset128, int Offset64, bits<4> opcode>
7767   : BaseSIMDStN<Count, asm, veclist, Offset128, Offset64, opcode> {
7768
7769   // ST1 instructions have extra "1d" variants.
7770   let hasSideEffects = 0, mayLoad = 0, mayStore = 1 in {
7771     def v1d : BaseSIMDLdSt<0, 0, opcode, 0b11, asm, (outs),
7772                            (ins !cast<RegisterOperand>(veclist # "1d"):$Vt,
7773                                 am_simdnoindex:$vaddr), []>;
7774
7775     def v1d_POST : BaseSIMDLdStPost<0, 0, opcode, 0b11, asm,
7776                        (outs am_simdnoindex:$wback),
7777                        (ins !cast<RegisterOperand>(veclist # "1d"):$Vt,
7778                             am_simdnoindex:$vaddr,
7779                             !cast<RegisterOperand>("GPR64pi" # Offset64):$Xm)>;
7780   }
7781
7782   defm : SIMDLdStAliases<asm, "1d", Count, Offset64, 64>;
7783 }
7784
7785 multiclass SIMDLd1Multiple<string asm> {
7786   defm One   : BaseSIMDLd1<"One", asm, "VecListOne", 16, 8,  0b0111>;
7787   defm Two   : BaseSIMDLd1<"Two", asm, "VecListTwo", 32, 16, 0b1010>;
7788   defm Three : BaseSIMDLd1<"Three", asm, "VecListThree", 48, 24, 0b0110>;
7789   defm Four  : BaseSIMDLd1<"Four", asm, "VecListFour", 64, 32, 0b0010>;
7790 }
7791
7792 multiclass SIMDSt1Multiple<string asm> {
7793   defm One   : BaseSIMDSt1<"One", asm, "VecListOne", 16, 8,  0b0111>;
7794   defm Two   : BaseSIMDSt1<"Two", asm, "VecListTwo", 32, 16, 0b1010>;
7795   defm Three : BaseSIMDSt1<"Three", asm, "VecListThree", 48, 24, 0b0110>;
7796   defm Four  : BaseSIMDSt1<"Four", asm, "VecListFour", 64, 32, 0b0010>;
7797 }
7798
7799 multiclass SIMDLd2Multiple<string asm> {
7800   defm Two : BaseSIMDLdN<"Two", asm, "VecListTwo", 32, 16, 0b1000>;
7801 }
7802
7803 multiclass SIMDSt2Multiple<string asm> {
7804   defm Two : BaseSIMDStN<"Two", asm, "VecListTwo", 32, 16, 0b1000>;
7805 }
7806
7807 multiclass SIMDLd3Multiple<string asm> {
7808   defm Three : BaseSIMDLdN<"Three", asm, "VecListThree", 48, 24, 0b0100>;
7809 }
7810
7811 multiclass SIMDSt3Multiple<string asm> {
7812   defm Three : BaseSIMDStN<"Three", asm, "VecListThree", 48, 24, 0b0100>;
7813 }
7814
7815 multiclass SIMDLd4Multiple<string asm> {
7816   defm Four : BaseSIMDLdN<"Four", asm, "VecListFour", 64, 32, 0b0000>;
7817 }
7818
7819 multiclass SIMDSt4Multiple<string asm> {
7820   defm Four : BaseSIMDStN<"Four", asm, "VecListFour", 64, 32, 0b0000>;
7821 }
7822
7823 //---
7824 // AdvSIMD Load/store single-element
7825 //---
7826
7827 class BaseSIMDLdStSingle<bit L, bit R, bits<3> opcode,
7828                          string asm, string operands, string cst,
7829                          dag oops, dag iops, list<dag> pattern>
7830   : I<oops, iops, asm, operands, cst, pattern> {
7831   bits<5> Vt;
7832   bits<5> vaddr;
7833   let Inst{31} = 0;
7834   let Inst{29-24} = 0b001101;
7835   let Inst{22} = L;
7836   let Inst{21} = R;
7837   let Inst{15-13} = opcode;
7838   let Inst{9-5} = vaddr;
7839   let Inst{4-0} = Vt;
7840 }
7841
7842 class BaseSIMDLdStSingleTied<bit L, bit R, bits<3> opcode,
7843                          string asm, string operands, string cst,
7844                          dag oops, dag iops, list<dag> pattern>
7845   : I<oops, iops, asm, operands, "$Vt = $dst," # cst, pattern> {
7846   bits<5> Vt;
7847   bits<5> vaddr;
7848   let Inst{31} = 0;
7849   let Inst{29-24} = 0b001101;
7850   let Inst{22} = L;
7851   let Inst{21} = R;
7852   let Inst{15-13} = opcode;
7853   let Inst{9-5} = vaddr;
7854   let Inst{4-0} = Vt;
7855 }
7856
7857
7858 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
7859 class BaseSIMDLdR<bit Q, bit R, bits<3> opcode, bit S, bits<2> size, string asm,
7860                   Operand listtype>
7861   : BaseSIMDLdStSingle<1, R, opcode, asm, "\t$Vt, $vaddr", "",
7862                        (outs listtype:$Vt), (ins am_simdnoindex:$vaddr),
7863                        []> {
7864   let Inst{30} = Q;
7865   let Inst{23} = 0;
7866   let Inst{20-16} = 0b00000;
7867   let Inst{12} = S;
7868   let Inst{11-10} = size;
7869 }
7870 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
7871 class BaseSIMDLdRPost<bit Q, bit R, bits<3> opcode, bit S, bits<2> size,
7872                       string asm, Operand listtype, Operand GPR64pi>
7873   : BaseSIMDLdStSingle<1, R, opcode, asm, "\t$Vt, $vaddr, $Xm",
7874                        "$vaddr = $wback",
7875                        (outs am_simdnoindex:$wback, listtype:$Vt),
7876                        (ins am_simdnoindex:$vaddr, GPR64pi:$Xm), []> {
7877   bits<5> Xm;
7878   let Inst{30} = Q;
7879   let Inst{23} = 1;
7880   let Inst{20-16} = Xm;
7881   let Inst{12} = S;
7882   let Inst{11-10} = size;
7883 }
7884
7885 multiclass SIMDLdrAliases<string asm, string layout, string Count,
7886                           int Offset, int Size> {
7887   // E.g. "ld1r { v0.8b }, [x1], #1"
7888   //      "ld1r.8b\t$Vt, $vaddr, #1"
7889   // may get mapped to
7890   //      (LD1Rv8b_POST VecListOne8b:$Vt, am_simdnoindex:$vaddr, XZR)
7891   def : InstAlias<asm # "\t$Vt, $vaddr, #" # Offset,
7892                   (!cast<Instruction>(NAME # "v" # layout # "_POST")
7893                       am_simdnoindex:$vaddr,
7894                       !cast<RegisterOperand>("VecList" # Count # layout):$Vt,
7895                       XZR), 1>;
7896
7897   // E.g. "ld1r.8b { v0 }, [x1], #1"
7898   //      "ld1r.8b\t$Vt, $vaddr, #1"
7899   // may get mapped to
7900   //      (LD1Rv8b_POST VecListOne64:$Vt, am_simdnoindex:$vaddr, XZR)
7901   def : InstAlias<asm # "." # layout # "\t$Vt, $vaddr, #" # Offset,
7902                   (!cast<Instruction>(NAME # "v" # layout # "_POST")
7903                       am_simdnoindex:$vaddr,
7904                       !cast<RegisterOperand>("VecList" # Count # Size):$Vt,
7905                       XZR), 0>;
7906
7907   // E.g. "ld1r.8b { v0 }, [x1]"
7908   //      "ld1r.8b\t$Vt, $vaddr"
7909   // may get mapped to
7910   //      (LD1Rv8b VecListOne64:$Vt, am_simdnoindex:$vaddr)
7911   def : InstAlias<asm # "." # layout # "\t$Vt, $vaddr",
7912                   (!cast<Instruction>(NAME # "v" # layout)
7913                       !cast<RegisterOperand>("VecList" # Count # Size):$Vt,
7914                       am_simdnoindex:$vaddr), 0>;
7915
7916   // E.g. "ld1r.8b { v0 }, [x1], x2"
7917   //      "ld1r.8b\t$Vt, $vaddr, $Xm"
7918   // may get mapped to
7919   //      (LD1Rv8b_POST VecListOne64:$Vt, am_simdnoindex:$vaddr, GPR64pi1:$Xm)
7920   def : InstAlias<asm # "." # layout # "\t$Vt, $vaddr, $Xm",
7921                   (!cast<Instruction>(NAME # "v" # layout # "_POST")
7922                       am_simdnoindex:$vaddr,
7923                       !cast<RegisterOperand>("VecList" # Count # Size):$Vt,
7924                       !cast<RegisterOperand>("GPR64pi" # Offset):$Xm), 0>;
7925 }
7926
7927 multiclass SIMDLdR<bit R, bits<3> opcode, bit S, string asm, string Count,
7928   int Offset1, int Offset2, int Offset4, int Offset8> {
7929   def v8b : BaseSIMDLdR<0, R, opcode, S, 0b00, asm,
7930                         !cast<Operand>("VecList" # Count # "8b")>;
7931   def v16b: BaseSIMDLdR<1, R, opcode, S, 0b00, asm,
7932                         !cast<Operand>("VecList" # Count #"16b")>;
7933   def v4h : BaseSIMDLdR<0, R, opcode, S, 0b01, asm,
7934                         !cast<Operand>("VecList" # Count #"4h")>;
7935   def v8h : BaseSIMDLdR<1, R, opcode, S, 0b01, asm,
7936                         !cast<Operand>("VecList" # Count #"8h")>;
7937   def v2s : BaseSIMDLdR<0, R, opcode, S, 0b10, asm,
7938                         !cast<Operand>("VecList" # Count #"2s")>;
7939   def v4s : BaseSIMDLdR<1, R, opcode, S, 0b10, asm,
7940                         !cast<Operand>("VecList" # Count #"4s")>;
7941   def v1d : BaseSIMDLdR<0, R, opcode, S, 0b11, asm,
7942                         !cast<Operand>("VecList" # Count #"1d")>;
7943   def v2d : BaseSIMDLdR<1, R, opcode, S, 0b11, asm,
7944                         !cast<Operand>("VecList" # Count #"2d")>;
7945
7946   def v8b_POST : BaseSIMDLdRPost<0, R, opcode, S, 0b00, asm,
7947                                  !cast<Operand>("VecList" # Count # "8b"),
7948                                  !cast<Operand>("GPR64pi" # Offset1)>;
7949   def v16b_POST: BaseSIMDLdRPost<1, R, opcode, S, 0b00, asm,
7950                                  !cast<Operand>("VecList" # Count # "16b"),
7951                                  !cast<Operand>("GPR64pi" # Offset1)>;
7952   def v4h_POST : BaseSIMDLdRPost<0, R, opcode, S, 0b01, asm,
7953                                  !cast<Operand>("VecList" # Count # "4h"),
7954                                  !cast<Operand>("GPR64pi" # Offset2)>;
7955   def v8h_POST : BaseSIMDLdRPost<1, R, opcode, S, 0b01, asm,
7956                                  !cast<Operand>("VecList" # Count # "8h"),
7957                                  !cast<Operand>("GPR64pi" # Offset2)>;
7958   def v2s_POST : BaseSIMDLdRPost<0, R, opcode, S, 0b10, asm,
7959                                  !cast<Operand>("VecList" # Count # "2s"),
7960                                  !cast<Operand>("GPR64pi" # Offset4)>;
7961   def v4s_POST : BaseSIMDLdRPost<1, R, opcode, S, 0b10, asm,
7962                                  !cast<Operand>("VecList" # Count # "4s"),
7963                                  !cast<Operand>("GPR64pi" # Offset4)>;
7964   def v1d_POST : BaseSIMDLdRPost<0, R, opcode, S, 0b11, asm,
7965                                  !cast<Operand>("VecList" # Count # "1d"),
7966                                  !cast<Operand>("GPR64pi" # Offset8)>;
7967   def v2d_POST : BaseSIMDLdRPost<1, R, opcode, S, 0b11, asm,
7968                                  !cast<Operand>("VecList" # Count # "2d"),
7969                                  !cast<Operand>("GPR64pi" # Offset8)>;
7970
7971   defm : SIMDLdrAliases<asm, "8b",  Count, Offset1,  64>;
7972   defm : SIMDLdrAliases<asm, "16b", Count, Offset1, 128>;
7973   defm : SIMDLdrAliases<asm, "4h",  Count, Offset2,  64>;
7974   defm : SIMDLdrAliases<asm, "8h",  Count, Offset2, 128>;
7975   defm : SIMDLdrAliases<asm, "2s",  Count, Offset4,  64>;
7976   defm : SIMDLdrAliases<asm, "4s",  Count, Offset4, 128>;
7977   defm : SIMDLdrAliases<asm, "1d",  Count, Offset8,  64>;
7978   defm : SIMDLdrAliases<asm, "2d",  Count, Offset8, 128>;
7979 }
7980
7981 class SIMDLdStSingleB<bit L, bit R, bits<3> opcode, string asm,
7982                       dag oops, dag iops, list<dag> pattern>
7983   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "", oops, iops,
7984                        pattern> {
7985   // idx encoded in Q:S:size fields.
7986   bits<4> idx;
7987   let Inst{30} = idx{3};
7988   let Inst{23} = 0;
7989   let Inst{20-16} = 0b00000;
7990   let Inst{12} = idx{2};
7991   let Inst{11-10} = idx{1-0};
7992 }
7993 class SIMDLdStSingleBTied<bit L, bit R, bits<3> opcode, string asm,
7994                       dag oops, dag iops, list<dag> pattern>
7995   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "",
7996                            oops, iops, pattern> {
7997   // idx encoded in Q:S:size fields.
7998   bits<4> idx;
7999   let Inst{30} = idx{3};
8000   let Inst{23} = 0;
8001   let Inst{20-16} = 0b00000;
8002   let Inst{12} = idx{2};
8003   let Inst{11-10} = idx{1-0};
8004 }
8005 class SIMDLdStSingleBPost<bit L, bit R, bits<3> opcode, string asm,
8006                           dag oops, dag iops>
8007   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8008                        "$vaddr = $wback", oops, iops, []> {
8009   // idx encoded in Q:S:size fields.
8010   bits<4> idx;
8011   bits<5> Xm;
8012   let Inst{30} = idx{3};
8013   let Inst{23} = 1;
8014   let Inst{20-16} = Xm;
8015   let Inst{12} = idx{2};
8016   let Inst{11-10} = idx{1-0};
8017 }
8018 class SIMDLdStSingleBTiedPost<bit L, bit R, bits<3> opcode, string asm,
8019                           dag oops, dag iops>
8020   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8021                            "$vaddr = $wback", oops, iops, []> {
8022   // idx encoded in Q:S:size fields.
8023   bits<4> idx;
8024   bits<5> Xm;
8025   let Inst{30} = idx{3};
8026   let Inst{23} = 1;
8027   let Inst{20-16} = Xm;
8028   let Inst{12} = idx{2};
8029   let Inst{11-10} = idx{1-0};
8030 }
8031
8032 class SIMDLdStSingleH<bit L, bit R, bits<3> opcode, bit size, string asm,
8033                       dag oops, dag iops, list<dag> pattern>
8034   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "", oops, iops,
8035                        pattern> {
8036   // idx encoded in Q:S:size<1> fields.
8037   bits<3> idx;
8038   let Inst{30} = idx{2};
8039   let Inst{23} = 0;
8040   let Inst{20-16} = 0b00000;
8041   let Inst{12} = idx{1};
8042   let Inst{11} = idx{0};
8043   let Inst{10} = size;
8044 }
8045 class SIMDLdStSingleHTied<bit L, bit R, bits<3> opcode, bit size, string asm,
8046                       dag oops, dag iops, list<dag> pattern>
8047   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "",
8048                            oops, iops, pattern> {
8049   // idx encoded in Q:S:size<1> fields.
8050   bits<3> idx;
8051   let Inst{30} = idx{2};
8052   let Inst{23} = 0;
8053   let Inst{20-16} = 0b00000;
8054   let Inst{12} = idx{1};
8055   let Inst{11} = idx{0};
8056   let Inst{10} = size;
8057 }
8058
8059 class SIMDLdStSingleHPost<bit L, bit R, bits<3> opcode, bit size, string asm,
8060                           dag oops, dag iops>
8061   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8062                        "$vaddr = $wback", oops, iops, []> {
8063   // idx encoded in Q:S:size<1> fields.
8064   bits<3> idx;
8065   bits<5> Xm;
8066   let Inst{30} = idx{2};
8067   let Inst{23} = 1;
8068   let Inst{20-16} = Xm;
8069   let Inst{12} = idx{1};
8070   let Inst{11} = idx{0};
8071   let Inst{10} = size;
8072 }
8073 class SIMDLdStSingleHTiedPost<bit L, bit R, bits<3> opcode, bit size, string asm,
8074                           dag oops, dag iops>
8075   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8076                            "$vaddr = $wback", oops, iops, []> {
8077   // idx encoded in Q:S:size<1> fields.
8078   bits<3> idx;
8079   bits<5> Xm;
8080   let Inst{30} = idx{2};
8081   let Inst{23} = 1;
8082   let Inst{20-16} = Xm;
8083   let Inst{12} = idx{1};
8084   let Inst{11} = idx{0};
8085   let Inst{10} = size;
8086 }
8087 class SIMDLdStSingleS<bit L, bit R, bits<3> opcode, bits<2> size, string asm,
8088                       dag oops, dag iops, list<dag> pattern>
8089   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "", oops, iops,
8090                        pattern> {
8091   // idx encoded in Q:S fields.
8092   bits<2> idx;
8093   let Inst{30} = idx{1};
8094   let Inst{23} = 0;
8095   let Inst{20-16} = 0b00000;
8096   let Inst{12} = idx{0};
8097   let Inst{11-10} = size;
8098 }
8099 class SIMDLdStSingleSTied<bit L, bit R, bits<3> opcode, bits<2> size, string asm,
8100                       dag oops, dag iops, list<dag> pattern>
8101   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "",
8102                            oops, iops, pattern> {
8103   // idx encoded in Q:S fields.
8104   bits<2> idx;
8105   let Inst{30} = idx{1};
8106   let Inst{23} = 0;
8107   let Inst{20-16} = 0b00000;
8108   let Inst{12} = idx{0};
8109   let Inst{11-10} = size;
8110 }
8111 class SIMDLdStSingleSPost<bit L, bit R, bits<3> opcode, bits<2> size,
8112                           string asm, dag oops, dag iops>
8113   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8114                        "$vaddr = $wback", oops, iops, []> {
8115   // idx encoded in Q:S fields.
8116   bits<2> idx;
8117   bits<5> Xm;
8118   let Inst{30} = idx{1};
8119   let Inst{23} = 1;
8120   let Inst{20-16} = Xm;
8121   let Inst{12} = idx{0};
8122   let Inst{11-10} = size;
8123 }
8124 class SIMDLdStSingleSTiedPost<bit L, bit R, bits<3> opcode, bits<2> size,
8125                           string asm, dag oops, dag iops>
8126   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8127                            "$vaddr = $wback", oops, iops, []> {
8128   // idx encoded in Q:S fields.
8129   bits<2> idx;
8130   bits<5> Xm;
8131   let Inst{30} = idx{1};
8132   let Inst{23} = 1;
8133   let Inst{20-16} = Xm;
8134   let Inst{12} = idx{0};
8135   let Inst{11-10} = size;
8136 }
8137 class SIMDLdStSingleD<bit L, bit R, bits<3> opcode, bits<2> size, string asm,
8138                       dag oops, dag iops, list<dag> pattern>
8139   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "", oops, iops,
8140                        pattern> {
8141   // idx encoded in Q field.
8142   bits<1> idx;
8143   let Inst{30} = idx;
8144   let Inst{23} = 0;
8145   let Inst{20-16} = 0b00000;
8146   let Inst{12} = 0;
8147   let Inst{11-10} = size;
8148 }
8149 class SIMDLdStSingleDTied<bit L, bit R, bits<3> opcode, bits<2> size, string asm,
8150                       dag oops, dag iops, list<dag> pattern>
8151   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr", "",
8152                            oops, iops, pattern> {
8153   // idx encoded in Q field.
8154   bits<1> idx;
8155   let Inst{30} = idx;
8156   let Inst{23} = 0;
8157   let Inst{20-16} = 0b00000;
8158   let Inst{12} = 0;
8159   let Inst{11-10} = size;
8160 }
8161 class SIMDLdStSingleDPost<bit L, bit R, bits<3> opcode, bits<2> size,
8162                           string asm, dag oops, dag iops>
8163   : BaseSIMDLdStSingle<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8164                        "$vaddr = $wback", oops, iops, []> {
8165   // idx encoded in Q field.
8166   bits<1> idx;
8167   bits<5> Xm;
8168   let Inst{30} = idx;
8169   let Inst{23} = 1;
8170   let Inst{20-16} = Xm;
8171   let Inst{12} = 0;
8172   let Inst{11-10} = size;
8173 }
8174 class SIMDLdStSingleDTiedPost<bit L, bit R, bits<3> opcode, bits<2> size,
8175                           string asm, dag oops, dag iops>
8176   : BaseSIMDLdStSingleTied<L, R, opcode, asm, "\t$Vt$idx, $vaddr, $Xm",
8177                            "$vaddr = $wback", oops, iops, []> {
8178   // idx encoded in Q field.
8179   bits<1> idx;
8180   bits<5> Xm;
8181   let Inst{30} = idx;
8182   let Inst{23} = 1;
8183   let Inst{20-16} = Xm;
8184   let Inst{12} = 0;
8185   let Inst{11-10} = size;
8186 }
8187
8188 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
8189 multiclass SIMDLdSingleBTied<bit R, bits<3> opcode, string asm,
8190                          RegisterOperand listtype,
8191                          RegisterOperand GPR64pi> {
8192   def i8 : SIMDLdStSingleBTied<1, R, opcode, asm,
8193                            (outs listtype:$dst),
8194                            (ins listtype:$Vt, VectorIndexB:$idx,
8195                                 am_simdnoindex:$vaddr), []>;
8196
8197   def i8_POST : SIMDLdStSingleBTiedPost<1, R, opcode, asm,
8198                             (outs am_simdnoindex:$wback, listtype:$dst),
8199                             (ins listtype:$Vt, VectorIndexB:$idx,
8200                                  am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8201 }
8202 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
8203 multiclass SIMDLdSingleHTied<bit R, bits<3> opcode, bit size, string asm,
8204                          RegisterOperand listtype,
8205                          RegisterOperand GPR64pi> {
8206   def i16 : SIMDLdStSingleHTied<1, R, opcode, size, asm,
8207                             (outs listtype:$dst),
8208                             (ins listtype:$Vt, VectorIndexH:$idx,
8209                                  am_simdnoindex:$vaddr), []>;
8210
8211   def i16_POST : SIMDLdStSingleHTiedPost<1, R, opcode, size, asm,
8212                             (outs am_simdnoindex:$wback, listtype:$dst),
8213                             (ins listtype:$Vt, VectorIndexH:$idx,
8214                                  am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8215 }
8216 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
8217 multiclass SIMDLdSingleSTied<bit R, bits<3> opcode, bits<2> size,string asm,
8218                          RegisterOperand listtype,
8219                          RegisterOperand GPR64pi> {
8220   def i32 : SIMDLdStSingleSTied<1, R, opcode, size, asm,
8221                             (outs listtype:$dst),
8222                             (ins listtype:$Vt, VectorIndexS:$idx,
8223                                  am_simdnoindex:$vaddr), []>;
8224
8225   def i32_POST : SIMDLdStSingleSTiedPost<1, R, opcode, size, asm,
8226                             (outs am_simdnoindex:$wback, listtype:$dst),
8227                             (ins listtype:$Vt, VectorIndexS:$idx,
8228                                  am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8229 }
8230 let mayLoad = 1, mayStore = 0, hasSideEffects = 0 in
8231 multiclass SIMDLdSingleDTied<bit R, bits<3> opcode, bits<2> size, string asm,
8232                          RegisterOperand listtype, RegisterOperand GPR64pi> {
8233   def i64 : SIMDLdStSingleDTied<1, R, opcode, size, asm,
8234                             (outs listtype:$dst),
8235                             (ins listtype:$Vt, VectorIndexD:$idx,
8236                                  am_simdnoindex:$vaddr), []>;
8237
8238   def i64_POST : SIMDLdStSingleDTiedPost<1, R, opcode, size, asm,
8239                             (outs am_simdnoindex:$wback, listtype:$dst),
8240                             (ins listtype:$Vt, VectorIndexD:$idx,
8241                                  am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8242 }
8243 let mayLoad = 0, mayStore = 1, hasSideEffects = 0 in
8244 multiclass SIMDStSingleB<bit R, bits<3> opcode, string asm,
8245                          RegisterOperand listtype, RegisterOperand GPR64pi> {
8246   def i8 : SIMDLdStSingleB<0, R, opcode, asm,
8247                            (outs), (ins listtype:$Vt, VectorIndexB:$idx,
8248                                         am_simdnoindex:$vaddr), []>;
8249
8250   def i8_POST : SIMDLdStSingleBPost<0, R, opcode, asm,
8251                                     (outs am_simdnoindex:$wback),
8252                                     (ins listtype:$Vt, VectorIndexB:$idx,
8253                                          am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8254 }
8255 let mayLoad = 0, mayStore = 1, hasSideEffects = 0 in
8256 multiclass SIMDStSingleH<bit R, bits<3> opcode, bit size, string asm,
8257                          RegisterOperand listtype, RegisterOperand GPR64pi> {
8258   def i16 : SIMDLdStSingleH<0, R, opcode, size, asm,
8259                             (outs), (ins listtype:$Vt, VectorIndexH:$idx,
8260                                          am_simdnoindex:$vaddr), []>;
8261
8262   def i16_POST : SIMDLdStSingleHPost<0, R, opcode, size, asm,
8263                             (outs am_simdnoindex:$wback),
8264                             (ins listtype:$Vt, VectorIndexH:$idx,
8265                                  am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8266 }
8267 let mayLoad = 0, mayStore = 1, hasSideEffects = 0 in
8268 multiclass SIMDStSingleS<bit R, bits<3> opcode, bits<2> size,string asm,
8269                          RegisterOperand listtype, RegisterOperand GPR64pi> {
8270   def i32 : SIMDLdStSingleS<0, R, opcode, size, asm,
8271                             (outs), (ins listtype:$Vt, VectorIndexS:$idx,
8272                                          am_simdnoindex:$vaddr), []>;
8273
8274   def i32_POST : SIMDLdStSingleSPost<0, R, opcode, size, asm,
8275                             (outs am_simdnoindex:$wback),
8276                             (ins listtype:$Vt, VectorIndexS:$idx,
8277                                  am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8278 }
8279 let mayLoad = 0, mayStore = 1, hasSideEffects = 0 in
8280 multiclass SIMDStSingleD<bit R, bits<3> opcode, bits<2> size, string asm,
8281                          RegisterOperand listtype, RegisterOperand GPR64pi> {
8282   def i64 : SIMDLdStSingleD<0, R, opcode, size, asm,
8283                             (outs), (ins listtype:$Vt, VectorIndexD:$idx,
8284                                          am_simdnoindex:$vaddr), []>;
8285
8286   def i64_POST : SIMDLdStSingleDPost<0, R, opcode, size, asm,
8287                             (outs am_simdnoindex:$wback),
8288                             (ins listtype:$Vt, VectorIndexD:$idx,
8289                                  am_simdnoindex:$vaddr, GPR64pi:$Xm)>;
8290 }
8291
8292 multiclass SIMDLdStSingleAliases<string asm, string layout, string Type,
8293                                  string Count, int Offset, Operand idxtype> {
8294   // E.g. "ld1 { v0.8b }[0], [x1], #1"
8295   //      "ld1\t$Vt, $vaddr, #1"
8296   // may get mapped to
8297   //      (LD1Rv8b_POST VecListOne8b:$Vt, am_simdnoindex:$vaddr, XZR)
8298   def : InstAlias<asm # "\t$Vt$idx, $vaddr, #" # Offset,
8299                   (!cast<Instruction>(NAME # Type  # "_POST")
8300                       am_simdnoindex:$vaddr,
8301                       !cast<RegisterOperand>("VecList" # Count # layout):$Vt,
8302                       idxtype:$idx, XZR), 1>;
8303
8304   // E.g. "ld1.8b { v0 }[0], [x1], #1"
8305   //      "ld1.8b\t$Vt, $vaddr, #1"
8306   // may get mapped to
8307   //      (LD1Rv8b_POST VecListOne64:$Vt, am_simdnoindex:$vaddr, XZR)
8308   def : InstAlias<asm # "." # layout # "\t$Vt$idx, $vaddr, #" # Offset,
8309                   (!cast<Instruction>(NAME # Type # "_POST")
8310                       am_simdnoindex:$vaddr,
8311                       !cast<RegisterOperand>("VecList" # Count # "128"):$Vt,
8312                       idxtype:$idx, XZR), 0>;
8313
8314   // E.g. "ld1.8b { v0 }[0], [x1]"
8315   //      "ld1.8b\t$Vt, $vaddr"
8316   // may get mapped to
8317   //      (LD1Rv8b VecListOne64:$Vt, am_simdnoindex:$vaddr)
8318   def : InstAlias<asm # "." # layout # "\t$Vt$idx, $vaddr",
8319                       (!cast<Instruction>(NAME # Type)
8320                          !cast<RegisterOperand>("VecList" # Count # "128"):$Vt,
8321                          idxtype:$idx, am_simdnoindex:$vaddr), 0>;
8322
8323   // E.g. "ld1.8b { v0 }[0], [x1], x2"
8324   //      "ld1.8b\t$Vt, $vaddr, $Xm"
8325   // may get mapped to
8326   //      (LD1Rv8b_POST VecListOne64:$Vt, am_simdnoindex:$vaddr, GPR64pi1:$Xm)
8327   def : InstAlias<asm # "." # layout # "\t$Vt$idx, $vaddr, $Xm",
8328                       (!cast<Instruction>(NAME # Type # "_POST")
8329                          am_simdnoindex:$vaddr,
8330                          !cast<RegisterOperand>("VecList" # Count # "128"):$Vt,
8331                          idxtype:$idx,
8332                          !cast<RegisterOperand>("GPR64pi" # Offset):$Xm), 0>;
8333 }
8334
8335 multiclass SIMDLdSt1SingleAliases<string asm> {
8336   defm : SIMDLdStSingleAliases<asm, "b", "i8",  "One", 1, VectorIndexB>;
8337   defm : SIMDLdStSingleAliases<asm, "h", "i16", "One", 2, VectorIndexH>;
8338   defm : SIMDLdStSingleAliases<asm, "s", "i32", "One", 4, VectorIndexS>;
8339   defm : SIMDLdStSingleAliases<asm, "d", "i64", "One", 8, VectorIndexD>;
8340 }
8341
8342 multiclass SIMDLdSt2SingleAliases<string asm> {
8343   defm : SIMDLdStSingleAliases<asm, "b", "i8",  "Two", 2,  VectorIndexB>;
8344   defm : SIMDLdStSingleAliases<asm, "h", "i16", "Two", 4,  VectorIndexH>;
8345   defm : SIMDLdStSingleAliases<asm, "s", "i32", "Two", 8,  VectorIndexS>;
8346   defm : SIMDLdStSingleAliases<asm, "d", "i64", "Two", 16, VectorIndexD>;
8347 }
8348
8349 multiclass SIMDLdSt3SingleAliases<string asm> {
8350   defm : SIMDLdStSingleAliases<asm, "b", "i8",  "Three", 3,  VectorIndexB>;
8351   defm : SIMDLdStSingleAliases<asm, "h", "i16", "Three", 6,  VectorIndexH>;
8352   defm : SIMDLdStSingleAliases<asm, "s", "i32", "Three", 12, VectorIndexS>;
8353   defm : SIMDLdStSingleAliases<asm, "d", "i64", "Three", 24, VectorIndexD>;
8354 }
8355
8356 multiclass SIMDLdSt4SingleAliases<string asm> {
8357   defm : SIMDLdStSingleAliases<asm, "b", "i8",  "Four", 4,  VectorIndexB>;
8358   defm : SIMDLdStSingleAliases<asm, "h", "i16", "Four", 8,  VectorIndexH>;
8359   defm : SIMDLdStSingleAliases<asm, "s", "i32", "Four", 16, VectorIndexS>;
8360   defm : SIMDLdStSingleAliases<asm, "d", "i64", "Four", 32, VectorIndexD>;
8361 }
8362 } // end of 'let Predicates = [HasNEON]'
8363
8364 //----------------------------------------------------------------------------
8365 // Crypto extensions
8366 //----------------------------------------------------------------------------
8367
8368 let Predicates = [HasCrypto] in {
8369 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
8370 class AESBase<bits<4> opc, string asm, dag outs, dag ins, string cstr,
8371               list<dag> pat>
8372   : I<outs, ins, asm, "{\t$Rd.16b, $Rn.16b|.16b\t$Rd, $Rn}", cstr, pat>,
8373     Sched<[WriteV]>{
8374   bits<5> Rd;
8375   bits<5> Rn;
8376   let Inst{31-16} = 0b0100111000101000;
8377   let Inst{15-12} = opc;
8378   let Inst{11-10} = 0b10;
8379   let Inst{9-5}   = Rn;
8380   let Inst{4-0}   = Rd;
8381 }
8382
8383 class AESInst<bits<4> opc, string asm, Intrinsic OpNode>
8384   : AESBase<opc, asm, (outs V128:$Rd), (ins V128:$Rn), "",
8385             [(set (v16i8 V128:$Rd), (OpNode (v16i8 V128:$Rn)))]>;
8386
8387 class AESTiedInst<bits<4> opc, string asm, Intrinsic OpNode>
8388   : AESBase<opc, asm, (outs V128:$dst), (ins V128:$Rd, V128:$Rn),
8389             "$Rd = $dst",
8390             [(set (v16i8 V128:$dst),
8391                   (OpNode (v16i8 V128:$Rd), (v16i8 V128:$Rn)))]>;
8392
8393 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
8394 class SHA3OpTiedInst<bits<3> opc, string asm, string dst_lhs_kind,
8395                      dag oops, dag iops, list<dag> pat>
8396   : I<oops, iops, asm,
8397       "{\t$Rd" # dst_lhs_kind # ", $Rn" # dst_lhs_kind # ", $Rm.4s" #
8398       "|.4s\t$Rd, $Rn, $Rm}", "$Rd = $dst", pat>,
8399     Sched<[WriteV]>{
8400   bits<5> Rd;
8401   bits<5> Rn;
8402   bits<5> Rm;
8403   let Inst{31-21} = 0b01011110000;
8404   let Inst{20-16} = Rm;
8405   let Inst{15}    = 0;
8406   let Inst{14-12} = opc;
8407   let Inst{11-10} = 0b00;
8408   let Inst{9-5}   = Rn;
8409   let Inst{4-0}   = Rd;
8410 }
8411
8412 class SHATiedInstQSV<bits<3> opc, string asm, Intrinsic OpNode>
8413   : SHA3OpTiedInst<opc, asm, "", (outs FPR128:$dst),
8414                    (ins FPR128:$Rd, FPR32:$Rn, V128:$Rm),
8415                    [(set (v4i32 FPR128:$dst),
8416                          (OpNode (v4i32 FPR128:$Rd), (i32 FPR32:$Rn),
8417                                  (v4i32 V128:$Rm)))]>;
8418
8419 class SHATiedInstVVV<bits<3> opc, string asm, Intrinsic OpNode>
8420   : SHA3OpTiedInst<opc, asm, ".4s", (outs V128:$dst),
8421                    (ins V128:$Rd, V128:$Rn, V128:$Rm),
8422                    [(set (v4i32 V128:$dst),
8423                          (OpNode (v4i32 V128:$Rd), (v4i32 V128:$Rn),
8424                                  (v4i32 V128:$Rm)))]>;
8425
8426 class SHATiedInstQQV<bits<3> opc, string asm, Intrinsic OpNode>
8427   : SHA3OpTiedInst<opc, asm, "", (outs FPR128:$dst),
8428                    (ins FPR128:$Rd, FPR128:$Rn, V128:$Rm),
8429                    [(set (v4i32 FPR128:$dst),
8430                          (OpNode (v4i32 FPR128:$Rd), (v4i32 FPR128:$Rn),
8431                                  (v4i32 V128:$Rm)))]>;
8432
8433 let mayLoad = 0, mayStore = 0, hasSideEffects = 0 in
8434 class SHA2OpInst<bits<4> opc, string asm, string kind,
8435                  string cstr, dag oops, dag iops,
8436                  list<dag> pat>
8437   : I<oops, iops, asm, "{\t$Rd" # kind # ", $Rn" # kind #
8438                        "|" # kind # "\t$Rd, $Rn}", cstr, pat>,
8439     Sched<[WriteV]>{
8440   bits<5> Rd;
8441   bits<5> Rn;
8442   let Inst{31-16} = 0b0101111000101000;
8443   let Inst{15-12} = opc;
8444   let Inst{11-10} = 0b10;
8445   let Inst{9-5}   = Rn;
8446   let Inst{4-0}   = Rd;
8447 }
8448
8449 class SHATiedInstVV<bits<4> opc, string asm, Intrinsic OpNode>
8450   : SHA2OpInst<opc, asm, ".4s", "$Rd = $dst", (outs V128:$dst),
8451                (ins V128:$Rd, V128:$Rn),
8452                [(set (v4i32 V128:$dst),
8453                      (OpNode (v4i32 V128:$Rd), (v4i32 V128:$Rn)))]>;
8454
8455 class SHAInstSS<bits<4> opc, string asm, Intrinsic OpNode>
8456   : SHA2OpInst<opc, asm, "", "", (outs FPR32:$Rd), (ins FPR32:$Rn),
8457                [(set (i32 FPR32:$Rd), (OpNode (i32 FPR32:$Rn)))]>;
8458 } // end of 'let Predicates = [HasCrypto]'
8459
8460 // Allow the size specifier tokens to be upper case, not just lower.
8461 def : TokenAlias<".8B", ".8b">;
8462 def : TokenAlias<".4H", ".4h">;
8463 def : TokenAlias<".2S", ".2s">;
8464 def : TokenAlias<".1D", ".1d">;
8465 def : TokenAlias<".16B", ".16b">;
8466 def : TokenAlias<".8H", ".8h">;
8467 def : TokenAlias<".4S", ".4s">;
8468 def : TokenAlias<".2D", ".2d">;
8469 def : TokenAlias<".1Q", ".1q">;
8470 def : TokenAlias<".B", ".b">;
8471 def : TokenAlias<".H", ".h">;
8472 def : TokenAlias<".S", ".s">;
8473 def : TokenAlias<".D", ".d">;
8474 def : TokenAlias<".Q", ".q">;