ARM VTBL (one register) assembly parsing and encoding.

[oota-llvm.git] / lib / Target / ARM / ARMInstrNEON.td
diff --git a/lib/Target/ARM/ARMInstrNEON.td b/lib/Target/ARM/ARMInstrNEON.td

index a80df2b410043fd1f483edc46473062b48da42bb..412b3ca5f93d86d38d852268cf70acc282e5968f 100644 (file)
--- a/lib/Target/ARM/ARMInstrNEON.td
+++ b/lib/Target/ARM/ARMInstrNEON.td
@@ -11,6 +11,73 @@
  //
  //===----------------------------------------------------------------------===//
  
+
+//===----------------------------------------------------------------------===//
+// NEON-specific Operands.
+//===----------------------------------------------------------------------===//
+def nModImm : Operand<i32> {
+  let PrintMethod = "printNEONModImmOperand";
+}
+
+def nImmSplatI8AsmOperand : AsmOperandClass { let Name = "NEONi8splat"; }
+def nImmSplatI8 : Operand<i32> {
+  let PrintMethod = "printNEONModImmOperand";
+  let ParserMatchClass = nImmSplatI8AsmOperand;
+}
+def nImmSplatI16AsmOperand : AsmOperandClass { let Name = "NEONi16splat"; }
+def nImmSplatI16 : Operand<i32> {
+  let PrintMethod = "printNEONModImmOperand";
+  let ParserMatchClass = nImmSplatI16AsmOperand;
+}
+def nImmSplatI32AsmOperand : AsmOperandClass { let Name = "NEONi32splat"; }
+def nImmSplatI32 : Operand<i32> {
+  let PrintMethod = "printNEONModImmOperand";
+  let ParserMatchClass = nImmSplatI32AsmOperand;
+}
+def nImmVMOVI32AsmOperand : AsmOperandClass { let Name = "NEONi32vmov"; }
+def nImmVMOVI32 : Operand<i32> {
+  let PrintMethod = "printNEONModImmOperand";
+  let ParserMatchClass = nImmVMOVI32AsmOperand;
+}
+def nImmSplatI64AsmOperand : AsmOperandClass { let Name = "NEONi64splat"; }
+def nImmSplatI64 : Operand<i32> {
+  let PrintMethod = "printNEONModImmOperand";
+  let ParserMatchClass = nImmSplatI64AsmOperand;
+}
+
+def VectorIndex8Operand  : AsmOperandClass { let Name = "VectorIndex8"; }
+def VectorIndex16Operand : AsmOperandClass { let Name = "VectorIndex16"; }
+def VectorIndex32Operand : AsmOperandClass { let Name = "VectorIndex32"; }
+def VectorIndex8 : Operand<i32>, ImmLeaf<i32, [{
+  return ((uint64_t)Imm) < 8;
+}]> {
+  let ParserMatchClass = VectorIndex8Operand;
+  let PrintMethod = "printVectorIndex";
+  let MIOperandInfo = (ops i32imm);
+}
+def VectorIndex16 : Operand<i32>, ImmLeaf<i32, [{
+  return ((uint64_t)Imm) < 4;
+}]> {
+  let ParserMatchClass = VectorIndex16Operand;
+  let PrintMethod = "printVectorIndex";
+  let MIOperandInfo = (ops i32imm);
+}
+def VectorIndex32 : Operand<i32>, ImmLeaf<i32, [{
+  return ((uint64_t)Imm) < 2;
+}]> {
+  let ParserMatchClass = VectorIndex32Operand;
+  let PrintMethod = "printVectorIndex";
+  let MIOperandInfo = (ops i32imm);
+}
+
+def VecListOneDAsmOperand : AsmOperandClass {
+  let Name = "VecListOneD";
+  let ParserMethod = "parseVectorList";
+}
+def VecListOneD : RegisterOperand<DPR, "printVectorListOne"> {
+  let ParserMatchClass = VecListOneDAsmOperand;
+}
+
  //===----------------------------------------------------------------------===//
  // NEON-specific DAG Nodes.
  //===----------------------------------------------------------------------===//
@@ -80,6 +147,12 @@ def SDTARMVORRIMM : SDTypeProfile<1, 2, [SDTCisVec<0>, SDTCisSameAs<0, 1>,
  def NEONvorrImm   : SDNode<"ARMISD::VORRIMM", SDTARMVORRIMM>;
  def NEONvbicImm   : SDNode<"ARMISD::VBICIMM", SDTARMVORRIMM>;
  
+def NEONvbsl      : SDNode<"ARMISD::VBSL",
+                           SDTypeProfile<1, 3, [SDTCisVec<0>,
+                                                SDTCisSameAs<0, 1>,
+                                                SDTCisSameAs<0, 2>,
+                                                SDTCisSameAs<0, 3>]>>;
+
  def NEONvdup      : SDNode<"ARMISD::VDUP", SDTypeProfile<1, 1, [SDTCisVec<0>]>>;
  
  // VDUPLANE can produce a quad-register result from a double-register source,
@@ -128,14 +201,6 @@ def NEONimmAllOnesV: PatLeaf<(NEONvmovImm (i32 timm)), [{
    return (EltBits == 8 && EltVal == 0xff);
  }]>;
  
-//===----------------------------------------------------------------------===//
-// NEON operand definitions
-//===----------------------------------------------------------------------===//
-
-def nModImm : Operand<i32> {
-  let PrintMethod = "printNEONModImmOperand";
-}
-
  //===----------------------------------------------------------------------===//
  // NEON load / store instructions
  //===----------------------------------------------------------------------===//
@@ -146,10 +211,6 @@ def VLDMQIA
    : PseudoVFPLdStM<(outs QPR:$dst), (ins GPR:$Rn),
                      IIC_fpLoad_m, "",
                     [(set QPR:$dst, (v2f64 (load GPR:$Rn)))]>;
-def VLDMQDB
-  : PseudoVFPLdStM<(outs QPR:$dst), (ins GPR:$Rn),
-                    IIC_fpLoad_m, "",
-                   [(set QPR:$dst, (v2f64 (load GPR:$Rn)))]>;
  
  // Use VSTM to store a Q register as a D register pair.
  // This is a pseudo instruction that is expanded to VSTMD after reg alloc.
@@ -157,10 +218,6 @@ def VSTMQIA
    : PseudoVFPLdStM<(outs), (ins QPR:$src, GPR:$Rn),
                      IIC_fpStore_m, "",
                     [(store (v2f64 QPR:$src), GPR:$Rn)]>;
-def VSTMQDB
-  : PseudoVFPLdStM<(outs), (ins QPR:$src, GPR:$Rn),
-                    IIC_fpStore_m, "",
-                   [(store (v2f64 QPR:$src), GPR:$Rn)]>;
  
  // Classes for VLD* pseudo-instructions with multi-register operands.
  // These are expanded to real instructions after register allocation.
@@ -177,7 +234,8 @@ class VLDQQWBPseudo<InstrItinClass itin>
                  (ins addrmode6:$addr, am6offset:$offset), itin,
                  "$addr.addr = $wb">;
  class VLDQQQQPseudo<InstrItinClass itin>
-  : PseudoNLdSt<(outs QQQQPR:$dst), (ins addrmode6:$addr, QQQQPR:$src), itin,"">;
+  : PseudoNLdSt<(outs QQQQPR:$dst), (ins addrmode6:$addr, QQQQPR:$src),itin,
+                "$src = $dst">;
  class VLDQQQQWBPseudo<InstrItinClass itin>
    : PseudoNLdSt<(outs QQQQPR:$dst, GPR:$wb),
                  (ins addrmode6:$addr, am6offset:$offset, QQQQPR:$src), itin,
@@ -192,6 +250,7 @@ class VLD1D<bits<4> op7_4, string Dt>
            "vld1", Dt, "\\{$Vd\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  class VLD1Q<bits<4> op7_4, string Dt>
    : NLdSt<0,0b10,0b1010,op7_4, (outs DPR:$Vd, DPR:$dst2),
@@ -199,6 +258,7 @@ class VLD1Q<bits<4> op7_4, string Dt>
            "vld1", Dt, "\\{$Vd, $dst2\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def  VLD1d8   : VLD1D<{0,0,0,?}, "8">;
@@ -223,6 +283,7 @@ class VLD1DWB<bits<4> op7_4, string Dt>
            "vld1", Dt, "\\{$Vd\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  class VLD1QWB<bits<4> op7_4, string Dt>
    : NLdSt<0,0b10,0b1010,op7_4, (outs DPR:$Vd, DPR:$dst2, GPR:$wb),
@@ -230,6 +291,7 @@ class VLD1QWB<bits<4> op7_4, string Dt>
            "vld1", Dt, "\\{$Vd, $dst2\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def VLD1d8_UPD  : VLD1DWB<{0,0,0,?}, "8">;
@@ -254,12 +316,14 @@ class VLD1D3<bits<4> op7_4, string Dt>
            "\\{$Vd, $dst2, $dst3\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  class VLD1D3WB<bits<4> op7_4, string Dt>
    : NLdSt<0,0b10,0b0110,op7_4, (outs DPR:$Vd, DPR:$dst2, DPR:$dst3, GPR:$wb),
            (ins addrmode6:$Rn, am6offset:$Rm), IIC_VLD1x3u, "vld1", Dt,
            "\\{$Vd, $dst2, $dst3\\}, $Rn$Rm", "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def VLD1d8T      : VLD1D3<{0,0,0,?}, "8">;
@@ -282,6 +346,7 @@ class VLD1D4<bits<4> op7_4, string Dt>
            "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  class VLD1D4WB<bits<4> op7_4, string Dt>
    : NLdSt<0,0b10,0b0010,op7_4,
@@ -290,6 +355,7 @@ class VLD1D4WB<bits<4> op7_4, string Dt>
            "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn$Rm", "$Rn.addr = $wb",
            []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def VLD1d8Q      : VLD1D4<{0,0,?,?}, "8">;
@@ -312,6 +378,7 @@ class VLD2D<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vld2", Dt, "\\{$Vd, $dst2\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  class VLD2Q<bits<4> op7_4, string Dt>
    : NLdSt<0, 0b10, 0b0011, op7_4,
@@ -320,6 +387,7 @@ class VLD2Q<bits<4> op7_4, string Dt>
            "vld2", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def  VLD2d8   : VLD2D<0b1000, {0,0,?,?}, "8">;
@@ -345,6 +413,7 @@ class VLD2DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vld2", Dt, "\\{$Vd, $dst2\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  class VLD2QWB<bits<4> op7_4, string Dt>
    : NLdSt<0, 0b10, 0b0011, op7_4,
@@ -353,6 +422,7 @@ class VLD2QWB<bits<4> op7_4, string Dt>
            "vld2", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def VLD2d8_UPD  : VLD2DWB<0b1000, {0,0,?,?}, "8">;
@@ -386,6 +456,7 @@ class VLD3D<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vld3", Dt, "\\{$Vd, $dst2, $dst3\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def  VLD3d8   : VLD3D<0b0100, {0,0,0,?}, "8">;
@@ -404,6 +475,7 @@ class VLD3DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vld3", Dt, "\\{$Vd, $dst2, $dst3\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def VLD3d8_UPD  : VLD3DWB<0b0100, {0,0,0,?}, "8">;
@@ -443,6 +515,7 @@ class VLD4D<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vld4", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def  VLD4d8   : VLD4D<0b0000, {0,0,?,?}, "8">;
@@ -461,6 +534,7 @@ class VLD4DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vld4", Dt, "\\{$Vd, $dst2, $dst3, $dst4\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVLDInstruction";
  }
  
  def VLD4d8_UPD  : VLD4DWB<0b0000, {0,0,?,?}, "8">;
@@ -532,6 +606,19 @@ class VLD1LN<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
                                           (i32 (LoadOp addrmode6:$Rn)),
                                           imm:$lane))]> {
    let Rm = 0b1111;
+  let DecoderMethod = "DecodeVLD1LN";
+}
+class VLD1LN32<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
+             PatFrag LoadOp>
+  : NLdStLn<1, 0b10, op11_8, op7_4, (outs DPR:$Vd),
+          (ins addrmode6oneL32:$Rn, DPR:$src, nohash_imm:$lane),
+          IIC_VLD1ln, "vld1", Dt, "\\{$Vd[$lane]\\}, $Rn",
+          "$src = $Vd",
+          [(set DPR:$Vd, (vector_insert (Ty DPR:$src),
+                                         (i32 (LoadOp addrmode6oneL32:$Rn)),
+                                         imm:$lane))]> {
+  let Rm = 0b1111;
+  let DecoderMethod = "DecodeVLD1LN";
  }
  class VLD1QLNPseudo<ValueType Ty, PatFrag LoadOp> : VLDQLNPseudo<IIC_VLD1ln> {
    let Pattern = [(set QPR:$dst, (vector_insert (Ty QPR:$src),
@@ -546,7 +633,7 @@ def VLD1LNd16 : VLD1LN<0b0100, {?,?,0,?}, "16", v4i16, extloadi16> {
    let Inst{7-6} = lane{1-0};
    let Inst{4}   = Rn{4};
  }
-def VLD1LNd32 : VLD1LN<0b1000, {?,0,?,?}, "32", v2i32, load> {
+def VLD1LNd32 : VLD1LN32<0b1000, {?,0,?,?}, "32", v2i32, load> {
    let Inst{7} = lane{0};
    let Inst{5} = Rn{4};
    let Inst{4} = Rn{4};
@@ -571,7 +658,9 @@ class VLD1LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            (ins addrmode6:$Rn, am6offset:$Rm,
             DPR:$src, nohash_imm:$lane), IIC_VLD1lnu, "vld1", Dt,
            "\\{$Vd[$lane]\\}, $Rn$Rm",
-          "$src = $Vd, $Rn.addr = $wb", []>;
+          "$src = $Vd, $Rn.addr = $wb", []> {
+  let DecoderMethod = "DecodeVLD1LN";
+}
  
  def VLD1LNd8_UPD  : VLD1LNWB<0b0000, {?,?,?,0}, "8"> {
    let Inst{7-5} = lane{2-0};
@@ -598,6 +687,7 @@ class VLD2LN<bits<4> op11_8, bits<4> op7_4, string Dt>
            "$src1 = $Vd, $src2 = $dst2", []> {
    let Rm = 0b1111;
    let Inst{4}   = Rn{4};
+  let DecoderMethod = "DecodeVLD2LN";
  }
  
  def VLD2LNd8  : VLD2LN<0b0001, {?,?,?,?}, "8"> {
@@ -633,6 +723,7 @@ class VLD2LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            "\\{$Vd[$lane], $dst2[$lane]\\}, $Rn$Rm",
            "$src1 = $Vd, $src2 = $dst2, $Rn.addr = $wb", []> {
    let Inst{4}   = Rn{4};
+  let DecoderMethod = "DecodeVLD2LN";
  }
  
  def VLD2LNd8_UPD  : VLD2LNWB<0b0001, {?,?,?,?}, "8"> {
@@ -667,6 +758,7 @@ class VLD3LN<bits<4> op11_8, bits<4> op7_4, string Dt>
            "\\{$Vd[$lane], $dst2[$lane], $dst3[$lane]\\}, $Rn",
            "$src1 = $Vd, $src2 = $dst2, $src3 = $dst3", []> {
    let Rm = 0b1111;
+  let DecoderMethod = "DecodeVLD3LN";
  }
  
  def VLD3LNd8  : VLD3LN<0b0010, {?,?,?,0}, "8"> {
@@ -703,7 +795,9 @@ class VLD3LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            IIC_VLD3lnu, "vld3", Dt,
            "\\{$Vd[$lane], $dst2[$lane], $dst3[$lane]\\}, $Rn$Rm",
            "$src1 = $Vd, $src2 = $dst2, $src3 = $dst3, $Rn.addr = $wb",
-          []>;
+          []> {
+  let DecoderMethod = "DecodeVLD3LN";
+}
  
  def VLD3LNd8_UPD  : VLD3LNWB<0b0010, {?,?,?,0}, "8"> {
    let Inst{7-5} = lane{2-0};
@@ -739,6 +833,7 @@ class VLD4LN<bits<4> op11_8, bits<4> op7_4, string Dt>
            "$src1 = $Vd, $src2 = $dst2, $src3 = $dst3, $src4 = $dst4", []> {
    let Rm = 0b1111;
    let Inst{4}   = Rn{4};
+  let DecoderMethod = "DecodeVLD4LN";
  }
  
  def VLD4LNd8  : VLD4LN<0b0011, {?,?,?,?}, "8"> {
@@ -779,6 +874,7 @@ class VLD4LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
  "$src1 = $Vd, $src2 = $dst2, $src3 = $dst3, $src4 = $dst4, $Rn.addr = $wb",
            []> {
    let Inst{4}   = Rn{4};
+  let DecoderMethod = "DecodeVLD4LN"  ;
  }
  
  def VLD4LNd8_UPD  : VLD4LNWB<0b0011, {?,?,?,?}, "8"> {
@@ -816,6 +912,7 @@ class VLD1DUP<bits<4> op7_4, string Dt, ValueType Ty, PatFrag LoadOp>
            [(set DPR:$Vd, (Ty (NEONvdup (i32 (LoadOp addrmode6dup:$Rn)))))]> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD1DupInstruction";
  }
  class VLD1QDUPPseudo<ValueType Ty, PatFrag LoadOp> : VLDQPseudo<IIC_VLD1dup> {
    let Pattern = [(set QPR:$dst,
@@ -843,6 +940,7 @@ class VLD1QDUP<bits<4> op7_4, string Dt>
            "vld1", Dt, "\\{$Vd[], $dst2[]\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD1DupInstruction";
  }
  
  def VLD1DUPq8  : VLD1QDUP<{0,0,1,0}, "8">;
@@ -855,12 +953,14 @@ class VLD1DUPWB<bits<4> op7_4, string Dt>
            (ins addrmode6dup:$Rn, am6offset:$Rm), IIC_VLD1dupu,
            "vld1", Dt, "\\{$Vd[]\\}, $Rn$Rm", "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD1DupInstruction";
  }
  class VLD1QDUPWB<bits<4> op7_4, string Dt>
    : NLdSt<1, 0b10, 0b1100, op7_4, (outs DPR:$Vd, DPR:$dst2, GPR:$wb),
            (ins addrmode6dup:$Rn, am6offset:$Rm), IIC_VLD1dupu,
            "vld1", Dt, "\\{$Vd[], $dst2[]\\}, $Rn$Rm", "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD1DupInstruction";
  }
  
  def VLD1DUPd8_UPD  : VLD1DUPWB<{0,0,0,0}, "8">;
@@ -882,6 +982,7 @@ class VLD2DUP<bits<4> op7_4, string Dt>
            "vld2", Dt, "\\{$Vd[], $dst2[]\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD2DupInstruction";
  }
  
  def VLD2DUPd8  : VLD2DUP<{0,0,0,?}, "8">;
@@ -903,6 +1004,7 @@ class VLD2DUPWB<bits<4> op7_4, string Dt>
            (ins addrmode6dup:$Rn, am6offset:$Rm), IIC_VLD2dupu,
            "vld2", Dt, "\\{$Vd[], $dst2[]\\}, $Rn$Rm", "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD2DupInstruction";
  }
  
  def VLD2DUPd8_UPD  : VLD2DUPWB<{0,0,0,0}, "8">;
@@ -923,7 +1025,8 @@ class VLD3DUP<bits<4> op7_4, string Dt>
            (ins addrmode6dup:$Rn), IIC_VLD3dup,
            "vld3", Dt, "\\{$Vd[], $dst2[], $dst3[]\\}, $Rn", "", []> {
    let Rm = 0b1111;
-  let Inst{4} = Rn{4};
+  let Inst{4} = 0;
+  let DecoderMethod = "DecodeVLD3DupInstruction";
  }
  
  def VLD3DUPd8  : VLD3DUP<{0,0,0,?}, "8">;
@@ -945,7 +1048,8 @@ class VLD3DUPWB<bits<4> op7_4, string Dt>
            (ins addrmode6dup:$Rn, am6offset:$Rm), IIC_VLD3dupu,
            "vld3", Dt, "\\{$Vd[], $dst2[], $dst3[]\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
-  let Inst{4} = Rn{4};
+  let Inst{4} = 0;
+  let DecoderMethod = "DecodeVLD3DupInstruction";
  }
  
  def VLD3DUPd8_UPD  : VLD3DUPWB<{0,0,0,0}, "8">;
@@ -968,6 +1072,7 @@ class VLD4DUP<bits<4> op7_4, string Dt>
            "vld4", Dt, "\\{$Vd[], $dst2[], $dst3[], $dst4[]\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD4DupInstruction";
  }
  
  def VLD4DUPd8  : VLD4DUP<{0,0,0,?}, "8">;
@@ -991,6 +1096,7 @@ class VLD4DUPWB<bits<4> op7_4, string Dt>
            "vld4", Dt, "\\{$Vd[], $dst2[], $dst3[], $dst4[]\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVLD4DupInstruction";
  }
  
  def VLD4DUPd8_UPD  : VLD4DUPWB<{0,0,0,0}, "8">;
@@ -1036,6 +1142,7 @@ class VST1D<bits<4> op7_4, string Dt>
            IIC_VST1, "vst1", Dt, "\\{$Vd\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  class VST1Q<bits<4> op7_4, string Dt>
    : NLdSt<0,0b00,0b1010,op7_4, (outs),
@@ -1043,6 +1150,7 @@ class VST1Q<bits<4> op7_4, string Dt>
            "vst1", Dt, "\\{$Vd, $src2\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def  VST1d8   : VST1D<{0,0,0,?}, "8">;
@@ -1066,6 +1174,7 @@ class VST1DWB<bits<4> op7_4, string Dt>
            (ins addrmode6:$Rn, am6offset:$Rm, DPR:$Vd), IIC_VST1u,
            "vst1", Dt, "\\{$Vd\\}, $Rn$Rm", "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  class VST1QWB<bits<4> op7_4, string Dt>
    : NLdSt<0, 0b00, 0b1010, op7_4, (outs GPR:$wb),
@@ -1073,6 +1182,7 @@ class VST1QWB<bits<4> op7_4, string Dt>
            IIC_VST1x2u, "vst1", Dt, "\\{$Vd, $src2\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def VST1d8_UPD  : VST1DWB<{0,0,0,?}, "8">;
@@ -1097,6 +1207,7 @@ class VST1D3<bits<4> op7_4, string Dt>
            IIC_VST1x3, "vst1", Dt, "\\{$Vd, $src2, $src3\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  class VST1D3WB<bits<4> op7_4, string Dt>
    : NLdSt<0, 0b00, 0b0110, op7_4, (outs GPR:$wb),
@@ -1105,6 +1216,7 @@ class VST1D3WB<bits<4> op7_4, string Dt>
            IIC_VST1x3u, "vst1", Dt, "\\{$Vd, $src2, $src3\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def VST1d8T      : VST1D3<{0,0,0,?}, "8">;
@@ -1128,6 +1240,7 @@ class VST1D4<bits<4> op7_4, string Dt>
            []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  class VST1D4WB<bits<4> op7_4, string Dt>
    : NLdSt<0, 0b00, 0b0010, op7_4, (outs GPR:$wb),
@@ -1136,6 +1249,7 @@ class VST1D4WB<bits<4> op7_4, string Dt>
            "vst1", Dt, "\\{$Vd, $src2, $src3, $src4\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def VST1d8Q      : VST1D4<{0,0,?,?}, "8">;
@@ -1158,6 +1272,7 @@ class VST2D<bits<4> op11_8, bits<4> op7_4, string Dt>
            IIC_VST2, "vst2", Dt, "\\{$Vd, $src2\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  class VST2Q<bits<4> op7_4, string Dt>
    : NLdSt<0, 0b00, 0b0011, op7_4, (outs),
@@ -1166,6 +1281,7 @@ class VST2Q<bits<4> op7_4, string Dt>
            "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def  VST2d8   : VST2D<0b1000, {0,0,?,?}, "8">;
@@ -1191,6 +1307,7 @@ class VST2DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            IIC_VST2u, "vst2", Dt, "\\{$Vd, $src2\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  class VST2QWB<bits<4> op7_4, string Dt>
    : NLdSt<0, 0b00, 0b0011, op7_4, (outs GPR:$wb),
@@ -1199,6 +1316,7 @@ class VST2QWB<bits<4> op7_4, string Dt>
            "vst2", Dt, "\\{$Vd, $src2, $src3, $src4\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def VST2d8_UPD  : VST2DWB<0b1000, {0,0,?,?}, "8">;
@@ -1232,6 +1350,7 @@ class VST3D<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vst3", Dt, "\\{$Vd, $src2, $src3\\}, $Rn", "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def  VST3d8   : VST3D<0b0100, {0,0,0,?}, "8">;
@@ -1250,6 +1369,7 @@ class VST3DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            "vst3", Dt, "\\{$Vd, $src2, $src3\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def VST3d8_UPD  : VST3DWB<0b0100, {0,0,0,?}, "8">;
@@ -1289,6 +1409,7 @@ class VST4D<bits<4> op11_8, bits<4> op7_4, string Dt>
            "", []> {
    let Rm = 0b1111;
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def  VST4d8   : VST4D<0b0000, {0,0,?,?}, "8">;
@@ -1307,6 +1428,7 @@ class VST4DWB<bits<4> op11_8, bits<4> op7_4, string Dt>
             "vst4", Dt, "\\{$Vd, $src2, $src3, $src4\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{5-4} = Rn{5-4};
+  let DecoderMethod = "DecodeVSTInstruction";
  }
  
  def VST4d8_UPD  : VST4DWB<0b0000, {0,0,?,?}, "8">;
@@ -1372,6 +1494,16 @@ class VST1LN<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
            IIC_VST1ln, "vst1", Dt, "\\{$Vd[$lane]\\}, $Rn", "",
            [(StoreOp (ExtractOp (Ty DPR:$Vd), imm:$lane), addrmode6:$Rn)]> {
    let Rm = 0b1111;
+  let DecoderMethod = "DecodeVST1LN";
+}
+class VST1LN32<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
+             PatFrag StoreOp, SDNode ExtractOp>
+  : NLdStLn<1, 0b00, op11_8, op7_4, (outs),
+          (ins addrmode6oneL32:$Rn, DPR:$Vd, nohash_imm:$lane),
+          IIC_VST1ln, "vst1", Dt, "\\{$Vd[$lane]\\}, $Rn", "",
+          [(StoreOp (ExtractOp (Ty DPR:$Vd), imm:$lane), addrmode6oneL32:$Rn)]>{
+  let Rm = 0b1111;
+  let DecoderMethod = "DecodeVST1LN";
  }
  class VST1QLNPseudo<ValueType Ty, PatFrag StoreOp, SDNode ExtractOp>
    : VSTQLNPseudo<IIC_VST1ln> {
@@ -1388,7 +1520,8 @@ def VST1LNd16 : VST1LN<0b0100, {?,?,0,?}, "16", v4i16, truncstorei16,
    let Inst{7-6} = lane{1-0};
    let Inst{4}   = Rn{5};
  }
-def VST1LNd32 : VST1LN<0b1000, {?,0,?,?}, "32", v2i32, store, extractelt> {
+
+def VST1LNd32 : VST1LN32<0b1000, {?,0,?,?}, "32", v2i32, store, extractelt> {
    let Inst{7}   = lane{0};
    let Inst{5-4} = Rn{5-4};
  }
@@ -1411,7 +1544,9 @@ class VST1LNWB<bits<4> op11_8, bits<4> op7_4, string Dt, ValueType Ty,
            "\\{$Vd[$lane]\\}, $Rn$Rm",
            "$Rn.addr = $wb",
            [(set GPR:$wb, (StoreOp (ExtractOp (Ty DPR:$Vd), imm:$lane),
-                                  addrmode6:$Rn, am6offset:$Rm))]>;
+                                  addrmode6:$Rn, am6offset:$Rm))]> {
+  let DecoderMethod = "DecodeVST1LN";
+}
  class VST1QLNWBPseudo<ValueType Ty, PatFrag StoreOp, SDNode ExtractOp>
    : VSTQLNWBPseudo<IIC_VST1lnu> {
    let Pattern = [(set GPR:$wb, (StoreOp (ExtractOp (Ty QPR:$src), imm:$lane),
@@ -1447,6 +1582,7 @@ class VST2LN<bits<4> op11_8, bits<4> op7_4, string Dt>
            "", []> {
    let Rm = 0b1111;
    let Inst{4}   = Rn{4};
+  let DecoderMethod = "DecodeVST2LN";
  }
  
  def VST2LNd8  : VST2LN<0b0001, {?,?,?,?}, "8"> {
@@ -1484,6 +1620,7 @@ class VST2LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
            "\\{$src1[$lane], $src2[$lane]\\}, $addr$offset",
            "$addr.addr = $wb", []> {
    let Inst{4}   = Rn{4};
+  let DecoderMethod = "DecodeVST2LN";
  }
  
  def VST2LNd8_UPD  : VST2LNWB<0b0001, {?,?,?,?}, "8"> {
@@ -1517,6 +1654,7 @@ class VST3LN<bits<4> op11_8, bits<4> op7_4, string Dt>
             nohash_imm:$lane), IIC_VST3ln, "vst3", Dt,
            "\\{$Vd[$lane], $src2[$lane], $src3[$lane]\\}, $Rn", "", []> {
    let Rm = 0b1111;
+  let DecoderMethod = "DecodeVST3LN";
  }
  
  def VST3LNd8  : VST3LN<0b0010, {?,?,?,0}, "8"> {
@@ -1551,7 +1689,9 @@ class VST3LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
             DPR:$Vd, DPR:$src2, DPR:$src3, nohash_imm:$lane),
            IIC_VST3lnu, "vst3", Dt,
            "\\{$Vd[$lane], $src2[$lane], $src3[$lane]\\}, $Rn$Rm",
-          "$Rn.addr = $wb", []>;
+          "$Rn.addr = $wb", []> {
+  let DecoderMethod = "DecodeVST3LN";
+}
  
  def VST3LNd8_UPD  : VST3LNWB<0b0010, {?,?,?,0}, "8"> {
    let Inst{7-5} = lane{2-0};
@@ -1586,6 +1726,7 @@ class VST4LN<bits<4> op11_8, bits<4> op7_4, string Dt>
            "", []> {
    let Rm = 0b1111;
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVST4LN";
  }
  
  def VST4LNd8  : VST4LN<0b0011, {?,?,?,?}, "8"> {
@@ -1624,6 +1765,7 @@ class VST4LNWB<bits<4> op11_8, bits<4> op7_4, string Dt>
    "\\{$Vd[$lane], $src2[$lane], $src3[$lane], $src4[$lane]\\}, $Rn$Rm",
            "$Rn.addr = $wb", []> {
    let Inst{4} = Rn{4};
+  let DecoderMethod = "DecodeVST4LN";
  }
  
  def VST4LNd8_UPD  : VST4LNWB<0b0011, {?,?,?,?}, "8"> {
@@ -1801,9 +1943,9 @@ class N3VDX<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VDSL<bits<2> op21_20, bits<4> op11_8,
               InstrItinClass itin, string OpcodeStr, string Dt,
               ValueType Ty, SDNode ShOp>
-  : N3V<0, 1, op21_20, op11_8, 1, 0,
-        (outs DPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane32<0, 1, op21_20, op11_8, 1, 0,
+        (outs DPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (Ty DPR:$Vd),
                (Ty (ShOp (Ty DPR:$Vn),
                          (Ty (NEONvduplane (Ty DPR_VFP2:$Vm),imm:$lane)))))]> {
@@ -1811,9 +1953,9 @@ class N3VDSL<bits<2> op21_20, bits<4> op11_8,
  }
  class N3VDSL16<bits<2> op21_20, bits<4> op11_8,
                 string OpcodeStr, string Dt, ValueType Ty, SDNode ShOp>
-  : N3V<0, 1, op21_20, op11_8, 1, 0,
-        (outs DPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, IIC_VMULi16D, OpcodeStr, Dt,"$Vd, $Vn, $Vm[$lane]","",
+  : N3VLane16<0, 1, op21_20, op11_8, 1, 0,
+        (outs DPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
+        NVMulSLFrm, IIC_VMULi16D, OpcodeStr, Dt,"$Vd, $Vn, $Vm$lane","",
          [(set (Ty DPR:$Vd),
                (Ty (ShOp (Ty DPR:$Vn),
                          (Ty (NEONvduplane (Ty DPR_8:$Vm), imm:$lane)))))]> {
@@ -1841,9 +1983,9 @@ class N3VQX<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VQSL<bits<2> op21_20, bits<4> op11_8,
               InstrItinClass itin, string OpcodeStr, string Dt,
               ValueType ResTy, ValueType OpTy, SDNode ShOp>
-  : N3V<1, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins QPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane32<1, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins QPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (ResTy QPR:$Vd),
                (ResTy (ShOp (ResTy QPR:$Vn),
                             (ResTy (NEONvduplane (OpTy DPR_VFP2:$Vm),
@@ -1852,9 +1994,9 @@ class N3VQSL<bits<2> op21_20, bits<4> op11_8,
  }
  class N3VQSL16<bits<2> op21_20, bits<4> op11_8, string OpcodeStr, string Dt,
                 ValueType ResTy, ValueType OpTy, SDNode ShOp>
-  : N3V<1, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins QPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, IIC_VMULi16Q, OpcodeStr, Dt,"$Vd, $Vn, $Vm[$lane]","",
+  : N3VLane16<1, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins QPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
+        NVMulSLFrm, IIC_VMULi16Q, OpcodeStr, Dt,"$Vd, $Vn, $Vm$lane", "",
          [(set (ResTy QPR:$Vd),
                (ResTy (ShOp (ResTy QPR:$Vn),
                             (ResTy (NEONvduplane (OpTy DPR_8:$Vm),
@@ -1874,9 +2016,9 @@ class N3VDInt<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  }
  class N3VDIntSL<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                  string OpcodeStr, string Dt, ValueType Ty, Intrinsic IntOp>
-  : N3V<0, 1, op21_20, op11_8, 1, 0,
-        (outs DPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane32<0, 1, op21_20, op11_8, 1, 0,
+        (outs DPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (Ty DPR:$Vd),
                (Ty (IntOp (Ty DPR:$Vn),
                           (Ty (NEONvduplane (Ty DPR_VFP2:$Vm),
@@ -1885,9 +2027,9 @@ class N3VDIntSL<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
  }
  class N3VDIntSL16<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                    string OpcodeStr, string Dt, ValueType Ty, Intrinsic IntOp>
-  : N3V<0, 1, op21_20, op11_8, 1, 0,
-        (outs DPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane16<0, 1, op21_20, op11_8, 1, 0,
+        (outs DPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (Ty DPR:$Vd),
                (Ty (IntOp (Ty DPR:$Vn),
                           (Ty (NEONvduplane (Ty DPR_8:$Vm), imm:$lane)))))]> {
@@ -1915,9 +2057,9 @@ class N3VQInt<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VQIntSL<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                  string OpcodeStr, string Dt,
                  ValueType ResTy, ValueType OpTy, Intrinsic IntOp>
-  : N3V<1, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins QPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane32<1, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins QPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (ResTy QPR:$Vd),
                (ResTy (IntOp (ResTy QPR:$Vn),
                              (ResTy (NEONvduplane (OpTy DPR_VFP2:$Vm),
@@ -1927,9 +2069,9 @@ class N3VQIntSL<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
  class N3VQIntSL16<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                    string OpcodeStr, string Dt,
                    ValueType ResTy, ValueType OpTy, Intrinsic IntOp>
-  : N3V<1, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins QPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane16<1, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins QPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (ResTy QPR:$Vd),
                (ResTy (IntOp (ResTy QPR:$Vn),
                              (ResTy (NEONvduplane (OpTy DPR_8:$Vm),
@@ -1959,11 +2101,11 @@ class N3VDMulOp<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VDMulOpSL<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                    string OpcodeStr, string Dt,
                    ValueType Ty, SDPatternOperator MulOp, SDPatternOperator ShOp>
-  : N3V<0, 1, op21_20, op11_8, 1, 0,
+  : N3VLane32<0, 1, op21_20, op11_8, 1, 0,
          (outs DPR:$Vd),
-        (ins DPR:$src1, DPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
+        (ins DPR:$src1, DPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set (Ty DPR:$Vd),
                (Ty (ShOp (Ty DPR:$src1),
                          (Ty (MulOp DPR:$Vn,
@@ -1972,11 +2114,11 @@ class N3VDMulOpSL<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
  class N3VDMulOpSL16<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                      string OpcodeStr, string Dt,
                      ValueType Ty, SDNode MulOp, SDNode ShOp>
-  : N3V<0, 1, op21_20, op11_8, 1, 0,
+  : N3VLane16<0, 1, op21_20, op11_8, 1, 0,
          (outs DPR:$Vd),
-        (ins DPR:$src1, DPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
+        (ins DPR:$src1, DPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set (Ty DPR:$Vd),
                (Ty (ShOp (Ty DPR:$src1),
                          (Ty (MulOp DPR:$Vn,
@@ -1994,11 +2136,11 @@ class N3VQMulOp<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VQMulOpSL<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                    string OpcodeStr, string Dt, ValueType ResTy, ValueType OpTy,
                    SDPatternOperator MulOp, SDPatternOperator ShOp>
-  : N3V<1, 1, op21_20, op11_8, 1, 0,
+  : N3VLane32<1, 1, op21_20, op11_8, 1, 0,
          (outs QPR:$Vd),
-        (ins QPR:$src1, QPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
+        (ins QPR:$src1, QPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set (ResTy QPR:$Vd),
                (ResTy (ShOp (ResTy QPR:$src1),
                             (ResTy (MulOp QPR:$Vn,
@@ -2008,11 +2150,11 @@ class N3VQMulOpSL16<bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                      string OpcodeStr, string Dt,
                      ValueType ResTy, ValueType OpTy,
                      SDNode MulOp, SDNode ShOp>
-  : N3V<1, 1, op21_20, op11_8, 1, 0,
+  : N3VLane16<1, 1, op21_20, op11_8, 1, 0,
          (outs QPR:$Vd),
-        (ins QPR:$src1, QPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
+        (ins QPR:$src1, QPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set (ResTy QPR:$Vd),
                (ResTy (ShOp (ResTy QPR:$src1),
                             (ResTy (MulOp QPR:$Vn,
@@ -2069,10 +2211,10 @@ class N3VLMulOp<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VLMulOpSL<bit op24, bits<2> op21_20, bits<4> op11_8,
                    InstrItinClass itin, string OpcodeStr, string Dt,
                    ValueType TyQ, ValueType TyD, SDNode MulOp, SDNode OpNode>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0, (outs QPR:$Vd),
-        (ins QPR:$src1, DPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
+  : N3VLane32<op24, 1, op21_20, op11_8, 1, 0, (outs QPR:$Vd),
+        (ins QPR:$src1, DPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set QPR:$Vd,
            (OpNode (TyQ QPR:$src1),
                    (TyQ (MulOp (TyD DPR:$Vn),
@@ -2081,10 +2223,10 @@ class N3VLMulOpSL<bit op24, bits<2> op21_20, bits<4> op11_8,
  class N3VLMulOpSL16<bit op24, bits<2> op21_20, bits<4> op11_8,
                      InstrItinClass itin, string OpcodeStr, string Dt,
                      ValueType TyQ, ValueType TyD, SDNode MulOp, SDNode OpNode>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0, (outs QPR:$Vd),
-        (ins QPR:$src1, DPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
+  : N3VLane16<op24, 1, op21_20, op11_8, 1, 0, (outs QPR:$Vd),
+        (ins QPR:$src1, DPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set QPR:$Vd,
            (OpNode (TyQ QPR:$src1),
                    (TyQ (MulOp (TyD DPR:$Vn),
@@ -2116,11 +2258,11 @@ class N3VLInt3<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VLInt3SL<bit op24, bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                   string OpcodeStr, string Dt,
                   ValueType ResTy, ValueType OpTy, Intrinsic IntOp>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0,
+  : N3VLane32<op24, 1, op21_20, op11_8, 1, 0,
          (outs QPR:$Vd),
-        (ins QPR:$src1, DPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
+        (ins QPR:$src1, DPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set (ResTy QPR:$Vd),
                (ResTy (IntOp (ResTy QPR:$src1),
                              (OpTy DPR:$Vn),
@@ -2129,11 +2271,11 @@ class N3VLInt3SL<bit op24, bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
  class N3VLInt3SL16<bit op24, bits<2> op21_20, bits<4> op11_8,
                     InstrItinClass itin, string OpcodeStr, string Dt,
                     ValueType ResTy, ValueType OpTy, Intrinsic IntOp>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0,
+  : N3VLane16<op24, 1, op21_20, op11_8, 1, 0,
          (outs QPR:$Vd),
-        (ins QPR:$src1, DPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
+        (ins QPR:$src1, DPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
          NVMulSLFrm, itin,
-        OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "$src1 = $Vd",
+        OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "$src1 = $Vd",
          [(set (ResTy QPR:$Vd),
                (ResTy (IntOp (ResTy QPR:$src1),
                              (OpTy DPR:$Vn),
@@ -2164,18 +2306,18 @@ class N3VL<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VLSL<bit op24, bits<2> op21_20, bits<4> op11_8,
               InstrItinClass itin, string OpcodeStr, string Dt,
               ValueType TyQ, ValueType TyD, SDNode OpNode>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane32<op24, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set QPR:$Vd,
            (TyQ (OpNode (TyD DPR:$Vn),
                         (TyD (NEONvduplane (TyD DPR_VFP2:$Vm),imm:$lane)))))]>;
  class N3VLSL16<bit op24, bits<2> op21_20, bits<4> op11_8,
                 InstrItinClass itin, string OpcodeStr, string Dt,
                 ValueType TyQ, ValueType TyD, SDNode OpNode>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane16<op24, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set QPR:$Vd,
            (TyQ (OpNode (TyD DPR:$Vn),
                         (TyD (NEONvduplane (TyD DPR_8:$Vm), imm:$lane)))))]>;
@@ -2219,9 +2361,9 @@ class N3VLInt<bit op24, bit op23, bits<2> op21_20, bits<4> op11_8, bit op4,
  class N3VLIntSL<bit op24, bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
                  string OpcodeStr, string Dt,
                  ValueType ResTy, ValueType OpTy, Intrinsic IntOp>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane32<op24, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins DPR:$Vn, DPR_VFP2:$Vm, VectorIndex32:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (ResTy QPR:$Vd),
                (ResTy (IntOp (OpTy DPR:$Vn),
                              (OpTy (NEONvduplane (OpTy DPR_VFP2:$Vm),
@@ -2229,9 +2371,9 @@ class N3VLIntSL<bit op24, bits<2> op21_20, bits<4> op11_8, InstrItinClass itin,
  class N3VLIntSL16<bit op24, bits<2> op21_20, bits<4> op11_8,
                    InstrItinClass itin, string OpcodeStr, string Dt,
                    ValueType ResTy, ValueType OpTy, Intrinsic IntOp>
-  : N3V<op24, 1, op21_20, op11_8, 1, 0,
-        (outs QPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, nohash_imm:$lane),
-        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm[$lane]", "",
+  : N3VLane16<op24, 1, op21_20, op11_8, 1, 0,
+        (outs QPR:$Vd), (ins DPR:$Vn, DPR_8:$Vm, VectorIndex16:$lane),
+        NVMulSLFrm, itin, OpcodeStr, Dt, "$Vd, $Vn, $Vm$lane", "",
          [(set (ResTy QPR:$Vd),
                (ResTy (IntOp (OpTy DPR:$Vn),
                              (OpTy (NEONvduplane (OpTy DPR_8:$Vm),
@@ -3629,7 +3771,7 @@ def  VORRq    : N3VQX<0, 0, 0b10, 0b0001, 1, IIC_VBINiQ, "vorr",
                        v4i32, v4i32, or, 1>;
  
  def VORRiv4i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 0, 0, 1,
-                          (outs DPR:$Vd), (ins nModImm:$SIMM, DPR:$src),
+                          (outs DPR:$Vd), (ins nImmSplatI16:$SIMM, DPR:$src),
                            IIC_VMOVImm,
                            "vorr", "i16", "$Vd, $SIMM", "$src = $Vd",
                            [(set DPR:$Vd,
@@ -3638,7 +3780,7 @@ def VORRiv4i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 0, 0, 1,
  }
  
  def VORRiv2i32 : N1ModImm<1, 0b000, {0,?,?,1}, 0, 0, 0, 1,
-                          (outs DPR:$Vd), (ins nModImm:$SIMM, DPR:$src),
+                          (outs DPR:$Vd), (ins nImmSplatI32:$SIMM, DPR:$src),
                            IIC_VMOVImm,
                            "vorr", "i32", "$Vd, $SIMM", "$src = $Vd",
                            [(set DPR:$Vd,
@@ -3647,7 +3789,7 @@ def VORRiv2i32 : N1ModImm<1, 0b000, {0,?,?,1}, 0, 0, 0, 1,
  }
  
  def VORRiv8i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 1, 0, 1,
-                          (outs QPR:$Vd), (ins nModImm:$SIMM, QPR:$src),
+                          (outs QPR:$Vd), (ins nImmSplatI16:$SIMM, QPR:$src),
                            IIC_VMOVImm,
                            "vorr", "i16", "$Vd, $SIMM", "$src = $Vd",
                            [(set QPR:$Vd,
@@ -3656,7 +3798,7 @@ def VORRiv8i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 1, 0, 1,
  }
  
  def VORRiv4i32 : N1ModImm<1, 0b000, {0,?,?,1}, 0, 1, 0, 1,
-                          (outs QPR:$Vd), (ins nModImm:$SIMM, QPR:$src),
+                          (outs QPR:$Vd), (ins nImmSplatI32:$SIMM, QPR:$src),
                            IIC_VMOVImm,
                            "vorr", "i32", "$Vd, $SIMM", "$src = $Vd",
                            [(set QPR:$Vd,
@@ -3678,7 +3820,7 @@ def  VBICq    : N3VX<0, 0, 0b01, 0b0001, 1, 1, (outs QPR:$Vd),
                                                   (vnotq QPR:$Vm))))]>;
  
  def VBICiv4i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 0, 1, 1,
-                          (outs DPR:$Vd), (ins nModImm:$SIMM, DPR:$src),
+                          (outs DPR:$Vd), (ins nImmSplatI16:$SIMM, DPR:$src),
                            IIC_VMOVImm,
                            "vbic", "i16", "$Vd, $SIMM", "$src = $Vd",
                            [(set DPR:$Vd,
@@ -3687,7 +3829,7 @@ def VBICiv4i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 0, 1, 1,
  }
  
  def VBICiv2i32 : N1ModImm<1, 0b000, {0,?,?,1}, 0, 0, 1, 1,
-                          (outs DPR:$Vd), (ins nModImm:$SIMM, DPR:$src),
+                          (outs DPR:$Vd), (ins nImmSplatI32:$SIMM, DPR:$src),
                            IIC_VMOVImm,
                            "vbic", "i32", "$Vd, $SIMM", "$src = $Vd",
                            [(set DPR:$Vd,
@@ -3696,7 +3838,7 @@ def VBICiv2i32 : N1ModImm<1, 0b000, {0,?,?,1}, 0, 0, 1, 1,
  }
  
  def VBICiv8i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 1, 1, 1,
-                          (outs QPR:$Vd), (ins nModImm:$SIMM, QPR:$src),
+                          (outs QPR:$Vd), (ins nImmSplatI16:$SIMM, QPR:$src),
                            IIC_VMOVImm,
                            "vbic", "i16", "$Vd, $SIMM", "$src = $Vd",
                            [(set QPR:$Vd,
@@ -3705,7 +3847,7 @@ def VBICiv8i16 : N1ModImm<1, 0b000, {1,0,?,1}, 0, 1, 1, 1,
  }
  
  def VBICiv4i32 : N1ModImm<1, 0b000, {0,?,?,1}, 0, 1, 1, 1,
-                          (outs QPR:$Vd), (ins nModImm:$SIMM, QPR:$src),
+                          (outs QPR:$Vd), (ins nImmSplatI32:$SIMM, QPR:$src),
                            IIC_VMOVImm,
                            "vbic", "i32", "$Vd, $SIMM", "$src = $Vd",
                            [(set QPR:$Vd,
@@ -3730,28 +3872,28 @@ def  VORNq    : N3VX<0, 0, 0b11, 0b0001, 1, 1, (outs QPR:$Vd),
  let isReMaterializable = 1 in {
  
  def VMVNv4i16 : N1ModImm<1, 0b000, {1,0,?,0}, 0, 0, 1, 1, (outs DPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI16:$SIMM), IIC_VMOVImm,
                           "vmvn", "i16", "$Vd, $SIMM", "",
                           [(set DPR:$Vd, (v4i16 (NEONvmvnImm timm:$SIMM)))]> {
    let Inst{9} = SIMM{9};
  }
  
  def VMVNv8i16 : N1ModImm<1, 0b000, {1,0,?,0}, 0, 1, 1, 1, (outs QPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI16:$SIMM), IIC_VMOVImm,
                           "vmvn", "i16", "$Vd, $SIMM", "",
                           [(set QPR:$Vd, (v8i16 (NEONvmvnImm timm:$SIMM)))]> {
    let Inst{9} = SIMM{9};
  }
  
  def VMVNv2i32 : N1ModImm<1, 0b000, {?,?,?,?}, 0, 0, 1, 1, (outs DPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmVMOVI32:$SIMM), IIC_VMOVImm,
                           "vmvn", "i32", "$Vd, $SIMM", "",
                           [(set DPR:$Vd, (v2i32 (NEONvmvnImm timm:$SIMM)))]> {
    let Inst{11-8} = SIMM{11-8};
  }
  
  def VMVNv4i32 : N1ModImm<1, 0b000, {?,?,?,?}, 0, 1, 1, 1, (outs QPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmVMOVI32:$SIMM), IIC_VMOVImm,
                           "vmvn", "i32", "$Vd, $SIMM", "",
                           [(set QPR:$Vd, (v4i32 (NEONvmvnImm timm:$SIMM)))]> {
    let Inst{11-8} = SIMM{11-8};
@@ -3776,15 +3918,22 @@ def  VBSLd    : N3VX<1, 0, 0b01, 0b0001, 0, 1, (outs DPR:$Vd),
                       N3RegFrm, IIC_VCNTiD,
                       "vbsl", "$Vd, $Vn, $Vm", "$src1 = $Vd",
                       [(set DPR:$Vd,
-                       (v2i32 (or (and DPR:$Vn, DPR:$src1),
-                                  (and DPR:$Vm, (vnotd DPR:$src1)))))]>;
+                           (v2i32 (NEONvbsl DPR:$src1, DPR:$Vn, DPR:$Vm)))]>;
+
+def : Pat<(v2i32 (or (and DPR:$Vn, DPR:$Vd),
+                     (and DPR:$Vm, (vnotd DPR:$Vd)))),
+          (VBSLd DPR:$Vd, DPR:$Vn, DPR:$Vm)>;
+
  def  VBSLq    : N3VX<1, 0, 0b01, 0b0001, 1, 1, (outs QPR:$Vd),
                       (ins QPR:$src1, QPR:$Vn, QPR:$Vm),
                       N3RegFrm, IIC_VCNTiQ,
                       "vbsl", "$Vd, $Vn, $Vm", "$src1 = $Vd",
                       [(set QPR:$Vd,
-                       (v4i32 (or (and QPR:$Vn, QPR:$src1),
-                                  (and QPR:$Vm, (vnotq QPR:$src1)))))]>;
+                           (v4i32 (NEONvbsl QPR:$src1, QPR:$Vn, QPR:$Vm)))]>;
+
+def : Pat<(v4i32 (or (and QPR:$Vn, QPR:$Vd),
+                     (and QPR:$Vm, (vnotq QPR:$Vd)))),
+          (VBSLq QPR:$Vd, QPR:$Vn, QPR:$Vm)>;
  
  //   VBIF     : Vector Bitwise Insert if False
  //              like VBSL but with: "vbif $dst, $src3, $src1", "$src2 = $dst",
@@ -4014,6 +4163,7 @@ class N2VLShMax<bit op24, bit op23, bits<6> op21_16, bits<4> op11_8, bit op7,
    : N2VLSh<op24, op23, op11_8, op7, op6, op4, OpcodeStr, Dt,
             ResTy, OpTy, OpNode> {
    let Inst{21-16} = op21_16;
+  let DecoderMethod = "DecodeVSHLMaxInstruction";
  }
  def  VSHLLi8  : N2VLShMax<1, 1, 0b110010, 0b0011, 0, 0, 0, "vshll", "i8",
                            v8i16, v8i8, NEONvshlli>;
@@ -4189,72 +4339,57 @@ def  VSWPq    : N2VX<0b11, 0b11, 0b00, 0b10, 0b00000, 1, 0,
  // Vector Move Operations.
  
  //   VMOV     : Vector Move (Register)
-
-let neverHasSideEffects = 1 in {
-def  VMOVDneon: N3VX<0, 0, 0b10, 0b0001, 0, 1, (outs DPR:$Vd), (ins DPR:$Vm),
-                     N3RegFrm, IIC_VMOV, "vmov", "$Vd, $Vm", "", []> {
-  let Vn{4-0} = Vm{4-0};
-}
-def  VMOVQ    : N3VX<0, 0, 0b10, 0b0001, 1, 1, (outs QPR:$Vd), (ins QPR:$Vm),
-                     N3RegFrm, IIC_VMOV, "vmov", "$Vd, $Vm", "", []> {
-  let Vn{4-0} = Vm{4-0};
-}
-
-// Pseudo vector move instructions for QQ and QQQQ registers. This should
-// be expanded after register allocation is completed.
-def  VMOVQQ   : PseudoInst<(outs QQPR:$dst), (ins QQPR:$src),
-                NoItinerary, []>;
-
-def  VMOVQQQQ : PseudoInst<(outs QQQQPR:$dst), (ins QQQQPR:$src),
-                NoItinerary, []>;
-} // neverHasSideEffects
+def : InstAlias<"vmov${p} $Vd, $Vm",
+                (VORRd DPR:$Vd, DPR:$Vm, DPR:$Vm, pred:$p)>;
+def : InstAlias<"vmov${p} $Vd, $Vm",
+                (VORRq QPR:$Vd, QPR:$Vm, QPR:$Vm, pred:$p)>;
  
  //   VMOV     : Vector Move (Immediate)
  
  let isReMaterializable = 1 in {
  def VMOVv8i8  : N1ModImm<1, 0b000, 0b1110, 0, 0, 0, 1, (outs DPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI8:$SIMM), IIC_VMOVImm,
                           "vmov", "i8", "$Vd, $SIMM", "",
                           [(set DPR:$Vd, (v8i8 (NEONvmovImm timm:$SIMM)))]>;
  def VMOVv16i8 : N1ModImm<1, 0b000, 0b1110, 0, 1, 0, 1, (outs QPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI8:$SIMM), IIC_VMOVImm,
                           "vmov", "i8", "$Vd, $SIMM", "",
                           [(set QPR:$Vd, (v16i8 (NEONvmovImm timm:$SIMM)))]>;
  
  def VMOVv4i16 : N1ModImm<1, 0b000, {1,0,?,0}, 0, 0, 0, 1, (outs DPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI16:$SIMM), IIC_VMOVImm,
                           "vmov", "i16", "$Vd, $SIMM", "",
                           [(set DPR:$Vd, (v4i16 (NEONvmovImm timm:$SIMM)))]> {
    let Inst{9} = SIMM{9};
  }
  
  def VMOVv8i16 : N1ModImm<1, 0b000, {1,0,?,0}, 0, 1, 0, 1, (outs QPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI16:$SIMM), IIC_VMOVImm,
                           "vmov", "i16", "$Vd, $SIMM", "",
                           [(set QPR:$Vd, (v8i16 (NEONvmovImm timm:$SIMM)))]> {
   let Inst{9} = SIMM{9};
  }
  
  def VMOVv2i32 : N1ModImm<1, 0b000, {?,?,?,?}, 0, 0, 0, 1, (outs DPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmVMOVI32:$SIMM), IIC_VMOVImm,
                           "vmov", "i32", "$Vd, $SIMM", "",
                           [(set DPR:$Vd, (v2i32 (NEONvmovImm timm:$SIMM)))]> {
    let Inst{11-8} = SIMM{11-8};
  }
  
  def VMOVv4i32 : N1ModImm<1, 0b000, {?,?,?,?}, 0, 1, 0, 1, (outs QPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmVMOVI32:$SIMM), IIC_VMOVImm,
                           "vmov", "i32", "$Vd, $SIMM", "",
                           [(set QPR:$Vd, (v4i32 (NEONvmovImm timm:$SIMM)))]> {
    let Inst{11-8} = SIMM{11-8};
  }
  
  def VMOVv1i64 : N1ModImm<1, 0b000, 0b1110, 0, 0, 1, 1, (outs DPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI64:$SIMM), IIC_VMOVImm,
                           "vmov", "i64", "$Vd, $SIMM", "",
                           [(set DPR:$Vd, (v1i64 (NEONvmovImm timm:$SIMM)))]>;
  def VMOVv2i64 : N1ModImm<1, 0b000, 0b1110, 0, 1, 1, 1, (outs QPR:$Vd),
-                         (ins nModImm:$SIMM), IIC_VMOVImm,
+                         (ins nImmSplatI64:$SIMM), IIC_VMOVImm,
                           "vmov", "i64", "$Vd, $SIMM", "",
                           [(set QPR:$Vd, (v2i64 (NEONvmovImm timm:$SIMM)))]>;
  } // isReMaterializable
@@ -4262,40 +4397,40 @@ def VMOVv2i64 : N1ModImm<1, 0b000, 0b1110, 0, 1, 1, 1, (outs QPR:$Vd),
  //   VMOV     : Vector Get Lane (move scalar to ARM core register)
  
  def VGETLNs8  : NVGetLane<{1,1,1,0,0,1,?,1}, 0b1011, {?,?},
-                          (outs GPR:$R), (ins DPR:$V, nohash_imm:$lane),
-                          IIC_VMOVSI, "vmov", "s8", "$R, $V[$lane]",
+                          (outs GPR:$R), (ins DPR:$V, VectorIndex8:$lane),
+                          IIC_VMOVSI, "vmov", "s8", "$R, $V$lane",
                            [(set GPR:$R, (NEONvgetlanes (v8i8 DPR:$V),
                                             imm:$lane))]> {
    let Inst{21}  = lane{2};
    let Inst{6-5} = lane{1-0};
  }
  def VGETLNs16 : NVGetLane<{1,1,1,0,0,0,?,1}, 0b1011, {?,1},
-                          (outs GPR:$R), (ins DPR:$V, nohash_imm:$lane),
-                          IIC_VMOVSI, "vmov", "s16", "$R, $V[$lane]",
+                          (outs GPR:$R), (ins DPR:$V, VectorIndex16:$lane),
+                          IIC_VMOVSI, "vmov", "s16", "$R, $V$lane",
                            [(set GPR:$R, (NEONvgetlanes (v4i16 DPR:$V),
                                             imm:$lane))]> {
    let Inst{21} = lane{1};
    let Inst{6}  = lane{0};
  }
  def VGETLNu8  : NVGetLane<{1,1,1,0,1,1,?,1}, 0b1011, {?,?},
-                          (outs GPR:$R), (ins DPR:$V, nohash_imm:$lane),
-                          IIC_VMOVSI, "vmov", "u8", "$R, $V[$lane]",
+                          (outs GPR:$R), (ins DPR:$V, VectorIndex8:$lane),
+                          IIC_VMOVSI, "vmov", "u8", "$R, $V$lane",
                            [(set GPR:$R, (NEONvgetlaneu (v8i8 DPR:$V),
                                             imm:$lane))]> {
    let Inst{21}  = lane{2};
    let Inst{6-5} = lane{1-0};
  }
  def VGETLNu16 : NVGetLane<{1,1,1,0,1,0,?,1}, 0b1011, {?,1},
-                          (outs GPR:$R), (ins DPR:$V, nohash_imm:$lane),
-                          IIC_VMOVSI, "vmov", "u16", "$R, $V[$lane]",
+                          (outs GPR:$R), (ins DPR:$V, VectorIndex16:$lane),
+                          IIC_VMOVSI, "vmov", "u16", "$R, $V$lane",
                            [(set GPR:$R, (NEONvgetlaneu (v4i16 DPR:$V),
                                             imm:$lane))]> {
    let Inst{21} = lane{1};
    let Inst{6}  = lane{0};
  }
  def VGETLNi32 : NVGetLane<{1,1,1,0,0,0,?,1}, 0b1011, 0b00,
-                          (outs GPR:$R), (ins DPR:$V, nohash_imm:$lane),
-                          IIC_VMOVSI, "vmov", "32", "$R, $V[$lane]",
+                          (outs GPR:$R), (ins DPR:$V, VectorIndex32:$lane),
+                          IIC_VMOVSI, "vmov", "32", "$R, $V$lane",
                            [(set GPR:$R, (extractelt (v2i32 DPR:$V),
                                             imm:$lane))]> {
    let Inst{21} = lane{0};
@@ -4337,24 +4472,24 @@ def : Pat<(extractelt (v2f64 QPR:$src1), imm:$src2),
  
  let Constraints = "$src1 = $V" in {
  def VSETLNi8  : NVSetLane<{1,1,1,0,0,1,?,0}, 0b1011, {?,?}, (outs DPR:$V),
-                          (ins DPR:$src1, GPR:$R, nohash_imm:$lane),
-                          IIC_VMOVISL, "vmov", "8", "$V[$lane], $R",
+                          (ins DPR:$src1, GPR:$R, VectorIndex8:$lane),
+                          IIC_VMOVISL, "vmov", "8", "$V$lane, $R",
                            [(set DPR:$V, (vector_insert (v8i8 DPR:$src1),
                                             GPR:$R, imm:$lane))]> {
    let Inst{21}  = lane{2};
    let Inst{6-5} = lane{1-0};
  }
  def VSETLNi16 : NVSetLane<{1,1,1,0,0,0,?,0}, 0b1011, {?,1}, (outs DPR:$V),
-                          (ins DPR:$src1, GPR:$R, nohash_imm:$lane),
-                          IIC_VMOVISL, "vmov", "16", "$V[$lane], $R",
+                          (ins DPR:$src1, GPR:$R, VectorIndex16:$lane),
+                          IIC_VMOVISL, "vmov", "16", "$V$lane, $R",
                            [(set DPR:$V, (vector_insert (v4i16 DPR:$src1),
                                             GPR:$R, imm:$lane))]> {
    let Inst{21} = lane{1};
    let Inst{6}  = lane{0};
  }
  def VSETLNi32 : NVSetLane<{1,1,1,0,0,0,?,0}, 0b1011, 0b00, (outs DPR:$V),
-                          (ins DPR:$src1, GPR:$R, nohash_imm:$lane),
-                          IIC_VMOVISL, "vmov", "32", "$V[$lane], $R",
+                          (ins DPR:$src1, GPR:$R, VectorIndex32:$lane),
+                          IIC_VMOVISL, "vmov", "32", "$V$lane, $R",
                            [(set DPR:$V, (insertelt (v2i32 DPR:$src1),
                                             GPR:$R, imm:$lane))]> {
    let Inst{21} = lane{0};
@@ -4436,57 +4571,57 @@ def  VDUP8q   : VDUPQ<0b11101110, 0b00, "8", v16i8>;
  def  VDUP16q  : VDUPQ<0b11101010, 0b01, "16", v8i16>;
  def  VDUP32q  : VDUPQ<0b11101010, 0b00, "32", v4i32>;
  
-def  VDUPfd   : NVDup<0b11101000, 0b1011, 0b00, (outs DPR:$V), (ins GPR:$R),
-                      IIC_VMOVIS, "vdup", "32", "$V, $R",
-                      [(set DPR:$V, (v2f32 (NEONvdup
-                                              (f32 (bitconvert GPR:$R)))))]>;
-def  VDUPfq   : NVDup<0b11101010, 0b1011, 0b00, (outs QPR:$V), (ins GPR:$R),
-                      IIC_VMOVIS, "vdup", "32", "$V, $R",
-                      [(set QPR:$V, (v4f32 (NEONvdup
-                                              (f32 (bitconvert GPR:$R)))))]>;
+def : Pat<(v2f32 (NEONvdup (f32 (bitconvert GPR:$R)))), (VDUP32d GPR:$R)>;
+def : Pat<(v4f32 (NEONvdup (f32 (bitconvert GPR:$R)))), (VDUP32q GPR:$R)>;
  
  //   VDUP     : Vector Duplicate Lane (from scalar to all elements)
  
  class VDUPLND<bits<4> op19_16, string OpcodeStr, string Dt,
-              ValueType Ty>
-  : NVDupLane<op19_16, 0, (outs DPR:$Vd), (ins DPR:$Vm, nohash_imm:$lane),
-              IIC_VMOVD, OpcodeStr, Dt, "$Vd, $Vm[$lane]",
+              ValueType Ty, Operand IdxTy>
+  : NVDupLane<op19_16, 0, (outs DPR:$Vd), (ins DPR:$Vm, IdxTy:$lane),
+              IIC_VMOVD, OpcodeStr, Dt, "$Vd, $Vm$lane",
                [(set DPR:$Vd, (Ty (NEONvduplane (Ty DPR:$Vm), imm:$lane)))]>;
  
  class VDUPLNQ<bits<4> op19_16, string OpcodeStr, string Dt,
-              ValueType ResTy, ValueType OpTy>
-  : NVDupLane<op19_16, 1, (outs QPR:$Vd), (ins DPR:$Vm, nohash_imm:$lane),
-              IIC_VMOVQ, OpcodeStr, Dt, "$Vd, $Vm[$lane]",
+              ValueType ResTy, ValueType OpTy, Operand IdxTy>
+  : NVDupLane<op19_16, 1, (outs QPR:$Vd), (ins DPR:$Vm, IdxTy:$lane),
+              IIC_VMOVQ, OpcodeStr, Dt, "$Vd, $Vm$lane",
                [(set QPR:$Vd, (ResTy (NEONvduplane (OpTy DPR:$Vm),
-                                      imm:$lane)))]>;
+                                      VectorIndex32:$lane)))]>;
  
  // Inst{19-16} is partially specified depending on the element size.
  
-def VDUPLN8d  : VDUPLND<{?,?,?,1}, "vdup", "8", v8i8> {
+def VDUPLN8d  : VDUPLND<{?,?,?,1}, "vdup", "8", v8i8, VectorIndex8> {
+  bits<3> lane;
    let Inst{19-17} = lane{2-0};
  }
-def VDUPLN16d : VDUPLND<{?,?,1,0}, "vdup", "16", v4i16> {
+def VDUPLN16d : VDUPLND<{?,?,1,0}, "vdup", "16", v4i16, VectorIndex16> {
+  bits<2> lane;
    let Inst{19-18} = lane{1-0};
  }
-def VDUPLN32d : VDUPLND<{?,1,0,0}, "vdup", "32", v2i32> {
-  let Inst{19} = lane{0};
-}
-def VDUPLNfd  : VDUPLND<{?,1,0,0}, "vdup", "32", v2f32> {
+def VDUPLN32d : VDUPLND<{?,1,0,0}, "vdup", "32", v2i32, VectorIndex32> {
+  bits<1> lane;
    let Inst{19} = lane{0};
  }
-def VDUPLN8q  : VDUPLNQ<{?,?,?,1}, "vdup", "8", v16i8, v8i8> {
+def VDUPLN8q  : VDUPLNQ<{?,?,?,1}, "vdup", "8", v16i8, v8i8, VectorIndex8> {
+  bits<3> lane;
    let Inst{19-17} = lane{2-0};
  }
-def VDUPLN16q : VDUPLNQ<{?,?,1,0}, "vdup", "16", v8i16, v4i16> {
+def VDUPLN16q : VDUPLNQ<{?,?,1,0}, "vdup", "16", v8i16, v4i16, VectorIndex16> {
+  bits<2> lane;
    let Inst{19-18} = lane{1-0};
  }
-def VDUPLN32q : VDUPLNQ<{?,1,0,0}, "vdup", "32", v4i32, v2i32> {
-  let Inst{19} = lane{0};
-}
-def VDUPLNfq  : VDUPLNQ<{?,1,0,0}, "vdup", "32", v4f32, v2f32> {
+def VDUPLN32q : VDUPLNQ<{?,1,0,0}, "vdup", "32", v4i32, v2i32, VectorIndex32> {
+  bits<1> lane;
    let Inst{19} = lane{0};
  }
  
+def : Pat<(v2f32 (NEONvduplane (v2f32 DPR:$Vm), imm:$lane)),
+          (VDUPLN32d DPR:$Vm, imm:$lane)>;
+
+def : Pat<(v4f32 (NEONvduplane (v2f32 DPR:$Vm), imm:$lane)),
+          (VDUPLN32q DPR:$Vm, imm:$lane)>;
+
  def : Pat<(v16i8 (NEONvduplane (v16i8 QPR:$src), imm:$lane)),
            (v16i8 (VDUPLN8q (v8i8 (EXTRACT_SUBREG QPR:$src,
                                    (DSubReg_i8_reg imm:$lane))),
@@ -4500,7 +4635,7 @@ def : Pat<(v4i32 (NEONvduplane (v4i32 QPR:$src), imm:$lane)),
                                      (DSubReg_i32_reg imm:$lane))),
                              (SubReg_i32_lane imm:$lane)))>;
  def : Pat<(v4f32 (NEONvduplane (v4f32 QPR:$src), imm:$lane)),
-          (v4f32 (VDUPLNfq (v2f32 (EXTRACT_SUBREG QPR:$src,
+          (v4f32 (VDUPLN32q (v2f32 (EXTRACT_SUBREG QPR:$src,
                                     (DSubReg_i32_reg imm:$lane))),
                             (SubReg_i32_lane imm:$lane)))>;
  
@@ -4685,10 +4820,10 @@ def VEXTd32 : VEXTd<"vext", "32", v2i32> {
    let Inst{11-10} = index{1-0};
    let Inst{9-8}    = 0b00;
  }
-def VEXTdf  : VEXTd<"vext", "32", v2f32> {
-  let Inst{11}    = index{0};
-  let Inst{10-8}  = 0b000;
-}
+def : Pat<(v2f32 (NEONvext (v2f32 DPR:$Vn),
+                           (v2f32 DPR:$Vm),
+                           (i32 imm:$index))),
+          (VEXTd32 DPR:$Vn, DPR:$Vm, imm:$index)>;
  
  def VEXTq8  : VEXTq<"vext", "8",  v16i8> {
    let Inst{11-8} = index{3-0};
@@ -4701,10 +4836,10 @@ def VEXTq32 : VEXTq<"vext", "32", v4i32> {
    let Inst{11-10} = index{1-0};
    let Inst{9-8}    = 0b00;
  }
-def VEXTqf  : VEXTq<"vext", "32", v4f32> {
-  let Inst{11}    = index{0};
-  let Inst{10-8}  = 0b000;
-}
+def : Pat<(v4f32 (NEONvext (v4f32 QPR:$Vn),
+                           (v4f32 QPR:$Vm),
+                           (i32 imm:$index))),
+          (VEXTq32 QPR:$Vn, QPR:$Vm, imm:$index)>;
  
  //   VTRN     : Vector Transpose
  
@@ -4739,11 +4874,12 @@ def  VZIPq32  : N2VQShuffle<0b10, 0b00011, IIC_VPERMQ3, "vzip", "32">;
  // Vector Table Lookup and Table Extension.
  
  //   VTBL     : Vector Table Lookup
+let DecoderMethod = "DecodeTBLInstruction" in {
  def  VTBL1
    : N3V<1,1,0b11,0b1000,0,0, (outs DPR:$Vd),
-        (ins DPR:$Vn, DPR:$Vm), NVTBLFrm, IIC_VTB1,
-        "vtbl", "8", "$Vd, \\{$Vn\\}, $Vm", "",
-        [(set DPR:$Vd, (v8i8 (int_arm_neon_vtbl1 DPR:$Vn, DPR:$Vm)))]>;
+        (ins VecListOneD:$Vn, DPR:$Vm), NVTBLFrm, IIC_VTB1,
+        "vtbl", "8", "$Vd, $Vn, $Vm", "",
+        [(set DPR:$Vd, (v8i8 (int_arm_neon_vtbl1 VecListOneD:$Vn, DPR:$Vm)))]>;
  let hasExtraSrcRegAllocReq = 1 in {
  def  VTBL2
    : N3V<1,1,0b11,0b1001,0,0, (outs DPR:$Vd),
@@ -4801,6 +4937,7 @@ def  VTBX3Pseudo
  def  VTBX4Pseudo
    : PseudoNeonI<(outs DPR:$dst), (ins DPR:$orig, QQPR:$tbl, DPR:$src),
                  IIC_VTBX4, "$orig = $dst", []>;
+} // DecoderMethod = "DecodeTBLInstruction"
  
  //===----------------------------------------------------------------------===//
  // NEON instructions for single-precision FP math