Add correct Thumb2 encodings for NEON vst[1,2,3,4] and vld[1,2,3,4].
authorOwen Anderson <resistor@mac.com>
Thu, 11 Nov 2010 21:36:43 +0000 (21:36 +0000)
committerOwen Anderson <resistor@mac.com>
Thu, 11 Nov 2010 21:36:43 +0000 (21:36 +0000)
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@118843 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/ARM/ARMCodeEmitter.cpp
lib/Target/ARM/ARMInstrFormats.td
lib/Target/ARM/ARMMCCodeEmitter.cpp
test/MC/ARM/neont2-vld-encoding.s [new file with mode: 0644]
test/MC/ARM/neont2-vst-encoding.s [new file with mode: 0644]

index 3cb0df54ab978390f4af3abebdb8454b762861ed..cd4ac6a6c191de8cb69842362614d52e09cb9731 100644 (file)
@@ -163,6 +163,8 @@ namespace {
     //  far along that this one can be eliminated entirely.
     unsigned NEONThumb2DataIPostEncoder(const MachineInstr &MI, unsigned Val) 
       const { return 0; }
+    unsigned NEONThumb2LoadStorePostEncoder(const MachineInstr &MI,unsigned Val) 
+      const { return 0; }
     unsigned getBranchTargetOpValue(const MachineInstr &MI, unsigned Op)
       const { return 0; }
     unsigned getCCOutOpValue(const MachineInstr &MI, unsigned Op)
index c6858892c48a1682bc9ea41aafe53234902efe2d..56aa4b0e0d8c71e8dd1c2b99fa74ab6c6bfb44fb 100644 (file)
@@ -1827,6 +1827,8 @@ class NLdSt<bit op23, bits<2> op21_20, bits<4> op11_8, bits<4> op7_4,
   let Inst{11-8}  = op11_8;
   let Inst{7-4}   = op7_4;
   
+  string PostEncoderMethod = "NEONThumb2LoadStorePostEncoder";
+  
   bits<5> Vd;
   bits<6> Rn;
   bits<4> Rm;
index 6e63a0be360ea0dda224dade458f22611a4807cb..a407acad4d445d48924a6c1b34769e43e451bf6b 100644 (file)
@@ -174,6 +174,8 @@ public:
 
   unsigned NEONThumb2DataIPostEncoder(const MCInst &MI,
                                       unsigned EncodedValue) const;
+  unsigned NEONThumb2LoadStorePostEncoder(const MCInst &MI,
+                                      unsigned EncodedValue) const;
 
   void EmitByte(unsigned char C, raw_ostream &OS) const {
     OS << (char)C;
@@ -198,7 +200,7 @@ MCCodeEmitter *llvm::createARMMCCodeEmitter(const Target &, TargetMachine &TM,
   return new ARMMCCodeEmitter(TM, Ctx);
 }
 
-/// NEONThumb2PostEncoder - Post-process encoded NEON data-processing 
+/// NEONThumb2DataIPostEncoder - Post-process encoded NEON data-processing 
 /// instructions, and rewrite them to their Thumb2 form if we are currently in 
 /// Thumb2 mode.
 unsigned ARMMCCodeEmitter::NEONThumb2DataIPostEncoder(const MCInst &MI,
@@ -218,6 +220,21 @@ unsigned ARMMCCodeEmitter::NEONThumb2DataIPostEncoder(const MCInst &MI,
   return EncodedValue;
 }
 
+/// NEONThumb2LoadStorePostEncoder - Post-process encoded NEON load/store
+/// instructions, and rewrite them to their Thumb2 form if we are currently in 
+/// Thumb2 mode.
+unsigned ARMMCCodeEmitter::NEONThumb2LoadStorePostEncoder(const MCInst &MI,
+                                                 unsigned EncodedValue) const {
+  const ARMSubtarget &Subtarget = TM.getSubtarget<ARMSubtarget>();
+  if (Subtarget.isThumb2()) {
+    EncodedValue &= 0xF0FFFFFF;
+    EncodedValue |= 0x09000000;
+  }
+  
+  return EncodedValue;
+}
+
+
 /// getMachineOpValue - Return binary encoding of operand. If the machine
 /// operand requires relocation, record the relocation and return zero.
 unsigned ARMMCCodeEmitter::
diff --git a/test/MC/ARM/neont2-vld-encoding.s b/test/MC/ARM/neont2-vld-encoding.s
new file mode 100644 (file)
index 0000000..031205a
--- /dev/null
@@ -0,0 +1,112 @@
+@ RUN: llvm-mc -mcpu=cortex-a8 -triple thumb-unknown-unknown -show-encoding < %s | FileCheck %s
+@ XFAIL: *
+
+.code 16
+
+@ CHECK: vld1.8        {d16}, [r0, :64]        @ encoding: [0x1f,0x07,0x60,0xf9]
+       vld1.8  {d16}, [r0, :64]
+@ CHECK: vld1.16       {d16}, [r0]             @ encoding: [0x4f,0x07,0x60,0xf9]
+  vld1.16      {d16}, [r0]
+@ CHECK: vld1.32       {d16}, [r0]             @ encoding: [0x8f,0x07,0x60,0xf9]
+  vld1.32      {d16}, [r0]
+@ CHECK: vld1.64       {d16}, [r0]             @ encoding: [0xcf,0x07,0x60,0xf9]
+  vld1.64      {d16}, [r0]
+@ CHECK: vld1.8        {d16, d17}, [r0, :64]   @ encoding: [0x1f,0x0a,0x60,0xf9]
+  vld1.8       {d16, d17}, [r0, :64]
+@ CHECK: vld1.16       {d16, d17}, [r0, :128]  @ encoding: [0x6f,0x0a,0x60,0xf9]
+  vld1.16      {d16, d17}, [r0, :128]
+@ CHECK: vld1.32       {d16, d17}, [r0]        @ encoding: [0x8f,0x0a,0x60,0xf9]
+  vld1.32      {d16, d17}, [r0]
+@ CHECK: vld1.64       {d16, d17}, [r0]        @ encoding: [0xcf,0x0a,0x60,0xf9]
+  vld1.64      {d16, d17}, [r0]
+
+@ CHECK: vld2.8        {d16, d17}, [r0, :64]   @ encoding: [0x1f,0x08,0x60,0xf9]
+  vld2.8       {d16, d17}, [r0, :64]
+@ CHECK: vld2.16       {d16, d17}, [r0, :128]  @ encoding: [0x6f,0x08,0x60,0xf9]
+  vld2.16      {d16, d17}, [r0, :128]
+@ CHECK: vld2.32       {d16, d17}, [r0]        @ encoding: [0x8f,0x08,0x60,0xf9]
+  vld2.32      {d16, d17}, [r0]
+@ CHECK: vld2.8        {d16, d17, d18, d19}, [r0, :64] @ encoding: [0x1f,0x03,0x60,0xf9]
+  vld2.8       {d16, d17, d18, d19}, [r0, :64]
+@ CHECK: vld2.16       {d16, d17, d18, d19}, [r0, :128] @ encoding: [0x6f,0x03,0x60,0xf9]
+  vld2.16      {d16, d17, d18, d19}, [r0, :128]
+@ CHECK: vld2.32       {d16, d17, d18, d19}, [r0, :256] @ encoding: [0xbf,0x03,0x60,0xf9]
+  vld2.32      {d16, d17, d18, d19}, [r0, :256]
+
+@ CHECK: vld3.8        {d16, d17, d18}, [r0, :64] @ encoding: [0x1f,0x04,0x60,0xf9]
+  vld3.8       {d16, d17, d18}, [r0, :64]
+@ CHECK: vld3.16       {d16, d17, d18}, [r0]   @ encoding: [0x4f,0x04,0x60,0xf9]
+  vld3.16      {d16, d17, d18}, [r0]
+@ CHECK: vld3.32       {d16, d17, d18}, [r0]   @ encoding: [0x8f,0x04,0x60,0xf9]
+  vld3.32      {d16, d17, d18}, [r0]
+@ CHECK: vld3.8        {d16, d18, d20}, [r0, :64]! @ encoding: [0x1d,0x05,0x60,0xf9]
+  vld3.8       {d16, d18, d20}, [r0, :64]!
+@ CHECK: vld3.8        {d17, d19, d21}, [r0, :64]! @ encoding: [0x1d,0x15,0x60,0xf9]
+  vld3.8       {d17, d19, d21}, [r0, :64]!
+@ CHECK: vld3.16       {d16, d18, d20}, [r0]!  @ encoding: [0x4d,0x05,0x60,0xf9] 
+  vld3.16      {d16, d18, d20}, [r0]!
+@ CHECK: vld3.16       {d17, d19, d21}, [r0]!  @ encoding: [0x4d,0x15,0x60,0xf9]
+  vld3.16      {d17, d19, d21}, [r0]!
+@ CHECK: vld3.32       {d16, d18, d20}, [r0]!  @ encoding: [0x8d,0x05,0x60,0xf9]
+  vld3.32      {d16, d18, d20}, [r0]!
+@ CHECK: vld3.32       {d17, d19, d21}, [r0]!  @ encoding: [0x8d,0x15,0x60,0xf9]
+  vld3.32      {d17, d19, d21}, [r0]!
+
+@ CHECK: vld4.8        {d16, d17, d18, d19}, [r0, :64] @ encoding: [0x1f,0x00,0x60,0xf9]
+  vld4.8       {d16, d17, d18, d19}, [r0, :64]
+@ CHECK: vld4.16       {d16, d17, d18, d19}, [r0, :128] @ encoding: [0x6f,0x00,0x60,0xf9]
+  vld4.16      {d16, d17, d18, d19}, [r0, :128]
+@ CHECK: vld4.32       {d16, d17, d18, d19}, [r0, :256] @ encoding: [0xbf,0x00,0x60,0xf9]
+  vld4.32      {d16, d17, d18, d19}, [r0, :256]
+@ CHECK: vld4.8        {d16, d18, d20, d22}, [r0, :256]! @ encoding: [0x3d,0x01,0x60,0xf9]
+  vld4.8       {d16, d18, d20, d22}, [r0, :256]!
+@ CHECK: vld4.8        {d17, d19, d21, d23}, [r0, :256]! @ encoding: [0x3d,0x11,0x60,0xf9]
+  vld4.8       {d17, d19, d21, d23}, [r0, :256]!
+@ CHECK: vld4.16       {d16, d18, d20, d22}, [r0]! @ encoding: [0x4d,0x01,0x60,0xf9]
+  vld4.16      {d16, d18, d20, d22}, [r0]!
+@ CHECK: vld4.16       {d17, d19, d21, d23}, [r0]! @ encoding: [0x4d,0x11,0x60,0xf9]
+  vld4.16      {d17, d19, d21, d23}, [r0]!
+@ CHECK: vld4.32       {d16, d18, d20, d22}, [r0]! @ encoding: [0x8d,0x01,0x60,0xf9]
+  vld4.32      {d16, d18, d20, d22}, [r0]!
+@ CHECK: vld4.32       {d17, d19, d21, d23}, [r0]! @ encoding: [0x8d,0x11,0x60,0xf9]
+  vld4.32      {d17, d19, d21, d23}, [r0]!
+
+@ CHECK: vld1.8        {d16[3]}, [r0]          @ encoding: [0x6f,0x00,0xe0,0xf9]
+  vld1.8       {d16[3]}, [r0]
+@ CHECK: vld1.16       {d16[2]}, [r0, :16]     @ encoding: [0x9f,0x04,0xe0,0xf9]
+  vld1.16      {d16[2]}, [r0, :16]
+@ CHECK: vld1.32       {d16[1]}, [r0, :32]     @ encoding: [0xbf,0x08,0xe0,0xf9]
+  vld1.32      {d16[1]}, [r0, :32]
+
+@ CHECK: vld2.8        {d16[1], d17[1]}, [r0, :16] @ encoding: [0x3f,0x01,0xe0,0xf9]
+  vld2.8       {d16[1], d17[1]}, [r0, :16]
+@ CHECK: vld2.16       {d16[1], d17[1]}, [r0, :32] @ encoding: [0x5f,0x05,0xe0,0xf9]
+  vld2.16      {d16[1], d17[1]}, [r0, :32]
+@ CHECK: vld2.32       {d16[1], d17[1]}, [r0]  @ encoding: [0x8f,0x09,0xe0,0xf9]
+  vld2.32      {d16[1], d17[1]}, [r0]
+@ CHECK: vld2.16       {d17[1], d19[1]}, [r0]  @ encoding: [0x6f,0x15,0xe0,0xf9]
+  vld2.16      {d17[1], d19[1]}, [r0]
+@ CHECK: vld2.32       {d17[0], d19[0]}, [r0, :64] @ encoding: [0x5f,0x19,0xe0,0xf9]
+  vld2.32      {d17[0], d19[0]}, [r0, :64]
+
+@ CHECK: vld3.8        {d16[1], d17[1], d18[1]}, [r0] @ encoding: [0x2f,0x02,0xe0,0xf9]
+  vld3.8       {d16[1], d17[1], d18[1]}, [r0]
+@ CHECK: vld3.16       {d16[1], d17[1], d18[1]}, [r0] @ encoding: [0x4f,0x06,0xe0,0xf9]
+  vld3.16      {d16[1], d17[1], d18[1]}, [r0]
+@ CHECK: vld3.32       {d16[1], d17[1], d18[1]}, [r0] @ encoding: [0x8f,0x0a,0xe0,0xf9]
+  vld3.32      {d16[1], d17[1], d18[1]}, [r0]
+@ CHECK: vld3.16       {d16[1], d18[1], d20[1]}, [r0] @ encoding: [0x6f,0x06,0xe0,0xf9]
+  vld3.16      {d16[1], d18[1], d20[1]}, [r0]
+@ CHECK: vld3.32       {d17[1], d19[1], d21[1]}, [r0] @ encoding: [0xcf,0x1a,0xe0,0xf9]
+  vld3.32      {d17[1], d19[1], d21[1]}, [r0]
+
+@ CHECK: vld4.8        {d16[1], d17[1], d18[1], d19[1]}, [r0, :32] @ encoding: [0x3f,0x03,0xe0,0xf9]
+  vld4.8       {d16[1], d17[1], d18[1], d19[1]}, [r0, :32]
+@ CHECK: vld4.16       {d16[1], d17[1], d18[1], d19[1]}, [r0] @ encoding: [0x4f,0x07,0xe0,0xf9]
+  vld4.16      {d16[1], d17[1], d18[1], d19[1]}, [r0]
+@ CHECK: vld4.32       {d16[1], d17[1], d18[1], d19[1]}, [r0, :128] @ encoding: [0xaf,0x0b,0xe0,0xf9]
+  vld4.32      {d16[1], d17[1], d18[1], d19[1]}, [r0, :128]
+@ CHECK: vld4.16       {d16[1], d18[1], d20[1], d22[1]}, [r0, :64] @ encoding: [0x7f,0x07,0xe0,0xf9]
+  vld4.16      {d16[1], d18[1], d20[1], d22[1]}, [r0, :64]
+@ CHECK: vld4.32       {d17[0], d19[0], d21[0], d23[0]}, [r0] @ encoding: [0x4f,0x1b,0xe0,0xf9]
+  vld4.32      {d17[0], d19[0], d21[0], d23[0]}, [r0]
diff --git a/test/MC/ARM/neont2-vst-encoding.s b/test/MC/ARM/neont2-vst-encoding.s
new file mode 100644 (file)
index 0000000..1722f12
--- /dev/null
@@ -0,0 +1,103 @@
+@ RUN: llvm-mc -mcpu=cortex-a8 -triple thumb-unknown-unknown -show-encoding < %s | FileCheck %s
+@ XFAIL: *
+
+.code 16
+
+@ CHECK: vst1.8        {d16}, [r0, :64]        @ encoding: [0x1f,0x07,0x40,0xf9]
+  vst1.8       {d16}, [r0, :64]
+@ CHECK: vst1.16       {d16}, [r0]             @ encoding: [0x4f,0x07,0x40,0xf9]
+  vst1.16      {d16}, [r0]
+@ CHECK: vst1.32       {d16}, [r0]             @ encoding: [0x8f,0x07,0x40,0xf9]
+  vst1.32      {d16}, [r0]
+@ CHECK: vst1.64       {d16}, [r0]             @ encoding: [0xcf,0x07,0x40,0xf9]
+  vst1.64      {d16}, [r0]
+@ CHECK: vst1.8        {d16, d17}, [r0, :64]   @ encoding: [0x1f,0x0a,0x40,0xf9]
+  vst1.8       {d16, d17}, [r0, :64]
+@ CHECK: vst1.16       {d16, d17}, [r0, :128]  @ encoding: [0x6f,0x0a,0x40,0xf9]
+  vst1.16      {d16, d17}, [r0, :128]
+@ CHECK: vst1.32       {d16, d17}, [r0]        @ encoding: [0x8f,0x0a,0x40,0xf9]
+  vst1.32      {d16, d17}, [r0]
+@ CHECK: vst1.64       {d16, d17}, [r0]        @ encoding: [0xcf,0x0a,0x40,0xf9]
+  vst1.64      {d16, d17}, [r0]
+
+@ CHECK: vst2.8        {d16, d17}, [r0, :64]   @ encoding: [0x1f,0x08,0x40,0xf9]
+  vst2.8       {d16, d17}, [r0, :64]
+@ CHECK: vst2.16       {d16, d17}, [r0, :128]  @ encoding: [0x6f,0x08,0x40,0xf9]
+  vst2.16      {d16, d17}, [r0, :128]
+@ CHECK: vst2.32       {d16, d17}, [r0]        @ encoding: [0x8f,0x08,0x40,0xf9]
+  vst2.32      {d16, d17}, [r0]
+@ CHECK: vst2.8        {d16, d17, d18, d19}, [r0, :64] @ encoding: [0x1f,0x03,0x40,0xf9]
+  vst2.8       {d16, d17, d18, d19}, [r0, :64]
+@ CHECK: vst2.16       {d16, d17, d18, d19}, [r0, :128] @ encoding: [0x6f,0x03,0x40,0xf9]
+  vst2.16      {d16, d17, d18, d19}, [r0, :128]
+@ CHECK: vst2.32       {d16, d17, d18, d19}, [r0, :256] @ encoding: [0xbf,0x03,0x40,0xf9]
+  vst2.32      {d16, d17, d18, d19}, [r0, :256]
+
+@ CHECK: vst3.8        {d16, d17, d18}, [r0, :64] @ encoding: [0x1f,0x04,0x40,0xf9]
+  vst3.8       {d16, d17, d18}, [r0, :64]
+@ CHECK: vst3.16       {d16, d17, d18}, [r0]   @ encoding: [0x4f,0x04,0x40,0xf9]
+  vst3.16      {d16, d17, d18}, [r0]
+@ CHECK: vst3.32       {d16, d17, d18}, [r0]   @ encoding: [0x8f,0x04,0x40,0xf9]
+  vst3.32      {d16, d17, d18}, [r0]
+@ CHECK: vst3.8        {d16, d18, d20}, [r0, :64]! @ encoding: [0x1d,0x05,0x40,0xf9]
+  vst3.8       {d16, d18, d20}, [r0, :64]!
+@ CHECK: vst3.8        {d17, d19, d21}, [r0, :64]! @ encoding: [0x1d,0x15,0x40,0xf9]
+  vst3.8       {d17, d19, d21}, [r0, :64]!
+@ CHECK: vst3.16       {d16, d18, d20}, [r0]!  @ encoding: [0x4d,0x05,0x40,0xf9]
+  vst3.16      {d16, d18, d20}, [r0]!
+@ CHECK: vst3.16       {d17, d19, d21}, [r0]!  @ encoding: [0x4d,0x15,0x40,0xf9]
+  vst3.16      {d17, d19, d21}, [r0]!
+@ CHECK: vst3.32       {d16, d18, d20}, [r0]!  @ encoding: [0x8d,0x05,0x40,0xf9]
+  vst3.32      {d16, d18, d20}, [r0]!
+@ CHECK: vst3.32       {d17, d19, d21}, [r0]!  @ encoding: [0x8d,0x15,0x40,0xf9]
+  vst3.32      {d17, d19, d21}, [r0]!
+
+@ CHECK: vst4.8        {d16, d17, d18, d19}, [r0, :64] @ encoding: [0x1f,0x00,0x40,0xf9]
+  vst4.8       {d16, d17, d18, d19}, [r0, :64]
+@ CHECK: vst4.16       {d16, d17, d18, d19}, [r0, :128] @ encoding: [0x6f,0x00,0x40,0xf9]
+  vst4.16      {d16, d17, d18, d19}, [r0, :128]
+@ CHECK: vst4.8        {d16, d18, d20, d22}, [r0, :256]! @ encoding: [0x3d,0x01,0x40,0xf9]
+  vst4.8       {d16, d18, d20, d22}, [r0, :256]!
+@ CHECK: vst4.8        {d17, d19, d21, d23}, [r0, :256]! @ encoding: [0x3d,0x11,0x40,0xf9]
+  vst4.8       {d17, d19, d21, d23}, [r0, :256]!
+@ CHECK: vst4.16       {d16, d18, d20, d22}, [r0]! @ encoding: [0x4d,0x01,0x40,0xf9]
+  vst4.16      {d16, d18, d20, d22}, [r0]!
+@ CHECK: vst4.16       {d17, d19, d21, d23}, [r0]! @ encoding: [0x4d,0x11,0x40,0xf9]
+  vst4.16      {d17, d19, d21, d23}, [r0]!
+@ CHECK: vst4.32       {d16, d18, d20, d22}, [r0]! @ encoding: [0x8d,0x01,0x40,0xf9]
+  vst4.32      {d16, d18, d20, d22}, [r0]!
+@ CHECK: vst4.32       {d17, d19, d21, d23}, [r0]! @ encoding: [0x8d,0x11,0x40,0xf9]
+  vst4.32      {d17, d19, d21, d23}, [r0]!
+
+@ CHECK: vst2.8        {d16[1], d17[1]}, [r0, :16] @ encoding: [0x3f,0x01,0xc0,0xf9]
+  vst2.8       {d16[1], d17[1]}, [r0, :16]
+@ CHECK: vst2.16       {d16[1], d17[1]}, [r0, :32] @ encoding: [0x5f,0x05,0xc0,0xf9]
+  vst2.16      {d16[1], d17[1]}, [r0, :32]
+@ CHECK: vst2.32       {d16[1], d17[1]}, [r0]  @ encoding: [0x8f,0x09,0xc0,0xf9]
+  vst2.32      {d16[1], d17[1]}, [r0]
+@ CHECK: vst2.16       {d17[1], d19[1]}, [r0]  @ encoding: [0x6f,0x15,0xc0,0xf9]
+  vst2.16      {d17[1], d19[1]}, [r0]
+@ CHECK: vst2.32       {d17[0], d19[0]}, [r0, :64] @ encoding: [0x5f,0x19,0xc0,0xf9]
+  vst2.32      {d17[0], d19[0]}, [r0, :64]
+
+@ CHECK: vst3.8        {d16[1], d17[1], d18[1]}, [r0] @ encoding: [0x2f,0x02,0xc0,0xf9]
+  vst3.8       {d16[1], d17[1], d18[1]}, [r0]
+@ CHECK: vst3.16       {d16[1], d17[1], d18[1]}, [r0] @ encoding: [0x4f,0x06,0xc0,0xf9]
+  vst3.16      {d16[1], d17[1], d18[1]}, [r0]
+@ CHECK: vst3.32       {d16[1], d17[1], d18[1]}, [r0] @ encoding: [0x8f,0x0a,0xc0,0xf9]
+  vst3.32      {d16[1], d17[1], d18[1]}, [r0]
+@ CHECK: vst3.16       {d17[2], d19[2], d21[2]}, [r0] @ encoding: [0xaf,0x16,0xc0,0xf9]
+  vst3.16      {d17[2], d19[2], d21[2]}, [r0]
+@ CHECK: vst3.32       {d16[0], d18[0], d20[0]}, [r0] @ encoding: [0x4f,0x0a,0xc0,0xf9]
+  vst3.32      {d16[0], d18[0], d20[0]}, [r0]
+
+@ CHECK: vst4.8        {d16[1], d17[1], d18[1], d19[1]}, [r0, :32] @ encoding: [0x3f,0x03,0xc0,0xf9]
+  vst4.8       {d16[1], d17[1], d18[1], d19[1]}, [r0, :32]
+@ CHECK: vst4.16       {d16[1], d17[1], d18[1], d19[1]}, [r0] @ encoding: [0x4f,0x07,0xc0,0xf9]
+  vst4.16      {d16[1], d17[1], d18[1], d19[1]}, [r0]
+@ CHECK: vst4.32       {d16[1], d17[1], d18[1], d19[1]}, [r0, :128] @ encoding: [0xaf,0x0b,0xc0,0xf9]
+  vst4.32      {d16[1], d17[1], d18[1], d19[1]}, [r0, :128]
+@ CHECK: vst4.16       {d17[3], d19[3], d21[3], d23[3]}, [r0, :64] @ encoding: [0xff,0x17,0xc0,0xf9]
+  vst4.16      {d17[3], d19[3], d21[3], d23[3]}, [r0, :64]
+@ CHECK: vst4.32       {d17[0], d19[0], d21[0], d23[0]}, [r0] @ encoding: [0x4f,0x1b,0xc0,0xf9]
+  vst4.32      {d17[0], d19[0], d21[0], d23[0]}, [r0]