[AArch64] Run a peephole pass right after AdvSIMD pass.

author Quentin Colombet <qcolombet@apple.com>

Thu, 21 Aug 2014 18:10:07 +0000 (18:10 +0000)

committer Quentin Colombet <qcolombet@apple.com>

Thu, 21 Aug 2014 18:10:07 +0000 (18:10 +0000)
author Quentin Colombet <qcolombet@apple.com>
Thu, 21 Aug 2014 18:10:07 +0000 (18:10 +0000)
committer Quentin Colombet <qcolombet@apple.com>
Thu, 21 Aug 2014 18:10:07 +0000 (18:10 +0000)
diff --git a/lib/Target/AArch64/AArch64TargetMachine.cpp b/lib/Target/AArch64/AArch64TargetMachine.cpp

index d34be77f0ff8ce236c61a451295fb31efea50189..f3172a62f0329ce7d4d067bee58732d1410bf6c4 100644 (file)
--- a/lib/Target/AArch64/AArch64TargetMachine.cpp
+++ b/lib/Target/AArch64/AArch64TargetMachine.cpp
@@ -195,8 +195,12 @@ bool AArch64PassConfig::addILPOpts() {
  
  bool AArch64PassConfig::addPreRegAlloc() {
    // Use AdvSIMD scalar instructions whenever profitable.
-  if (TM->getOptLevel() != CodeGenOpt::None && EnableAdvSIMDScalar)
+  if (TM->getOptLevel() != CodeGenOpt::None && EnableAdvSIMDScalar) {
      addPass(createAArch64AdvSIMDScalar());
+    // The AdvSIMD pass may produce copies that can be rewritten to
+    // be register coaleascer friendly.
+    addPass(&PeepholeOptimizerID);
+  }
    return true;
  }
  
diff --git a/test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll b/test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll

index a3d7727c8ae1147a833a7f0cb0cde18d022f03e3..6266d1cc9b33d969376d4f23e095a4af32f0f2c5 100644 (file)
--- a/test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll
+++ b/test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll
@@ -1,15 +1,36 @@
-; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=apple -aarch64-simd-scalar=true -asm-verbose=false | FileCheck %s
-; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=generic -aarch64-simd-scalar=true -asm-verbose=false | FileCheck %s -check-prefix=GENERIC
+; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=apple -aarch64-simd-scalar=true -asm-verbose=false -disable-adv-copy-opt=true | FileCheck %s -check-prefix=CHECK -check-prefix=CHECK-NOOPT
+; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=apple -aarch64-simd-scalar=true -asm-verbose=false -disable-adv-copy-opt=false | FileCheck %s -check-prefix=CHECK -check-prefix=CHECK-OPT
+; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=generic -aarch64-simd-scalar=true -asm-verbose=false -disable-adv-copy-opt=true | FileCheck %s -check-prefix=GENERIC -check-prefix=GENERIC-NOOPT
+; RUN: llc < %s -march=arm64 -aarch64-neon-syntax=generic -aarch64-simd-scalar=true -asm-verbose=false -disable-adv-copy-opt=false | FileCheck %s -check-prefix=GENERIC -check-prefix=GENERIC-OPT
  
  define <2 x i64> @bar(<2 x i64> %a, <2 x i64> %b) nounwind readnone {
  ; CHECK-LABEL: bar:
  ; CHECK: add.2d        v[[REG:[0-9]+]], v0, v1
  ; CHECK: add   d[[REG3:[0-9]+]], d[[REG]], d1
+; Without advanced copy optimization, we end up with cross register
+; banks copies that cannot be coalesced.
+; CHECK-NOOPT: fmov [[COPY_REG3:x[0-9]+]], d[[REG3]]
+; With advanced copy optimization, we end up with just one copy
+; to insert the computed high part into the V register. 
+; CHECK-OPT-NOT: fmov
  ; CHECK: sub   d[[REG2:[0-9]+]], d[[REG]], d1
+; CHECK: fmov [[COPY_REG2:x[0-9]+]], d[[REG2]]
+; CHECK-NOOPT: fmov d0, [[COPY_REG3]]
+; CHECK-OPT-NOT: fmov
+; CHECK: ins.d v0[1], [[COPY_REG2]]
+; CHECK-NEXT: ret
+;
  ; GENERIC-LABEL: bar:
  ; GENERIC: add v[[REG:[0-9]+]].2d, v0.2d, v1.2d
  ; GENERIC: add d[[REG3:[0-9]+]], d[[REG]], d1
+; GENERIC-NOOPT: fmov [[COPY_REG3:x[0-9]+]], d[[REG3]]
+; GENERIC-OPT-NOT: fmov
  ; GENERIC: sub d[[REG2:[0-9]+]], d[[REG]], d1
+; GENERIC: fmov [[COPY_REG2:x[0-9]+]], d[[REG2]]
+; GENERIC-NOOPT: fmov d0, [[COPY_REG3]]
+; GENERIC-OPT-NOT: fmov
+; GENERIC: ins v0.d[1], [[COPY_REG2]]
+; GENERIC-NEXT: ret
    %add = add <2 x i64> %a, %b
    %vgetq_lane = extractelement <2 x i64> %add, i32 0
    %vgetq_lane2 = extractelement <2 x i64> %b, i32 0
author	Quentin Colombet <qcolombet@apple.com>
	Thu, 21 Aug 2014 18:10:07 +0000 (18:10 +0000)
committer	Quentin Colombet <qcolombet@apple.com>
	Thu, 21 Aug 2014 18:10:07 +0000 (18:10 +0000)
lib/Target/AArch64/AArch64TargetMachine.cpp		patch \| blob \| history
test/CodeGen/AArch64/arm64-AdvSIMD-Scalar.ll		patch \| blob \| history