[ARM] When a bitcast is about to be turned into a VMOVDRR, try to combine it

[oota-llvm.git] / test / CodeGen / ARM / 2011-11-29-128bitArithmetics.ll
diff --git a/test/CodeGen/ARM/2011-11-29-128bitArithmetics.ll b/test/CodeGen/ARM/2011-11-29-128bitArithmetics.ll

index 89c01d58c39854d3c60f5eca76dc08454dca4ee6..404aca13cdba6ac3a17c48d0a5749071e561f2b7 100644 (file)
--- a/test/CodeGen/ARM/2011-11-29-128bitArithmetics.ll
+++ b/test/CodeGen/ARM/2011-11-29-128bitArithmetics.ll
@@ -1,22 +1,22 @@
-; RUN: llc < %s -march=arm -mcpu=cortex-a9 | FileCheck %s
+; RUN: llc -mtriple=arm-eabi -float-abi=soft -mcpu=cortex-a9 %s -o - | FileCheck %s
  
  @A = global <4 x float> <float 0., float 1., float 2., float 3.>
  
  define void @test_sqrt(<4 x float>* %X) nounwind {
  
-; CHECK: test_sqrt:
+; CHECK-LABEL: test_sqrt:
  
  ; CHECK:      movw    r1, :lower16:{{.*}}
  ; CHECK:      movt    r1, :upper16:{{.*}}
-; CHECK:      vldmia  r1
+; CHECK:      vld1.64 {{.*}}, [r1:128]
  ; CHECK:      vsqrt.f32       {{s[0-9]+}}, {{s[0-9]+}}
  ; CHECK:      vsqrt.f32       {{s[0-9]+}}, {{s[0-9]+}}
  ; CHECK:      vsqrt.f32       {{s[0-9]+}}, {{s[0-9]+}}
  ; CHECK:      vsqrt.f32       {{s[0-9]+}}, {{s[0-9]+}}
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64  {{.*}}
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.sqrt.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -27,28 +27,28 @@ declare <4 x float> @llvm.sqrt.v4f32(<4 x float>) nounwind readonly
  
  define void @test_cos(<4 x float>* %X) nounwind {
  
-; CHECK: test_cos:
+; CHECK-LABEL: test_cos:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}cosf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}cosf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}cosf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}cosf
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.cos.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -58,28 +58,28 @@ declare <4 x float> @llvm.cos.v4f32(<4 x float>) nounwind readonly
  
  define void @test_exp(<4 x float>* %X) nounwind {
  
-; CHECK: test_exp:
+; CHECK-LABEL: test_exp:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}expf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}expf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}expf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}expf
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.exp.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -89,28 +89,28 @@ declare <4 x float> @llvm.exp.v4f32(<4 x float>) nounwind readonly
  
  define void @test_exp2(<4 x float>* %X) nounwind {
  
-; CHECK: test_exp2:
+; CHECK-LABEL: test_exp2:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}exp2f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}exp2f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}exp2f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}exp2f
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.exp2.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -120,28 +120,28 @@ declare <4 x float> @llvm.exp2.v4f32(<4 x float>) nounwind readonly
  
  define void @test_log10(<4 x float>* %X) nounwind {
  
-; CHECK: test_log10:
+; CHECK-LABEL: test_log10:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log10f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log10f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log10f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log10f
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.log10.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -151,28 +151,28 @@ declare <4 x float> @llvm.log10.v4f32(<4 x float>) nounwind readonly
  
  define void @test_log(<4 x float>* %X) nounwind {
  
-; CHECK: test_log:
+; CHECK-LABEL: test_log:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}logf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}logf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}logf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}logf
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.log.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -182,28 +182,28 @@ declare <4 x float> @llvm.log.v4f32(<4 x float>) nounwind readonly
  
  define void @test_log2(<4 x float>* %X) nounwind {
  
-; CHECK: test_log2:
+; CHECK-LABEL: test_log2:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log2f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log2f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log2f
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}log2f
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.log2.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -214,29 +214,29 @@ declare <4 x float> @llvm.log2.v4f32(<4 x float>) nounwind readonly
  
  define void @test_pow(<4 x float>* %X) nounwind {
  
-; CHECK: test_pow:
+; CHECK-LABEL: test_pow:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}powf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}powf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}powf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}powf
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
  
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.pow.v4f32(<4 x float> %0, <4 x float> <float 2., float 2., float 2., float 2.>)
  
    store <4 x float> %1, <4 x float>* %X, align 16
@@ -248,18 +248,18 @@ declare <4 x float> @llvm.pow.v4f32(<4 x float>, <4 x float>) nounwind readonly
  
  define void @test_powi(<4 x float>* %X) nounwind {
  
-; CHECK: test_powi:
+; CHECK-LABEL: test_powi:
  
  ; CHECK:       movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:       movt  [[reg0]], :upper16:{{.*}}
-; CHECK:       vldmia  [[reg0]], {{.*}}
+; CHECK:       vld1.64 {{.*}}:128
  ; CHECK:       vmul.f32 {{.*}}
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
  
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.powi.v4f32(<4 x float> %0, i32 2)
  
    store <4 x float> %1, <4 x float>* %X, align 16
@@ -271,28 +271,28 @@ declare <4 x float> @llvm.powi.v4f32(<4 x float>, i32) nounwind readonly
  
  define void @test_sin(<4 x float>* %X) nounwind {
  
-; CHECK: test_sin:
+; CHECK-LABEL: test_sin:
  
  ; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
  ; CHECK:      movt  [[reg0]], :upper16:{{.*}}
-; CHECK:      vldmia r{{[0-9][0-9]?}}, {{.*}}
+; CHECK:      vld1.64
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}sinf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}sinf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}sinf
  
-; CHECK:      {{[mov|vmov.32]}}  r0,
+; CHECK:      {{v?mov(.32)?}}  r0,
  ; CHECK:      bl  {{.*}}sinf
  
-; CHECK:      vstmia  {{.*}}
+; CHECK:      vst1.64
  
  L.entry:
-  %0 = load <4 x float>* @A, align 16
+  %0 = load <4 x float>, <4 x float>* @A, align 16
    %1 = call <4 x float> @llvm.sin.v4f32(<4 x float> %0)
    store <4 x float> %1, <4 x float>* %X, align 16
    ret void
@@ -300,3 +300,34 @@ L.entry:
  
  declare <4 x float> @llvm.sin.v4f32(<4 x float>) nounwind readonly
  
+define void @test_floor(<4 x float>* %X) nounwind {
+
+; CHECK-LABEL: test_floor:
+
+; CHECK:      movw  [[reg0:r[0-9]+]], :lower16:{{.*}}
+; CHECK:      movt  [[reg0]], :upper16:{{.*}}
+; CHECK:      vld1.64
+
+; CHECK:      {{v?mov(.32)?}}  r0,
+; CHECK:      bl  {{.*}}floorf
+
+; CHECK:      {{v?mov(.32)?}}  r0,
+; CHECK:      bl  {{.*}}floorf
+
+; CHECK:      {{v?mov(.32)?}}  r0,
+; CHECK:      bl  {{.*}}floorf
+
+; CHECK:      {{v?mov(.32)?}}  r0,
+; CHECK:      bl  {{.*}}floorf
+
+; CHECK:      vst1.64
+
+L.entry:
+  %0 = load <4 x float>, <4 x float>* @A, align 16
+  %1 = call <4 x float> @llvm.floor.v4f32(<4 x float> %0)
+  store <4 x float> %1, <4 x float>* %X, align 16
+  ret void
+}
+
+declare <4 x float> @llvm.floor.v4f32(<4 x float>) nounwind readonly
+