test/CodeGen/ARM/vcvt_combine.ll

   1 ; RUN: llc < %s -mtriple=armv7-apple-ios | FileCheck %s
   2
   3 @in = global float 0x400921FA00000000, align 4
   4
   5 ; Test signed conversion.
   6 ; CHECK: t0
   7 ; CHECK-NOT: vmul
   8 define void @t0() nounwind {
   9 entry:
  10   %tmp = load float, float* @in, align 4
  11   %vecinit.i = insertelement <2 x float> undef, float %tmp, i32 0
  12   %vecinit2.i = insertelement <2 x float> %vecinit.i, float %tmp, i32 1
  13   %mul.i = fmul <2 x float> %vecinit2.i, <float 8.000000e+00, float 8.000000e+00>
  14   %vcvt.i = fptosi <2 x float> %mul.i to <2 x i32>
  15   tail call void @foo_int32x2_t(<2 x i32> %vcvt.i) nounwind
  16   ret void
  17 }
  18
  19 declare void @foo_int32x2_t(<2 x i32>)
  20
  21 ; Test unsigned conversion.
  22 ; CHECK: t1
  23 ; CHECK-NOT: vmul
  24 define void @t1() nounwind {
  25 entry:
  26   %tmp = load float, float* @in, align 4
  27   %vecinit.i = insertelement <2 x float> undef, float %tmp, i32 0
  28   %vecinit2.i = insertelement <2 x float> %vecinit.i, float %tmp, i32 1
  29   %mul.i = fmul <2 x float> %vecinit2.i, <float 8.000000e+00, float 8.000000e+00>
  30   %vcvt.i = fptoui <2 x float> %mul.i to <2 x i32>
  31   tail call void @foo_uint32x2_t(<2 x i32> %vcvt.i) nounwind
  32   ret void
  33 }
  34
  35 declare void @foo_uint32x2_t(<2 x i32>)
  36
  37 ; Test which should not fold due to non-power of 2.
  38 ; CHECK: t2
  39 ; CHECK: vmul
  40 define void @t2() nounwind {
  41 entry:
  42   %tmp = load float, float* @in, align 4
  43   %vecinit.i = insertelement <2 x float> undef, float %tmp, i32 0
  44   %vecinit2.i = insertelement <2 x float> %vecinit.i, float %tmp, i32 1
  45   %mul.i = fmul <2 x float> %vecinit2.i, <float 0x401B333340000000, float 0x401B333340000000>
  46   %vcvt.i = fptosi <2 x float> %mul.i to <2 x i32>
  47   tail call void @foo_int32x2_t(<2 x i32> %vcvt.i) nounwind
  48   ret void
  49 }
  50
  51 ; Test which should not fold due to power of 2 out of range.
  52 ; CHECK: t3
  53 ; CHECK: vmul
  54 define void @t3() nounwind {
  55 entry:
  56   %tmp = load float, float* @in, align 4
  57   %vecinit.i = insertelement <2 x float> undef, float %tmp, i32 0
  58   %vecinit2.i = insertelement <2 x float> %vecinit.i, float %tmp, i32 1
  59   %mul.i = fmul <2 x float> %vecinit2.i, <float 0x4200000000000000, float 0x4200000000000000>
  60   %vcvt.i = fptosi <2 x float> %mul.i to <2 x i32>
  61   tail call void @foo_int32x2_t(<2 x i32> %vcvt.i) nounwind
  62   ret void
  63 }
  64
  65 ; Test which case where const is max power of 2 (i.e., 2^32).
  66 ; CHECK: t4
  67 ; CHECK-NOT: vmul
  68 define void @t4() nounwind {
  69 entry:
  70   %tmp = load float, float* @in, align 4
  71   %vecinit.i = insertelement <2 x float> undef, float %tmp, i32 0
  72   %vecinit2.i = insertelement <2 x float> %vecinit.i, float %tmp, i32 1
  73   %mul.i = fmul <2 x float> %vecinit2.i, <float 0x41F0000000000000, float 0x41F0000000000000>
  74   %vcvt.i = fptosi <2 x float> %mul.i to <2 x i32>
  75   tail call void @foo_int32x2_t(<2 x i32> %vcvt.i) nounwind
  76   ret void
  77 }
  78
  79 ; Test quadword.
  80 ; CHECK: t5
  81 ; CHECK-NOT: vmul
  82 define void @t5() nounwind {
  83 entry:
  84   %tmp = load float, float* @in, align 4
  85   %vecinit.i = insertelement <4 x float> undef, float %tmp, i32 0
  86   %vecinit2.i = insertelement <4 x float> %vecinit.i, float %tmp, i32 1
  87   %vecinit4.i = insertelement <4 x float> %vecinit2.i, float %tmp, i32 2
  88   %vecinit6.i = insertelement <4 x float> %vecinit4.i, float %tmp, i32 3
  89   %mul.i = fmul <4 x float> %vecinit6.i, <float 8.000000e+00, float 8.000000e+00, float 8.000000e+00, float 8.000000e+00>
  90   %vcvt.i = fptosi <4 x float> %mul.i to <4 x i32>
  91   tail call void @foo_int32x4_t(<4 x i32> %vcvt.i) nounwind
  92   ret void
  93 }
  94
  95 declare void @foo_int32x4_t(<4 x i32>)