ARM: support direct f16 <-> f64 conversions
[oota-llvm.git] / test / CodeGen / ARM / fp16.ll
1 ; RUN: llc < %s | FileCheck %s
2 ; RUN: llc -mattr=+vfp3,+fp16 < %s | FileCheck --check-prefix=CHECK-FP16 %s
3 ; RUN: llc -mtriple=armv8-eabi < %s | FileCheck --check-prefix=CHECK-ARMV8 %s
4 target datalayout = "e-p:32:32:32-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-n32"
5 target triple = "armv7-eabi"
6
7 @x = global i16 12902
8 @y = global i16 0
9 @z = common global i16 0
10
11 define arm_aapcs_vfpcc void @foo() nounwind {
12 ; CHECK-LABEL: foo:
13 ; CHECK-FP16-LABEL: foo:
14 ; CHECK-ARMV8-LABEL: foo:
15 entry:
16   %0 = load i16* @x, align 2
17   %1 = load i16* @y, align 2
18   %2 = tail call float @llvm.convert.from.fp16.f32(i16 %0)
19 ; CHECK: __gnu_h2f_ieee
20 ; CHECK-FP16: vcvtb.f32.f16
21 ; CHECK-ARMv8: vcvtb.f32.f16
22   %3 = tail call float @llvm.convert.from.fp16.f32(i16 %1)
23 ; CHECK: __gnu_h2f_ieee
24 ; CHECK-FP16: vcvtb.f32.f16
25 ; CHECK-ARMV8: vcvtb.f32.f16
26   %4 = fadd float %2, %3
27   %5 = tail call i16 @llvm.convert.to.fp16.f32(float %4)
28 ; CHECK: __gnu_f2h_ieee
29 ; CHECK-FP16: vcvtb.f16.f32
30 ; CHECK-ARMV8: vcvtb.f16.f32
31   store i16 %5, i16* @x, align 2
32   ret void
33 }
34
35 define arm_aapcs_vfpcc double @test_from_fp16(i16 %in) {
36 ; CHECK-LABEL: test_from_fp16:
37 ; CHECK-FP-LABEL: test_from_fp16:
38 ; CHECK-ARMV8-LABEL: test_from_fp16:
39   %val = call double @llvm.convert.from.fp16.f64(i16 %in)
40 ; CHECK: bl __gnu_h2f_ieee
41 ; CHECK: vmov [[TMP:s[0-9]+]], r0
42 ; CHECK: vcvt.f64.f32 d0, [[TMP]]
43
44 ; CHECK-FP16: vmov [[TMP16:s[0-9]+]], r0
45 ; CHECK-FP16: vcvtb.f32.f16 [[TMP32:s[0-9]+]], [[TMP16]]
46 ; CHECK-FP16: vcvt.f64.f32 d0, [[TMP32]]
47
48 ; CHECK-ARMV8: vmov [[TMP:s[0-9]+]], r0
49 ; CHECK-ARMV8: vcvtb.f64.f16 d0, [[TMP]]
50   ret double %val
51 }
52
53 define arm_aapcs_vfpcc i16 @test_to_fp16(double %in) {
54 ; CHECK-LABEL: test_to_fp16:
55 ; CHECK-FP-LABEL: test_to_fp16:
56 ; CHECK-ARMV8-LABEL: test_to_fp16:
57   %val = call i16 @llvm.convert.to.fp16.f64(double %in)
58 ; CHECK: bl __truncdfhf2
59
60 ; CHECK-FP16: bl __truncdfhf2
61
62 ; CHECK-ARMV8: vcvtb.f16.f64 [[TMP:s[0-9]+]], d0
63 ; CHECK-ARMV8: vmov r0, [[TMP]]
64   ret i16 %val
65 }
66
67 declare float @llvm.convert.from.fp16.f32(i16) nounwind readnone
68 declare double @llvm.convert.from.fp16.f64(i16) nounwind readnone
69
70 declare i16 @llvm.convert.to.fp16.f32(float) nounwind readnone
71 declare i16 @llvm.convert.to.fp16.f64(double) nounwind readnone