[ARM] Enable shrink-wrapping by default.
[oota-llvm.git] / test / CodeGen / Thumb2 / float-intrinsics-float.ll
1 ; RUN: llc < %s -mtriple=thumbv7-none-eabi   -mcpu=cortex-m3                    | FileCheck %s -check-prefix=CHECK -check-prefix=SOFT -check-prefix=NONE
2 ; RUN: llc < %s -mtriple=thumbv7-none-eabihf -mcpu=cortex-m4                    | FileCheck %s -check-prefix=CHECK -check-prefix=HARD -check-prefix=SP -check-prefix=VMLA
3 ; RUN: llc < %s -mtriple=thumbv7-none-eabihf -mcpu=cortex-m7                    | FileCheck %s -check-prefix=CHECK -check-prefix=HARD -check-prefix=DP -check-prefix=VFP  -check-prefix=FP-ARMv8  -check-prefix=VMLA
4 ; RUN: llc < %s -mtriple=thumbv7-none-eabihf -mcpu=cortex-m7 -mattr=+fp-only-sp | FileCheck %s -check-prefix=CHECK -check-prefix=HARD -check-prefix=SP -check-prefix=FP-ARMv8 -check-prefix=VMLA
5 ; RUN: llc < %s -mtriple=thumbv7-none-eabihf -mcpu=cortex-a7                    | FileCheck %s -check-prefix=CHECK -check-prefix=HARD -check-prefix=DP -check-prefix=NEON -check-prefix=VFP4 -check-prefix=NO-VMLA
6 ; RUN: llc < %s -mtriple=thumbv7-none-eabihf -mcpu=cortex-a57                   | FileCheck %s -check-prefix=CHECK -check-prefix=HARD -check-prefix=DP -check-prefix=NEON -check-prefix=FP-ARMv8 -check-prefix=VMLA
7
8 declare float     @llvm.sqrt.f32(float %Val)
9 define float @sqrt_f(float %a) {
10 ; CHECK-LABEL: sqrt_f:
11 ; SOFT: bl sqrtf
12 ; HARD: vsqrt.f32 s0, s0
13   %1 = call float @llvm.sqrt.f32(float %a)
14   ret float %1
15 }
16
17 declare float     @llvm.powi.f32(float %Val, i32 %power)
18 define float @powi_f(float %a, i32 %b) {
19 ; CHECK-LABEL: powi_f:
20 ; SOFT: bl __powisf2
21 ; HARD: b __powisf2
22   %1 = call float @llvm.powi.f32(float %a, i32 %b)
23   ret float %1
24 }
25
26 declare float     @llvm.sin.f32(float %Val)
27 define float @sin_f(float %a) {
28 ; CHECK-LABEL: sin_f:
29 ; SOFT: bl sinf
30 ; HARD: b sinf
31   %1 = call float @llvm.sin.f32(float %a)
32   ret float %1
33 }
34
35 declare float     @llvm.cos.f32(float %Val)
36 define float @cos_f(float %a) {
37 ; CHECK-LABEL: cos_f:
38 ; SOFT: bl cosf
39 ; HARD: b cosf
40   %1 = call float @llvm.cos.f32(float %a)
41   ret float %1
42 }
43
44 declare float     @llvm.pow.f32(float %Val, float %power)
45 define float @pow_f(float %a, float %b) {
46 ; CHECK-LABEL: pow_f:
47 ; SOFT: bl powf
48 ; HARD: b powf
49   %1 = call float @llvm.pow.f32(float %a, float %b)
50   ret float %1
51 }
52
53 declare float     @llvm.exp.f32(float %Val)
54 define float @exp_f(float %a) {
55 ; CHECK-LABEL: exp_f:
56 ; SOFT: bl expf
57 ; HARD: b expf
58   %1 = call float @llvm.exp.f32(float %a)
59   ret float %1
60 }
61
62 declare float     @llvm.exp2.f32(float %Val)
63 define float @exp2_f(float %a) {
64 ; CHECK-LABEL: exp2_f:
65 ; SOFT: bl exp2f
66 ; HARD: b exp2f
67   %1 = call float @llvm.exp2.f32(float %a)
68   ret float %1
69 }
70
71 declare float     @llvm.log.f32(float %Val)
72 define float @log_f(float %a) {
73 ; CHECK-LABEL: log_f:
74 ; SOFT: bl logf
75 ; HARD: b logf
76   %1 = call float @llvm.log.f32(float %a)
77   ret float %1
78 }
79
80 declare float     @llvm.log10.f32(float %Val)
81 define float @log10_f(float %a) {
82 ; CHECK-LABEL: log10_f:
83 ; SOFT: bl log10f
84 ; HARD: b log10f
85   %1 = call float @llvm.log10.f32(float %a)
86   ret float %1
87 }
88
89 declare float     @llvm.log2.f32(float %Val)
90 define float @log2_f(float %a) {
91 ; CHECK-LABEL: log2_f:
92 ; SOFT: bl log2f
93 ; HARD: b log2f
94   %1 = call float @llvm.log2.f32(float %a)
95   ret float %1
96 }
97
98 declare float     @llvm.fma.f32(float %a, float %b, float %c)
99 define float @fma_f(float %a, float %b, float %c) {
100 ; CHECK-LABEL: fma_f:
101 ; SOFT: bl fmaf
102 ; HARD: vfma.f32
103   %1 = call float @llvm.fma.f32(float %a, float %b, float %c)
104   ret float %1
105 }
106
107 declare float     @llvm.fabs.f32(float %Val)
108 define float @abs_f(float %a) {
109 ; CHECK-LABEL: abs_f:
110 ; SOFT: bic r0, r0, #-2147483648
111 ; HARD: vabs.f32
112   %1 = call float @llvm.fabs.f32(float %a)
113   ret float %1
114 }
115
116 declare float     @llvm.copysign.f32(float  %Mag, float  %Sgn)
117 define float @copysign_f(float %a, float %b) {
118 ; CHECK-LABEL: copysign_f:
119 ; NONE: lsrs [[REG:r[0-9]+]], r{{[0-9]+}}, #31
120 ; NONE: bfi r{{[0-9]+}}, [[REG]], #31, #1
121 ; SP: lsrs [[REG:r[0-9]+]], r{{[0-9]+}}, #31
122 ; SP: bfi r{{[0-9]+}}, [[REG]], #31, #1
123 ; VFP: lsrs [[REG:r[0-9]+]], r{{[0-9]+}}, #31
124 ; VFP: bfi r{{[0-9]+}}, [[REG]], #31, #1
125 ; NEON: vmov.i32 [[REG:d[0-9]+]], #0x80000000
126 ; NEON: vbsl [[REG]], d
127   %1 = call float @llvm.copysign.f32(float %a, float %b)
128   ret float %1
129 }
130
131 declare float     @llvm.floor.f32(float %Val)
132 define float @floor_f(float %a) {
133 ; CHECK-LABEL: floor_f:
134 ; SOFT: bl floorf
135 ; VFP4: b floorf
136 ; FP-ARMv8: vrintm.f32
137   %1 = call float @llvm.floor.f32(float %a)
138   ret float %1
139 }
140
141 declare float     @llvm.ceil.f32(float %Val)
142 define float @ceil_f(float %a) {
143 ; CHECK-LABEL: ceil_f:
144 ; SOFT: bl ceilf
145 ; VFP4: b ceilf
146 ; FP-ARMv8: vrintp.f32
147   %1 = call float @llvm.ceil.f32(float %a)
148   ret float %1
149 }
150
151 declare float     @llvm.trunc.f32(float %Val)
152 define float @trunc_f(float %a) {
153 ; CHECK-LABEL: trunc_f:
154 ; SOFT: bl truncf
155 ; VFP4: b truncf
156 ; FP-ARMv8: vrintz.f32
157   %1 = call float @llvm.trunc.f32(float %a)
158   ret float %1
159 }
160
161 declare float     @llvm.rint.f32(float %Val)
162 define float @rint_f(float %a) {
163 ; CHECK-LABEL: rint_f:
164 ; SOFT: bl rintf
165 ; VFP4: b rintf
166 ; FP-ARMv8: vrintx.f32
167   %1 = call float @llvm.rint.f32(float %a)
168   ret float %1
169 }
170
171 declare float     @llvm.nearbyint.f32(float %Val)
172 define float @nearbyint_f(float %a) {
173 ; CHECK-LABEL: nearbyint_f:
174 ; SOFT: bl nearbyintf
175 ; VFP4: b nearbyintf
176 ; FP-ARMv8: vrintr.f32
177   %1 = call float @llvm.nearbyint.f32(float %a)
178   ret float %1
179 }
180
181 declare float     @llvm.round.f32(float %Val)
182 define float @round_f(float %a) {
183 ; CHECK-LABEL: round_f:
184 ; SOFT: bl roundf
185 ; VFP4: b roundf
186 ; FP-ARMv8: vrinta.f32
187   %1 = call float @llvm.round.f32(float %a)
188   ret float %1
189 }
190
191 ; FIXME: why does cortex-m4 use vmla, while cortex-a7 uses vmul+vadd?
192 ; (these should be equivalent, even the rounding is the same)
193 declare float     @llvm.fmuladd.f32(float %a, float %b, float %c)
194 define float @fmuladd_f(float %a, float %b, float %c) {
195 ; CHECK-LABEL: fmuladd_f:
196 ; SOFT: bl __aeabi_fmul
197 ; SOFT: bl __aeabi_fadd
198 ; VMLA: vmla.f32
199 ; NO-VMLA: vmul.f32
200 ; NO-VMLA: vadd.f32
201   %1 = call float @llvm.fmuladd.f32(float %a, float %b, float %c)
202   ret float %1
203 }
204
205 declare i16 @llvm.convert.to.fp16.f32(float %a)
206 define i16 @f_to_h(float %a) {
207 ; CHECK-LABEL: f_to_h:
208 ; SOFT: bl __aeabi_f2h
209 ; HARD: vcvt{{[bt]}}.f16.f32
210   %1 = call i16 @llvm.convert.to.fp16.f32(float %a)
211   ret i16 %1
212 }
213
214 declare float @llvm.convert.from.fp16.f32(i16 %a)
215 define float @h_to_f(i16 %a) {
216 ; CHECK-LABEL: h_to_f:
217 ; SOFT: bl __aeabi_h2f
218 ; HARD: vcvt{{[bt]}}.f32.f16
219   %1 = call float @llvm.convert.from.fp16.f32(i16 %a)
220   ret float %1
221 }