[FastISel][AArch64] Optimize compare-and-branch for i1 to use 'tbz'.
[oota-llvm.git] / test / CodeGen / AArch64 / f16-convert.ll
1 ; RUN: llc < %s -mtriple=arm64-apple-ios -asm-verbose=false | FileCheck %s
2
3 define float @load0(i16* nocapture readonly %a) nounwind {
4 ; CHECK-LABEL: load0:
5 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0]
6 ; CHECK-NEXT: fcvt s0, [[HREG]]
7 ; CHECK-NEXT: ret
8
9   %tmp = load i16* %a, align 2
10   %tmp1 = tail call float @llvm.convert.from.fp16.f32(i16 %tmp)
11   ret float %tmp1
12 }
13
14 define double @load1(i16* nocapture readonly %a) nounwind {
15 ; CHECK-LABEL: load1:
16 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0]
17 ; CHECK-NEXT: fcvt d0, [[HREG]]
18 ; CHECK-NEXT: ret
19
20   %tmp = load i16* %a, align 2
21   %conv = tail call double @llvm.convert.from.fp16.f64(i16 %tmp)
22   ret double %conv
23 }
24
25 define float @load2(i16* nocapture readonly %a, i32 %i) nounwind {
26 ; CHECK-LABEL: load2:
27 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0, w1, sxtw #1]
28 ; CHECK-NEXT: fcvt s0, [[HREG]]
29 ; CHECK-NEXT: ret
30
31   %idxprom = sext i32 %i to i64
32   %arrayidx = getelementptr inbounds i16* %a, i64 %idxprom
33   %tmp = load i16* %arrayidx, align 2
34   %tmp1 = tail call float @llvm.convert.from.fp16.f32(i16 %tmp)
35   ret float %tmp1
36 }
37
38 define double @load3(i16* nocapture readonly %a, i32 %i) nounwind {
39 ; CHECK-LABEL: load3:
40 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0, w1, sxtw #1]
41 ; CHECK-NEXT: fcvt d0, [[HREG]]
42 ; CHECK-NEXT: ret
43
44   %idxprom = sext i32 %i to i64
45   %arrayidx = getelementptr inbounds i16* %a, i64 %idxprom
46   %tmp = load i16* %arrayidx, align 2
47   %conv = tail call double @llvm.convert.from.fp16.f64(i16 %tmp)
48   ret double %conv
49 }
50
51 define float @load4(i16* nocapture readonly %a, i64 %i) nounwind {
52 ; CHECK-LABEL: load4:
53 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0, x1, lsl #1]
54 ; CHECK-NEXT: fcvt s0, [[HREG]]
55 ; CHECK-NEXT: ret
56
57   %arrayidx = getelementptr inbounds i16* %a, i64 %i
58   %tmp = load i16* %arrayidx, align 2
59   %tmp1 = tail call float @llvm.convert.from.fp16.f32(i16 %tmp)
60   ret float %tmp1
61 }
62
63 define double @load5(i16* nocapture readonly %a, i64 %i) nounwind {
64 ; CHECK-LABEL: load5:
65 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0, x1, lsl #1]
66 ; CHECK-NEXT: fcvt d0, [[HREG]]
67 ; CHECK-NEXT: ret
68
69   %arrayidx = getelementptr inbounds i16* %a, i64 %i
70   %tmp = load i16* %arrayidx, align 2
71   %conv = tail call double @llvm.convert.from.fp16.f64(i16 %tmp)
72   ret double %conv
73 }
74
75 define float @load6(i16* nocapture readonly %a) nounwind {
76 ; CHECK-LABEL: load6:
77 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0, #20]
78 ; CHECK-NEXT: fcvt s0, [[HREG]]
79 ; CHECK-NEXT: ret
80
81   %arrayidx = getelementptr inbounds i16* %a, i64 10
82   %tmp = load i16* %arrayidx, align 2
83   %tmp1 = tail call float @llvm.convert.from.fp16.f32(i16 %tmp)
84   ret float %tmp1
85 }
86
87 define double @load7(i16* nocapture readonly %a) nounwind {
88 ; CHECK-LABEL: load7:
89 ; CHECK-NEXT: ldr [[HREG:h[0-9]+]], [x0, #20]
90 ; CHECK-NEXT: fcvt d0, [[HREG]]
91 ; CHECK-NEXT: ret
92
93   %arrayidx = getelementptr inbounds i16* %a, i64 10
94   %tmp = load i16* %arrayidx, align 2
95   %conv = tail call double @llvm.convert.from.fp16.f64(i16 %tmp)
96   ret double %conv
97 }
98
99 define float @load8(i16* nocapture readonly %a) nounwind {
100 ; CHECK-LABEL: load8:
101 ; CHECK-NEXT: ldur [[HREG:h[0-9]+]], [x0, #-20]
102 ; CHECK-NEXT: fcvt s0, [[HREG]]
103 ; CHECK-NEXT: ret
104
105   %arrayidx = getelementptr inbounds i16* %a, i64 -10
106   %tmp = load i16* %arrayidx, align 2
107   %tmp1 = tail call float @llvm.convert.from.fp16.f32(i16 %tmp)
108   ret float %tmp1
109 }
110
111 define double @load9(i16* nocapture readonly %a) nounwind {
112 ; CHECK-LABEL: load9:
113 ; CHECK-NEXT: ldur [[HREG:h[0-9]+]], [x0, #-20]
114 ; CHECK-NEXT: fcvt d0, [[HREG]]
115 ; CHECK-NEXT: ret
116
117   %arrayidx = getelementptr inbounds i16* %a, i64 -10
118   %tmp = load i16* %arrayidx, align 2
119   %conv = tail call double @llvm.convert.from.fp16.f64(i16 %tmp)
120   ret double %conv
121 }
122
123 define void @store0(i16* nocapture %a, float %val) nounwind {
124 ; CHECK-LABEL: store0:
125 ; CHECK-NEXT: fcvt h0, s0
126 ; CHECK-NEXT: str  h0, [x0]
127 ; CHECK-NEXT: ret
128
129   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %val)
130   store i16 %tmp, i16* %a, align 2
131   ret void
132 }
133
134 define void @store1(i16* nocapture %a, double %val) nounwind {
135 ; CHECK-LABEL: store1:
136 ; CHECK-NEXT: fcvt h0, d0
137 ; CHECK-NEXT: str  h0, [x0]
138 ; CHECK-NEXT: ret
139
140   %conv = fptrunc double %val to float
141   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %conv)
142   store i16 %tmp, i16* %a, align 2
143   ret void
144 }
145
146 define void @store2(i16* nocapture %a, i32 %i, float %val) nounwind {
147 ; CHECK-LABEL: store2:
148 ; CHECK-NEXT: fcvt h0, s0
149 ; CHECK-NEXT: str h0, [x0, w1, sxtw #1]
150 ; CHECK-NEXT: ret
151
152   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %val)
153   %idxprom = sext i32 %i to i64
154   %arrayidx = getelementptr inbounds i16* %a, i64 %idxprom
155   store i16 %tmp, i16* %arrayidx, align 2
156   ret void
157 }
158
159 define void @store3(i16* nocapture %a, i32 %i, double %val) nounwind {
160 ; CHECK-LABEL: store3:
161 ; CHECK-NEXT: fcvt h0, d0
162 ; CHECK-NEXT: str h0, [x0, w1, sxtw #1]
163 ; CHECK-NEXT: ret
164
165   %conv = fptrunc double %val to float
166   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %conv)
167   %idxprom = sext i32 %i to i64
168   %arrayidx = getelementptr inbounds i16* %a, i64 %idxprom
169   store i16 %tmp, i16* %arrayidx, align 2
170   ret void
171 }
172
173 define void @store4(i16* nocapture %a, i64 %i, float %val) nounwind {
174 ; CHECK-LABEL: store4:
175 ; CHECK-NEXT: fcvt h0, s0
176 ; CHECK-NEXT: str h0, [x0, x1, lsl #1]
177 ; CHECK-NEXT: ret
178
179   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %val)
180   %arrayidx = getelementptr inbounds i16* %a, i64 %i
181   store i16 %tmp, i16* %arrayidx, align 2
182   ret void
183 }
184
185 define void @store5(i16* nocapture %a, i64 %i, double %val) nounwind {
186 ; CHECK-LABEL: store5:
187 ; CHECK-NEXT: fcvt h0, d0
188 ; CHECK-NEXT: str h0, [x0, x1, lsl #1]
189 ; CHECK-NEXT: ret
190
191   %conv = fptrunc double %val to float
192   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %conv)
193   %arrayidx = getelementptr inbounds i16* %a, i64 %i
194   store i16 %tmp, i16* %arrayidx, align 2
195   ret void
196 }
197
198 define void @store6(i16* nocapture %a, float %val) nounwind {
199 ; CHECK-LABEL: store6:
200 ; CHECK-NEXT: fcvt h0, s0
201 ; CHECK-NEXT: str h0, [x0, #20]
202 ; CHECK-NEXT: ret
203
204   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %val)
205   %arrayidx = getelementptr inbounds i16* %a, i64 10
206   store i16 %tmp, i16* %arrayidx, align 2
207   ret void
208 }
209
210 define void @store7(i16* nocapture %a, double %val) nounwind {
211 ; CHECK-LABEL: store7:
212 ; CHECK-NEXT: fcvt h0, d0
213 ; CHECK-NEXT: str h0, [x0, #20]
214 ; CHECK-NEXT: ret
215
216   %conv = fptrunc double %val to float
217   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %conv)
218   %arrayidx = getelementptr inbounds i16* %a, i64 10
219   store i16 %tmp, i16* %arrayidx, align 2
220   ret void
221 }
222
223 define void @store8(i16* nocapture %a, float %val) nounwind {
224 ; CHECK-LABEL: store8:
225 ; CHECK-NEXT: fcvt h0, s0
226 ; CHECK-NEXT: stur h0, [x0, #-20]
227 ; CHECK-NEXT: ret
228
229   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %val)
230   %arrayidx = getelementptr inbounds i16* %a, i64 -10
231   store i16 %tmp, i16* %arrayidx, align 2
232   ret void
233 }
234
235 define void @store9(i16* nocapture %a, double %val) nounwind {
236 ; CHECK-LABEL: store9:
237 ; CHECK-NEXT: fcvt h0, d0
238 ; CHECK-NEXT: stur h0, [x0, #-20]
239 ; CHECK-NEXT: ret
240
241   %conv = fptrunc double %val to float
242   %tmp = tail call i16 @llvm.convert.to.fp16.f32(float %conv)
243   %arrayidx = getelementptr inbounds i16* %a, i64 -10
244   store i16 %tmp, i16* %arrayidx, align 2
245   ret void
246 }
247
248 declare i16 @llvm.convert.to.fp16.f32(float) nounwind readnone
249 declare float @llvm.convert.from.fp16.f32(i16) nounwind readnone
250 declare i16 @llvm.convert.to.fp16.f64(double) nounwind readnone
251 declare double @llvm.convert.from.fp16.f64(i16) nounwind readnone