Add a new pass to simplify specific half_powr function calls. This is
[oota-llvm.git] / test / Transforms / SimplifyLibCalls / half-powr.ll
1 ; RUN: llvm-as < %s | opt -simplify-libcalls-halfpowr | llvm-dis | %prcontext {mul float} 1 | grep {mul float} | count 8
2
3 define float @__half_powrf4(float %f, float %g) nounwind readnone {
4 entry:
5         %0 = fcmp olt float %f, 2.000000e+00            ; <i1> [#uses=1]
6         br i1 %0, label %bb, label %bb1
7
8 bb:             ; preds = %entry
9         %1 = fdiv float %f, 3.000000e+00                ; <float> [#uses=1]
10         br label %bb1
11
12 bb1:            ; preds = %bb, %entry
13         %f_addr.0 = phi float [ %1, %bb ], [ %f, %entry ]               ; <float> [#uses=1]
14         %2 = mul float %f_addr.0, %g            ; <float> [#uses=1]
15         ret float %2
16 }
17
18 define void @foo(float* %p) nounwind {
19 entry:
20         %0 = load float* %p, align 4            ; <float> [#uses=1]
21         %1 = getelementptr float* %p, i32 1             ; <float*> [#uses=1]
22         %2 = load float* %1, align 4            ; <float> [#uses=1]
23         %3 = getelementptr float* %p, i32 2             ; <float*> [#uses=1]
24         %4 = load float* %3, align 4            ; <float> [#uses=1]
25         %5 = getelementptr float* %p, i32 3             ; <float*> [#uses=1]
26         %6 = load float* %5, align 4            ; <float> [#uses=1]
27         %7 = getelementptr float* %p, i32 4             ; <float*> [#uses=1]
28         %8 = load float* %7, align 4            ; <float> [#uses=1]
29         %9 = getelementptr float* %p, i32 5             ; <float*> [#uses=1]
30         %10 = load float* %9, align 4           ; <float> [#uses=1]
31         %11 = tail call float @__half_powrf4(float %0, float %6) nounwind               ; <float> [#uses=1]
32         %12 = tail call float @__half_powrf4(float %2, float %8) nounwind               ; <float> [#uses=1]
33         %13 = tail call float @__half_powrf4(float %4, float %10) nounwind              ; <float> [#uses=1]
34         %14 = getelementptr float* %p, i32 6            ; <float*> [#uses=1]
35         store float %11, float* %14, align 4
36         %15 = getelementptr float* %p, i32 7            ; <float*> [#uses=1]
37         store float %12, float* %15, align 4
38         %16 = getelementptr float* %p, i32 8            ; <float*> [#uses=1]
39         store float %13, float* %16, align 4
40         ret void
41 }