Optimized FCMP_OEQ and FCMP_UNE for x86.
[oota-llvm.git] / test / CodeGen / X86 / stack-align.ll
1 ; RUN: llvm-as < %s | llc -relocation-model=static -mcpu=yonah | grep {andpd.*4(%esp), %xmm}
2
3 ; The double argument is at 4(esp) which is 16-byte aligned, allowing us to
4 ; fold the load into the andpd.
5
6 target datalayout = "e-p:32:32:32-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:32:64-f32:32:32-f64:32:64-v64:64:64-v128:128:128-a0:0:64-f80:128:128"
7 target triple = "i686-apple-darwin8"
8 @G = external global double
9
10 define void @test({ double, double }* byval  %z, double* %P) {
11 entry:
12         %tmp = getelementptr { double, double }* %z, i32 0, i32 0               ; <double*> [#uses=1]
13         %tmp1 = load double* %tmp, align 8              ; <double> [#uses=1]
14         %tmp2 = tail call double @fabs( double %tmp1 )          ; <double> [#uses=1]
15         %tmp3 = load double* @G, align 16               ; <double> [#uses=1]
16         %tmp4 = tail call double @fabs( double %tmp3 )          ; <double> [#uses=1]
17         %tmp6 = add double %tmp4, %tmp2         ; <double> [#uses=1]
18         store double %tmp6, double* %P, align 8
19         ret void
20 }
21
22 declare double @fabs(double)