1 ;RUN: llc < %s -march=r600 -mcpu=cayman -stress-sched -verify-misched
5 %0 = call float @llvm.R600.load.input(i32 4)
6 %1 = call float @llvm.R600.load.input(i32 5)
7 %2 = call float @llvm.R600.load.input(i32 6)
8 %3 = call float @llvm.R600.load.input(i32 7)
9 %4 = fcmp ult float %0, 0.000000e+00
10 %5 = select i1 %4, float 1.000000e+00, float 0.000000e+00
11 %6 = fsub float -0.000000e+00, %5
12 %7 = fptosi float %6 to i32
13 %8 = bitcast i32 %7 to float
14 %9 = bitcast float %8 to i32
15 %10 = icmp ne i32 %9, 0
16 br i1 %10, label %LOOP, label %ENDIF
18 ENDIF: ; preds = %ENDIF16, %LOOP, %main_body
19 %temp.0 = phi float [ 0.000000e+00, %main_body ], [ %temp.1, %LOOP ], [ %temp.1, %ENDIF16 ]
20 %temp1.0 = phi float [ 1.000000e+00, %main_body ], [ %temp1.1, %LOOP ], [ %temp1.1, %ENDIF16 ]
21 %temp2.0 = phi float [ 0.000000e+00, %main_body ], [ %temp2.1, %LOOP ], [ %temp2.1, %ENDIF16 ]
22 %temp3.0 = phi float [ 0.000000e+00, %main_body ], [ %temp3.1, %LOOP ], [ %temp3.1, %ENDIF16 ]
23 %11 = load <4 x float> addrspace(9)* null
24 %12 = extractelement <4 x float> %11, i32 0
25 %13 = fmul float %12, %0
26 %14 = load <4 x float> addrspace(9)* null
27 %15 = extractelement <4 x float> %14, i32 1
28 %16 = fmul float %15, %0
29 %17 = load <4 x float> addrspace(9)* null
30 %18 = extractelement <4 x float> %17, i32 2
31 %19 = fmul float %18, %0
32 %20 = load <4 x float> addrspace(9)* null
33 %21 = extractelement <4 x float> %20, i32 3
34 %22 = fmul float %21, %0
35 %23 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 1)
36 %24 = extractelement <4 x float> %23, i32 0
37 %25 = fmul float %24, %1
38 %26 = fadd float %25, %13
39 %27 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 1)
40 %28 = extractelement <4 x float> %27, i32 1
41 %29 = fmul float %28, %1
42 %30 = fadd float %29, %16
43 %31 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 1)
44 %32 = extractelement <4 x float> %31, i32 2
45 %33 = fmul float %32, %1
46 %34 = fadd float %33, %19
47 %35 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 1)
48 %36 = extractelement <4 x float> %35, i32 3
49 %37 = fmul float %36, %1
50 %38 = fadd float %37, %22
51 %39 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 2)
52 %40 = extractelement <4 x float> %39, i32 0
53 %41 = fmul float %40, %2
54 %42 = fadd float %41, %26
55 %43 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 2)
56 %44 = extractelement <4 x float> %43, i32 1
57 %45 = fmul float %44, %2
58 %46 = fadd float %45, %30
59 %47 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 2)
60 %48 = extractelement <4 x float> %47, i32 2
61 %49 = fmul float %48, %2
62 %50 = fadd float %49, %34
63 %51 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 2)
64 %52 = extractelement <4 x float> %51, i32 3
65 %53 = fmul float %52, %2
66 %54 = fadd float %53, %38
67 %55 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 3)
68 %56 = extractelement <4 x float> %55, i32 0
69 %57 = fmul float %56, %3
70 %58 = fadd float %57, %42
71 %59 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 3)
72 %60 = extractelement <4 x float> %59, i32 1
73 %61 = fmul float %60, %3
74 %62 = fadd float %61, %46
75 %63 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 3)
76 %64 = extractelement <4 x float> %63, i32 2
77 %65 = fmul float %64, %3
78 %66 = fadd float %65, %50
79 %67 = load <4 x float> addrspace(9)* getelementptr ([1024 x <4 x float>] addrspace(9)* null, i64 0, i32 3)
80 %68 = extractelement <4 x float> %67, i32 3
81 %69 = fmul float %68, %3
82 %70 = fadd float %69, %54
83 %71 = insertelement <4 x float> undef, float %58, i32 0
84 %72 = insertelement <4 x float> %71, float %62, i32 1
85 %73 = insertelement <4 x float> %72, float %66, i32 2
86 %74 = insertelement <4 x float> %73, float %70, i32 3
87 call void @llvm.R600.store.swizzle(<4 x float> %74, i32 60, i32 1)
88 %75 = insertelement <4 x float> undef, float %temp.0, i32 0
89 %76 = insertelement <4 x float> %75, float %temp1.0, i32 1
90 %77 = insertelement <4 x float> %76, float %temp2.0, i32 2
91 %78 = insertelement <4 x float> %77, float %temp3.0, i32 3
92 call void @llvm.R600.store.swizzle(<4 x float> %78, i32 0, i32 2)
95 LOOP: ; preds = %main_body, %ENDIF19
96 %temp.1 = phi float [ %93, %ENDIF19 ], [ 0.000000e+00, %main_body ]
97 %temp1.1 = phi float [ %94, %ENDIF19 ], [ 1.000000e+00, %main_body ]
98 %temp2.1 = phi float [ %95, %ENDIF19 ], [ 0.000000e+00, %main_body ]
99 %temp3.1 = phi float [ %96, %ENDIF19 ], [ 0.000000e+00, %main_body ]
100 %temp4.0 = phi float [ %97, %ENDIF19 ], [ -2.000000e+00, %main_body ]
101 %79 = fcmp uge float %temp4.0, %0
102 %80 = select i1 %79, float 1.000000e+00, float 0.000000e+00
103 %81 = fsub float -0.000000e+00, %80
104 %82 = fptosi float %81 to i32
105 %83 = bitcast i32 %82 to float
106 %84 = bitcast float %83 to i32
107 %85 = icmp ne i32 %84, 0
108 br i1 %85, label %ENDIF, label %ENDIF16
110 ENDIF16: ; preds = %LOOP
111 %86 = fcmp une float %2, %temp4.0
112 %87 = select i1 %86, float 1.000000e+00, float 0.000000e+00
113 %88 = fsub float -0.000000e+00, %87
114 %89 = fptosi float %88 to i32
115 %90 = bitcast i32 %89 to float
116 %91 = bitcast float %90 to i32
117 %92 = icmp ne i32 %91, 0
118 br i1 %92, label %ENDIF, label %ENDIF19
120 ENDIF19: ; preds = %ENDIF16
121 %93 = fadd float %temp.1, 1.000000e+00
122 %94 = fadd float %temp1.1, 0.000000e+00
123 %95 = fadd float %temp2.1, 0.000000e+00
124 %96 = fadd float %temp3.1, 0.000000e+00
125 %97 = fadd float %temp4.0, 1.000000e+00
129 declare float @llvm.R600.load.input(i32) #0
131 declare void @llvm.R600.store.swizzle(<4 x float>, i32, i32)
133 attributes #0 = { readnone }