9efe6d0fe4e7d98ed65f91a833a53c4f2d2512a3
[oota-llvm.git] / test / Analysis / Profiling / load-branch-weights-switches.ll
1 ; RUN: opt -insert-edge-profiling -o %t1 < %s
2 ; RUN: rm -f %t1.prof_data
3 ; RUN: lli -load %llvmshlibdir/libprofile_rt%shlibext %t1 \
4 ; RUN:     -llvmprof-output %t1.prof_data
5 ; RUN: opt -profile-file %t1.prof_data -profile-metadata-loader -S -o - < %s \
6 ; RUN:     | FileCheck %s
7 ; RUN: rm -f %t1.prof_data
8
9 ;; func_switch - Test branch probabilities for a switch instruction with an
10 ;; even chance of taking each case (or no case).
11 define i32 @func_switch(i32 %N) nounwind uwtable {
12 entry:
13   %retval = alloca i32, align 4
14   %N.addr = alloca i32, align 4
15   store i32 %N, i32* %N.addr, align 4
16   %0 = load i32* %N.addr, align 4
17   %rem = srem i32 %0, 4
18   switch i32 %rem, label %sw.epilog [
19     i32 0, label %sw.bb
20     i32 1, label %sw.bb1
21     i32 2, label %sw.bb2
22   ]
23 ; CHECK: ], !prof !0
24
25 sw.bb:
26   store i32 5, i32* %retval
27   br label %return
28
29 sw.bb1:
30   store i32 6, i32* %retval
31   br label %return
32
33 sw.bb2:
34   store i32 7, i32* %retval
35   br label %return
36
37 sw.epilog:
38   store i32 8, i32* %retval
39   br label %return
40
41 return:
42   %1 = load i32* %retval
43   ret i32 %1
44 }
45
46 ;; func_switch_switch - Test branch probabilities in a switch-instruction that
47 ;; leads to further switch instructions.  The first-tier switch occludes some
48 ;; possibilities in the second-tier switches, leading to some branches having a
49 ;; 0 probability.
50 define i32 @func_switch_switch(i32 %N) nounwind uwtable {
51 entry:
52   %retval = alloca i32, align 4
53   %N.addr = alloca i32, align 4
54   store i32 %N, i32* %N.addr, align 4
55   %0 = load i32* %N.addr, align 4
56   %rem = srem i32 %0, 2
57   switch i32 %rem, label %sw.default11 [
58     i32 0, label %sw.bb
59     i32 1, label %sw.bb5
60   ]
61 ; CHECK: ], !prof !1
62
63 sw.bb:
64   %1 = load i32* %N.addr, align 4
65   %rem1 = srem i32 %1, 4
66   switch i32 %rem1, label %sw.default [
67     i32 0, label %sw.bb2
68     i32 1, label %sw.bb3
69     i32 2, label %sw.bb4
70   ]
71 ; CHECK: ], !prof !2
72
73 sw.bb2:
74   store i32 5, i32* %retval
75   br label %return
76
77 sw.bb3:
78   store i32 6, i32* %retval
79   br label %return
80
81 sw.bb4:
82   store i32 7, i32* %retval
83   br label %return
84
85 sw.default:
86   store i32 8, i32* %retval
87   br label %return
88
89 sw.bb5:
90   %2 = load i32* %N.addr, align 4
91   %rem6 = srem i32 %2, 4
92   switch i32 %rem6, label %sw.default10 [
93     i32 0, label %sw.bb7
94     i32 1, label %sw.bb8
95     i32 2, label %sw.bb9
96   ]
97 ; CHECK: ], !prof !3
98
99 sw.bb7:
100   store i32 9, i32* %retval
101   br label %return
102
103 sw.bb8:
104   store i32 10, i32* %retval
105   br label %return
106
107 sw.bb9:
108   store i32 11, i32* %retval
109   br label %return
110
111 sw.default10:
112   store i32 12, i32* %retval
113   br label %return
114
115 sw.default11:
116   store i32 13, i32* %retval
117   br label %return
118
119 return:
120   %3 = load i32* %retval
121   ret i32 %3
122 }
123
124 define i32 @main(i32 %argc, i8** %argv) nounwind uwtable {
125 entry:
126   %retval = alloca i32, align 4
127   %argc.addr = alloca i32, align 4
128   %argv.addr = alloca i8**, align 8
129   %loop = alloca i32, align 4
130   store i32 0, i32* %retval
131   store i32 0, i32* %loop, align 4
132   br label %for.cond
133
134 for.cond:
135   %0 = load i32* %loop, align 4
136   %cmp = icmp slt i32 %0, 4000
137   br i1 %cmp, label %for.body, label %for.end
138 ; CHECK: br i1 %cmp, label %for.body, label %for.end, !prof !4
139
140 for.body:
141   %1 = load i32* %loop, align 4
142   %call = call i32 @func_switch(i32 %1)
143   %2 = load i32* %loop, align 4
144   %call1 = call i32 @func_switch_switch(i32 %2)
145   br label %for.inc
146
147 for.inc:
148   %3 = load i32* %loop, align 4
149   %inc = add nsw i32 %3, 1
150   store i32 %inc, i32* %loop, align 4
151   br label %for.cond
152
153 for.end:
154   ret i32 0
155 }
156
157 ; CHECK: !0 = metadata !{metadata !"branch_weights", i32 1000, i32 1000, i32 1000, i32 1000}
158 ; CHECK: !1 = metadata !{metadata !"branch_weights", i32 0, i32 2000, i32 2000}
159 ; CHECK: !2 = metadata !{metadata !"branch_weights", i32 0, i32 1000, i32 0, i32 1000}
160 ; CHECK: !3 = metadata !{metadata !"branch_weights", i32 1000, i32 0, i32 1000, i32 0}
161 ; CHECK: !4 = metadata !{metadata !"branch_weights", i32 4000, i32 1}
162 ; CHECK-NOT: !5