Sample profiles - Add a name table to the binary encoding.
[oota-llvm.git] / include / llvm / ProfileData / SampleProf.h
1 //=-- SampleProf.h - Sampling profiling format support --------------------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file contains common definitions used in the reading and writing of
11 // sample profile data.
12 //
13 //===----------------------------------------------------------------------===//
14 #ifndef LLVM_PROFILEDATA_SAMPLEPROF_H_
15 #define LLVM_PROFILEDATA_SAMPLEPROF_H_
16
17 #include "llvm/ADT/DenseMap.h"
18 #include "llvm/ADT/SmallVector.h"
19 #include "llvm/ADT/StringMap.h"
20 #include "llvm/Support/Debug.h"
21 #include "llvm/Support/ErrorOr.h"
22 #include "llvm/Support/raw_ostream.h"
23 #include <system_error>
24
25 namespace llvm {
26
27 const std::error_category &sampleprof_category();
28
29 enum class sampleprof_error {
30   success = 0,
31   bad_magic,
32   unsupported_version,
33   too_large,
34   truncated,
35   malformed,
36   unrecognized_format,
37   unsupported_writing_format,
38   truncated_name_table,
39   not_implemented
40 };
41
42 inline std::error_code make_error_code(sampleprof_error E) {
43   return std::error_code(static_cast<int>(E), sampleprof_category());
44 }
45
46 } // end namespace llvm
47
48 namespace std {
49 template <>
50 struct is_error_code_enum<llvm::sampleprof_error> : std::true_type {};
51 }
52
53 namespace llvm {
54
55 namespace sampleprof {
56
57 static inline uint64_t SPMagic() {
58   return uint64_t('S') << (64 - 8) | uint64_t('P') << (64 - 16) |
59          uint64_t('R') << (64 - 24) | uint64_t('O') << (64 - 32) |
60          uint64_t('F') << (64 - 40) | uint64_t('4') << (64 - 48) |
61          uint64_t('2') << (64 - 56) | uint64_t(0xff);
62 }
63
64 static inline uint64_t SPVersion() { return 101; }
65
66 /// Represents the relative location of an instruction.
67 ///
68 /// Instruction locations are specified by the line offset from the
69 /// beginning of the function (marked by the line where the function
70 /// header is) and the discriminator value within that line.
71 ///
72 /// The discriminator value is useful to distinguish instructions
73 /// that are on the same line but belong to different basic blocks
74 /// (e.g., the two post-increment instructions in "if (p) x++; else y++;").
75 struct LineLocation {
76   LineLocation(int L, unsigned D) : LineOffset(L), Discriminator(D) {}
77   int LineOffset;
78   unsigned Discriminator;
79 };
80
81 /// Represents the relative location of a callsite.
82 ///
83 /// Callsite locations are specified by the line offset from the
84 /// beginning of the function (marked by the line where the function
85 /// head is), the discriminator value within that line, and the callee
86 /// function name.
87 struct CallsiteLocation : public LineLocation {
88   CallsiteLocation(int L, unsigned D, StringRef N)
89       : LineLocation(L, D), CalleeName(N) {}
90   StringRef CalleeName;
91 };
92
93 } // End namespace sampleprof
94
95 template <> struct DenseMapInfo<sampleprof::LineLocation> {
96   typedef DenseMapInfo<int> OffsetInfo;
97   typedef DenseMapInfo<unsigned> DiscriminatorInfo;
98   static inline sampleprof::LineLocation getEmptyKey() {
99     return sampleprof::LineLocation(OffsetInfo::getEmptyKey(),
100                                     DiscriminatorInfo::getEmptyKey());
101   }
102   static inline sampleprof::LineLocation getTombstoneKey() {
103     return sampleprof::LineLocation(OffsetInfo::getTombstoneKey(),
104                                     DiscriminatorInfo::getTombstoneKey());
105   }
106   static inline unsigned getHashValue(sampleprof::LineLocation Val) {
107     return DenseMapInfo<std::pair<int, unsigned>>::getHashValue(
108         std::pair<int, unsigned>(Val.LineOffset, Val.Discriminator));
109   }
110   static inline bool isEqual(sampleprof::LineLocation LHS,
111                              sampleprof::LineLocation RHS) {
112     return LHS.LineOffset == RHS.LineOffset &&
113            LHS.Discriminator == RHS.Discriminator;
114   }
115 };
116
117 template <> struct DenseMapInfo<sampleprof::CallsiteLocation> {
118   typedef DenseMapInfo<int> OffsetInfo;
119   typedef DenseMapInfo<unsigned> DiscriminatorInfo;
120   typedef DenseMapInfo<StringRef> CalleeNameInfo;
121   static inline sampleprof::CallsiteLocation getEmptyKey() {
122     return sampleprof::CallsiteLocation(OffsetInfo::getEmptyKey(),
123                                         DiscriminatorInfo::getEmptyKey(), "");
124   }
125   static inline sampleprof::CallsiteLocation getTombstoneKey() {
126     return sampleprof::CallsiteLocation(OffsetInfo::getTombstoneKey(),
127                                         DiscriminatorInfo::getTombstoneKey(),
128                                         "");
129   }
130   static inline unsigned getHashValue(sampleprof::CallsiteLocation Val) {
131     return DenseMapInfo<std::pair<int, unsigned>>::getHashValue(
132         std::pair<int, unsigned>(Val.LineOffset, Val.Discriminator));
133   }
134   static inline bool isEqual(sampleprof::CallsiteLocation LHS,
135                              sampleprof::CallsiteLocation RHS) {
136     return LHS.LineOffset == RHS.LineOffset &&
137            LHS.Discriminator == RHS.Discriminator &&
138            LHS.CalleeName.equals(RHS.CalleeName);
139   }
140 };
141
142 namespace sampleprof {
143
144 /// Representation of a single sample record.
145 ///
146 /// A sample record is represented by a positive integer value, which
147 /// indicates how frequently was the associated line location executed.
148 ///
149 /// Additionally, if the associated location contains a function call,
150 /// the record will hold a list of all the possible called targets. For
151 /// direct calls, this will be the exact function being invoked. For
152 /// indirect calls (function pointers, virtual table dispatch), this
153 /// will be a list of one or more functions.
154 class SampleRecord {
155 public:
156   typedef StringMap<unsigned> CallTargetMap;
157
158   SampleRecord() : NumSamples(0), CallTargets() {}
159
160   /// Increment the number of samples for this record by \p S.
161   ///
162   /// Sample counts accumulate using saturating arithmetic, to avoid wrapping
163   /// around unsigned integers.
164   void addSamples(unsigned S) {
165     if (NumSamples <= std::numeric_limits<unsigned>::max() - S)
166       NumSamples += S;
167     else
168       NumSamples = std::numeric_limits<unsigned>::max();
169   }
170
171   /// Add called function \p F with samples \p S.
172   ///
173   /// Sample counts accumulate using saturating arithmetic, to avoid wrapping
174   /// around unsigned integers.
175   void addCalledTarget(StringRef F, unsigned S) {
176     unsigned &TargetSamples = CallTargets[F];
177     if (TargetSamples <= std::numeric_limits<unsigned>::max() - S)
178       TargetSamples += S;
179     else
180       TargetSamples = std::numeric_limits<unsigned>::max();
181   }
182
183   /// Return true if this sample record contains function calls.
184   bool hasCalls() const { return CallTargets.size() > 0; }
185
186   unsigned getSamples() const { return NumSamples; }
187   const CallTargetMap &getCallTargets() const { return CallTargets; }
188
189   /// Merge the samples in \p Other into this record.
190   void merge(const SampleRecord &Other) {
191     addSamples(Other.getSamples());
192     for (const auto &I : Other.getCallTargets())
193       addCalledTarget(I.first(), I.second);
194   }
195
196 private:
197   unsigned NumSamples;
198   CallTargetMap CallTargets;
199 };
200
201 typedef DenseMap<LineLocation, SampleRecord> BodySampleMap;
202 class FunctionSamples;
203 typedef DenseMap<CallsiteLocation, FunctionSamples> CallsiteSampleMap;
204
205 /// Representation of the samples collected for a function.
206 ///
207 /// This data structure contains all the collected samples for the body
208 /// of a function. Each sample corresponds to a LineLocation instance
209 /// within the body of the function.
210 class FunctionSamples {
211 public:
212   FunctionSamples() : TotalSamples(0), TotalHeadSamples(0) {}
213   void print(raw_ostream &OS = dbgs(), unsigned Indent = 0) const;
214   void addTotalSamples(unsigned Num) { TotalSamples += Num; }
215   void addHeadSamples(unsigned Num) { TotalHeadSamples += Num; }
216   void addBodySamples(int LineOffset, unsigned Discriminator, unsigned Num) {
217     assert(LineOffset >= 0);
218     BodySamples[LineLocation(LineOffset, Discriminator)].addSamples(Num);
219   }
220   void addCalledTargetSamples(int LineOffset, unsigned Discriminator,
221                               std::string FName, unsigned Num) {
222     assert(LineOffset >= 0);
223     BodySamples[LineLocation(LineOffset, Discriminator)].addCalledTarget(FName,
224                                                                          Num);
225   }
226
227   /// Return the number of samples collected at the given location.
228   /// Each location is specified by \p LineOffset and \p Discriminator.
229   /// If the location is not found in profile, return error.
230   ErrorOr<unsigned> findSamplesAt(int LineOffset,
231                                   unsigned Discriminator) const {
232     const auto &ret = BodySamples.find(LineLocation(LineOffset, Discriminator));
233     if (ret == BodySamples.end())
234       return std::error_code();
235     else
236       return ret->second.getSamples();
237   }
238
239   /// Return the function samples at the given callsite location.
240   FunctionSamples &functionSamplesAt(const CallsiteLocation &Loc) {
241     return CallsiteSamples[Loc];
242   }
243
244   /// Return a pointer to function samples at the given callsite location.
245   const FunctionSamples *
246   findFunctionSamplesAt(const CallsiteLocation &Loc) const {
247     auto iter = CallsiteSamples.find(Loc);
248     if (iter == CallsiteSamples.end()) {
249       return NULL;
250     } else {
251       return &iter->second;
252     }
253   }
254
255   bool empty() const { return TotalSamples == 0; }
256
257   /// Return the total number of samples collected inside the function.
258   unsigned getTotalSamples() const { return TotalSamples; }
259
260   /// Return the total number of samples collected at the head of the
261   /// function.
262   unsigned getHeadSamples() const { return TotalHeadSamples; }
263
264   /// Return all the samples collected in the body of the function.
265   const BodySampleMap &getBodySamples() const { return BodySamples; }
266
267   /// Return all the callsite samples collected in the body of the function.
268   const CallsiteSampleMap &getCallsiteSamples() const {
269     return CallsiteSamples;
270   }
271
272   /// Merge the samples in \p Other into this one.
273   void merge(const FunctionSamples &Other) {
274     addTotalSamples(Other.getTotalSamples());
275     addHeadSamples(Other.getHeadSamples());
276     for (const auto &I : Other.getBodySamples()) {
277       const LineLocation &Loc = I.first;
278       const SampleRecord &Rec = I.second;
279       BodySamples[Loc].merge(Rec);
280     }
281     for (const auto &I : Other.getCallsiteSamples()) {
282       const CallsiteLocation &Loc = I.first;
283       const FunctionSamples &Rec = I.second;
284       functionSamplesAt(Loc).merge(Rec);
285     }
286   }
287
288 private:
289   /// Total number of samples collected inside this function.
290   ///
291   /// Samples are cumulative, they include all the samples collected
292   /// inside this function and all its inlined callees.
293   unsigned TotalSamples;
294
295   /// Total number of samples collected at the head of the function.
296   /// This is an approximation of the number of calls made to this function
297   /// at runtime.
298   unsigned TotalHeadSamples;
299
300   /// Map instruction locations to collected samples.
301   ///
302   /// Each entry in this map contains the number of samples
303   /// collected at the corresponding line offset. All line locations
304   /// are an offset from the start of the function.
305   BodySampleMap BodySamples;
306
307   /// Map call sites to collected samples for the called function.
308   ///
309   /// Each entry in this map corresponds to all the samples
310   /// collected for the inlined function call at the given
311   /// location. For example, given:
312   ///
313   ///     void foo() {
314   ///  1    bar();
315   ///  ...
316   ///  8    baz();
317   ///     }
318   ///
319   /// If the bar() and baz() calls were inlined inside foo(), this
320   /// map will contain two entries.  One for all the samples collected
321   /// in the call to bar() at line offset 1, the other for all the samples
322   /// collected in the call to baz() at line offset 8.
323   CallsiteSampleMap CallsiteSamples;
324 };
325
326 } // End namespace sampleprof
327
328 } // End namespace llvm
329
330 #endif // LLVM_PROFILEDATA_SAMPLEPROF_H_