[libFuzzer] more refactoring of the Mutator and adding tests to it
[oota-llvm.git] / lib / Fuzzer / FuzzerInternal.h
1 //===- FuzzerInternal.h - Internal header for the Fuzzer --------*- C++ -* ===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 // Define the main class fuzzer::Fuzzer and most functions.
10 //===----------------------------------------------------------------------===//
11 #include <cassert>
12 #include <climits>
13 #include <chrono>
14 #include <cstddef>
15 #include <cstdlib>
16 #include <string>
17 #include <vector>
18 #include <unordered_set>
19
20 #include "FuzzerInterface.h"
21
22 namespace fuzzer {
23 typedef std::vector<uint8_t> Unit;
24 using namespace std::chrono;
25
26 std::string FileToString(const std::string &Path);
27 Unit FileToVector(const std::string &Path);
28 void ReadDirToVectorOfUnits(const char *Path, std::vector<Unit> *V,
29                             long *Epoch);
30 void WriteToFile(const Unit &U, const std::string &Path);
31 void CopyFileToErr(const std::string &Path);
32 // Returns "Dir/FileName" or equivalent for the current OS.
33 std::string DirPlusFile(const std::string &DirPath,
34                         const std::string &FileName);
35
36 size_t Mutate_EraseByte(uint8_t *Data, size_t Size, size_t MaxSize,
37                         FuzzerRandomBase &Rand);
38 size_t Mutate_InsertByte(uint8_t *Data, size_t Size, size_t MaxSize,
39                          FuzzerRandomBase &Rand);
40 size_t Mutate_ChangeByte(uint8_t *Data, size_t Size, size_t MaxSize,
41                          FuzzerRandomBase &Rand);
42 size_t Mutate_ChangeBit(uint8_t *Data, size_t Size, size_t MaxSize,
43                        FuzzerRandomBase &Rand);
44 size_t Mutate(uint8_t *Data, size_t Size, size_t MaxSize,
45               FuzzerRandomBase &Rand);
46
47 size_t CrossOver(const uint8_t *Data1, size_t Size1, const uint8_t *Data2,
48                  size_t Size2, uint8_t *Out, size_t MaxOutSize,
49                  FuzzerRandomBase &Rand);
50
51 void Printf(const char *Fmt, ...);
52 void Print(const Unit &U, const char *PrintAfter = "");
53 void PrintASCII(const Unit &U, const char *PrintAfter = "");
54 std::string Hash(const Unit &U);
55 void SetTimer(int Seconds);
56 void PrintFileAsBase64(const std::string &Path);
57 void ExecuteCommand(const std::string &Command);
58
59 // Private copy of SHA1 implementation.
60 static const int kSHA1NumBytes = 20;
61 // Computes SHA1 hash of 'Len' bytes in 'Data', writes kSHA1NumBytes to 'Out'.
62 void ComputeSHA1(const uint8_t *Data, size_t Len, uint8_t *Out);
63
64 int NumberOfCpuCores();
65
66 class Fuzzer {
67  public:
68   struct FuzzingOptions {
69     int Verbosity = 1;
70     int MaxLen = 0;
71     int UnitTimeoutSec = 300;
72     bool DoCrossOver = true;
73     int  MutateDepth = 5;
74     bool ExitOnFirst = false;
75     bool UseCounters = false;
76     bool UseTraces = false;
77     bool UseFullCoverageSet  = false;
78     bool Reload = true;
79     int PreferSmallDuringInitialShuffle = -1;
80     size_t MaxNumberOfRuns = ULONG_MAX;
81     int SyncTimeout = 600;
82     std::string OutputCorpus;
83     std::string SyncCommand;
84     std::vector<std::string> Tokens;
85   };
86   Fuzzer(UserSuppliedFuzzer &USF, FuzzingOptions Options);
87   void AddToCorpus(const Unit &U) { Corpus.push_back(U); }
88   void Loop(size_t NumIterations);
89   void ShuffleAndMinimize();
90   void InitializeTraceState();
91   size_t CorpusSize() const { return Corpus.size(); }
92   void ReadDir(const std::string &Path, long *Epoch) {
93     ReadDirToVectorOfUnits(Path.c_str(), &Corpus, Epoch);
94   }
95   void RereadOutputCorpus();
96   // Save the current corpus to OutputCorpus.
97   void SaveCorpus();
98
99   size_t secondsSinceProcessStartUp() {
100     return duration_cast<seconds>(system_clock::now() - ProcessStartTime)
101         .count();
102   }
103
104   size_t getTotalNumberOfRuns() { return TotalNumberOfRuns; }
105
106   static void StaticAlarmCallback();
107
108   Unit SubstituteTokens(const Unit &U) const;
109
110  private:
111   void AlarmCallback();
112   void ExecuteCallback(const Unit &U);
113   void MutateAndTestOne(Unit *U);
114   void ReportNewCoverage(size_t NewCoverage, const Unit &U);
115   size_t RunOne(const Unit &U);
116   void RunOneAndUpdateCorpus(const Unit &U);
117   size_t RunOneMaximizeTotalCoverage(const Unit &U);
118   size_t RunOneMaximizeFullCoverageSet(const Unit &U);
119   size_t RunOneMaximizeCoveragePairs(const Unit &U);
120   void WriteToOutputCorpus(const Unit &U);
121   void WriteUnitToFileWithPrefix(const Unit &U, const char *Prefix);
122   void PrintStats(const char *Where, size_t Cov, const char *End = "\n");
123   void PrintUnitInASCIIOrTokens(const Unit &U, const char *PrintAfter = "");
124
125   void SyncCorpus();
126
127   // Trace-based fuzzing: we run a unit with some kind of tracing
128   // enabled and record potentially useful mutations. Then
129   // We apply these mutations one by one to the unit and run it again.
130
131   // Start tracing; forget all previously proposed mutations.
132   void StartTraceRecording();
133   // Stop tracing and return the number of proposed mutations.
134   size_t StopTraceRecording();
135   // Apply Idx-th trace-based mutation to U.
136   void ApplyTraceBasedMutation(size_t Idx, Unit *U);
137
138   void SetDeathCallback();
139   static void StaticDeathCallback();
140   void DeathCallback();
141   Unit CurrentUnit;
142
143   size_t TotalNumberOfRuns = 0;
144
145   std::vector<Unit> Corpus;
146   std::unordered_set<std::string> UnitHashesAddedToCorpus;
147   std::unordered_set<uintptr_t> FullCoverageSets;
148
149   // For UseCounters
150   std::vector<uint8_t> CounterBitmap;
151   size_t TotalBits() {  // Slow. Call it only for printing stats.
152     size_t Res = 0;
153     for (auto x : CounterBitmap) Res += __builtin_popcount(x);
154     return Res;
155   }
156
157   UserSuppliedFuzzer &USF;
158   FuzzingOptions Options;
159   system_clock::time_point ProcessStartTime = system_clock::now();
160   system_clock::time_point LastExternalSync = system_clock::now();
161   system_clock::time_point UnitStartTime;
162   long TimeOfLongestUnitInSeconds = 0;
163   long EpochOfLastReadOfOutputCorpus = 0;
164 };
165
166 class SimpleUserSuppliedFuzzer: public UserSuppliedFuzzer {
167  public:
168   SimpleUserSuppliedFuzzer(FuzzerRandomBase *Rand, UserCallback Callback)
169       : UserSuppliedFuzzer(Rand), Callback(Callback) {}
170   virtual void TargetFunction(const uint8_t *Data, size_t Size) {
171     return Callback(Data, Size);
172   }
173
174  private:
175   UserCallback Callback;
176 };
177
178 };  // namespace fuzzer