Enhance llvm::SourceMgr to support diagnostic ranges, the same way clang does. Enhance
[oota-llvm.git] / lib / Support / SourceMgr.cpp
1 //===- SourceMgr.cpp - Manager for Simple Source Buffers & Diagnostics ----===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file implements the SourceMgr class.  This class is used as a simple
11 // substrate for diagnostics, #include handling, and other low level things for
12 // simple parsers.
13 //
14 //===----------------------------------------------------------------------===//
15
16 #include "llvm/ADT/Twine.h"
17 #include "llvm/Support/SourceMgr.h"
18 #include "llvm/Support/MemoryBuffer.h"
19 #include "llvm/ADT/OwningPtr.h"
20 #include "llvm/Support/raw_ostream.h"
21 #include "llvm/Support/system_error.h"
22 using namespace llvm;
23
24 namespace {
25   struct LineNoCacheTy {
26     int LastQueryBufferID;
27     const char *LastQuery;
28     unsigned LineNoOfQuery;
29   };
30 }
31
32 static LineNoCacheTy *getCache(void *Ptr) {
33   return (LineNoCacheTy*)Ptr;
34 }
35
36
37 SourceMgr::~SourceMgr() {
38   // Delete the line # cache if allocated.
39   if (LineNoCacheTy *Cache = getCache(LineNoCache))
40     delete Cache;
41
42   while (!Buffers.empty()) {
43     delete Buffers.back().Buffer;
44     Buffers.pop_back();
45   }
46 }
47
48 /// AddIncludeFile - Search for a file with the specified name in the current
49 /// directory or in one of the IncludeDirs.  If no file is found, this returns
50 /// ~0, otherwise it returns the buffer ID of the stacked file.
51 unsigned SourceMgr::AddIncludeFile(const std::string &Filename,
52                                    SMLoc IncludeLoc,
53                                    std::string &IncludedFile) {
54   OwningPtr<MemoryBuffer> NewBuf;
55   IncludedFile = Filename;
56   MemoryBuffer::getFile(IncludedFile.c_str(), NewBuf);
57
58   // If the file didn't exist directly, see if it's in an include path.
59   for (unsigned i = 0, e = IncludeDirectories.size(); i != e && !NewBuf; ++i) {
60     IncludedFile = IncludeDirectories[i] + "/" + Filename;
61     MemoryBuffer::getFile(IncludedFile.c_str(), NewBuf);
62   }
63
64   if (NewBuf == 0) return ~0U;
65
66   return AddNewSourceBuffer(NewBuf.take(), IncludeLoc);
67 }
68
69
70 /// FindBufferContainingLoc - Return the ID of the buffer containing the
71 /// specified location, returning -1 if not found.
72 int SourceMgr::FindBufferContainingLoc(SMLoc Loc) const {
73   for (unsigned i = 0, e = Buffers.size(); i != e; ++i)
74     if (Loc.getPointer() >= Buffers[i].Buffer->getBufferStart() &&
75         // Use <= here so that a pointer to the null at the end of the buffer
76         // is included as part of the buffer.
77         Loc.getPointer() <= Buffers[i].Buffer->getBufferEnd())
78       return i;
79   return -1;
80 }
81
82 /// FindLineNumber - Find the line number for the specified location in the
83 /// specified file.  This is not a fast method.
84 unsigned SourceMgr::FindLineNumber(SMLoc Loc, int BufferID) const {
85   if (BufferID == -1) BufferID = FindBufferContainingLoc(Loc);
86   assert(BufferID != -1 && "Invalid Location!");
87
88   MemoryBuffer *Buff = getBufferInfo(BufferID).Buffer;
89
90   // Count the number of \n's between the start of the file and the specified
91   // location.
92   unsigned LineNo = 1;
93
94   const char *Ptr = Buff->getBufferStart();
95
96   // If we have a line number cache, and if the query is to a later point in the
97   // same file, start searching from the last query location.  This optimizes
98   // for the case when multiple diagnostics come out of one file in order.
99   if (LineNoCacheTy *Cache = getCache(LineNoCache))
100     if (Cache->LastQueryBufferID == BufferID &&
101         Cache->LastQuery <= Loc.getPointer()) {
102       Ptr = Cache->LastQuery;
103       LineNo = Cache->LineNoOfQuery;
104     }
105
106   // Scan for the location being queried, keeping track of the number of lines
107   // we see.
108   for (; SMLoc::getFromPointer(Ptr) != Loc; ++Ptr)
109     if (*Ptr == '\n') ++LineNo;
110
111
112   // Allocate the line number cache if it doesn't exist.
113   if (LineNoCache == 0)
114     LineNoCache = new LineNoCacheTy();
115
116   // Update the line # cache.
117   LineNoCacheTy &Cache = *getCache(LineNoCache);
118   Cache.LastQueryBufferID = BufferID;
119   Cache.LastQuery = Ptr;
120   Cache.LineNoOfQuery = LineNo;
121   return LineNo;
122 }
123
124 void SourceMgr::PrintIncludeStack(SMLoc IncludeLoc, raw_ostream &OS) const {
125   if (IncludeLoc == SMLoc()) return;  // Top of stack.
126
127   int CurBuf = FindBufferContainingLoc(IncludeLoc);
128   assert(CurBuf != -1 && "Invalid or unspecified location!");
129
130   PrintIncludeStack(getBufferInfo(CurBuf).IncludeLoc, OS);
131
132   OS << "Included from "
133      << getBufferInfo(CurBuf).Buffer->getBufferIdentifier()
134      << ":" << FindLineNumber(IncludeLoc, CurBuf) << ":\n";
135 }
136
137
138 /// GetMessage - Return an SMDiagnostic at the specified location with the
139 /// specified string.
140 ///
141 /// @param Type - If non-null, the kind of message (e.g., "error") which is
142 /// prefixed to the message.
143 SMDiagnostic SourceMgr::GetMessage(SMLoc Loc, const Twine &Msg,
144                                    const char *Type, ArrayRef<SMRange> Ranges,
145                                    bool ShowLine) const {
146
147   // First thing to do: find the current buffer containing the specified
148   // location.
149   int CurBuf = FindBufferContainingLoc(Loc);
150   assert(CurBuf != -1 && "Invalid or unspecified location!");
151
152   MemoryBuffer *CurMB = getBufferInfo(CurBuf).Buffer;
153
154   // Scan backward to find the start of the line.
155   const char *LineStart = Loc.getPointer();
156   while (LineStart != CurMB->getBufferStart() &&
157          LineStart[-1] != '\n' && LineStart[-1] != '\r')
158     --LineStart;
159
160   // Get the end of the line.
161   const char *LineEnd = Loc.getPointer();
162   while (LineEnd != CurMB->getBufferEnd() &&
163          LineEnd[0] != '\n' && LineEnd[0] != '\r')
164     ++LineEnd;
165   std::string LineStr(LineStart, LineEnd);
166
167   std::string PrintedMsg;
168   raw_string_ostream OS(PrintedMsg);
169   if (Type)
170     OS << Type << ": ";
171   OS << Msg;
172
173   // Convert any ranges to column ranges that only intersect the line of the
174   // location.
175   SmallVector<std::pair<unsigned, unsigned>, 4> ColRanges;
176   for (unsigned i = 0, e = Ranges.size(); i != e; ++i) {
177     SMRange R = Ranges[i];
178     if (!R.isValid()) continue;
179     
180     // If the line doesn't contain any part of the range, then ignore it.
181     if (R.Start.getPointer() > LineEnd || R.End.getPointer() < LineStart)
182       continue;
183    
184     // Ignore pieces of the range that go onto other lines.
185     if (R.Start.getPointer() < LineStart)
186       R.Start = SMLoc::getFromPointer(LineStart);
187     if (R.End.getPointer() > LineEnd)
188       R.End = SMLoc::getFromPointer(LineEnd);
189     
190     // Translate from SMLoc ranges to column ranges.
191     ColRanges.push_back(std::make_pair(R.Start.getPointer()-LineStart,
192                                        R.End.getPointer()-LineStart));
193   }
194   
195   return SMDiagnostic(*this, Loc,
196                       CurMB->getBufferIdentifier(), FindLineNumber(Loc, CurBuf),
197                       Loc.getPointer()-LineStart, OS.str(),
198                       LineStr, ColRanges, ShowLine);
199 }
200
201 void SourceMgr::PrintMessage(SMLoc Loc, const Twine &Msg,
202                              const char *Type, ArrayRef<SMRange> Ranges,
203                              bool ShowLine) const {
204   // Report the message with the diagnostic handler if present.
205   if (DiagHandler) {
206     DiagHandler(GetMessage(Loc, Msg, Type, Ranges, ShowLine), DiagContext);
207     return;
208   }
209
210   raw_ostream &OS = errs();
211
212   int CurBuf = FindBufferContainingLoc(Loc);
213   assert(CurBuf != -1 && "Invalid or unspecified location!");
214   PrintIncludeStack(getBufferInfo(CurBuf).IncludeLoc, OS);
215
216   GetMessage(Loc, Msg, Type, Ranges, ShowLine).print(0, OS);
217 }
218
219 //===----------------------------------------------------------------------===//
220 // SMDiagnostic Implementation
221 //===----------------------------------------------------------------------===//
222
223 SMDiagnostic::SMDiagnostic(const SourceMgr &sm, SMLoc L, const std::string &FN,
224                            int Line, int Col, const std::string &Msg,
225                            const std::string &LineStr,
226                            ArrayRef<std::pair<unsigned,unsigned> > Ranges,
227                            bool showline)
228   : SM(&sm), Loc(L), Filename(FN), LineNo(Line), ColumnNo(Col), Message(Msg),
229     LineContents(LineStr), ShowLine(showline), Ranges(Ranges.vec()) {}
230
231
232 void SMDiagnostic::print(const char *ProgName, raw_ostream &S) const {
233   if (ProgName && ProgName[0])
234     S << ProgName << ": ";
235
236   if (!Filename.empty()) {
237     if (Filename == "-")
238       S << "<stdin>";
239     else
240       S << Filename;
241
242     if (LineNo != -1) {
243       S << ':' << LineNo;
244       if (ColumnNo != -1)
245         S << ':' << (ColumnNo+1);
246     }
247     S << ": ";
248   }
249
250   S << Message << '\n';
251
252   if (LineNo == -1 || ColumnNo == -1 || !ShowLine)
253     return;
254
255   // Build the line with the caret and ranges.
256   std::string CaretLine(LineContents.size()+1, ' ');
257   
258   // Expand any ranges.
259   for (unsigned r = 0, e = Ranges.size(); r != e; ++r) {
260     std::pair<unsigned, unsigned> R = Ranges[r];
261     for (unsigned i = R.first,
262          e = std::min(R.second, (unsigned)LineContents.size())+1; i != e; ++i)
263       CaretLine[i] = '~';
264   }
265     
266   // Finally, plop on the caret.
267   if (unsigned(ColumnNo) <= LineContents.size())
268     CaretLine[ColumnNo] = '^';
269   else 
270     CaretLine[LineContents.size()] = '^';
271   
272   // ... and remove trailing whitespace so the output doesn't wrap for it.  We
273   // know that the line isn't completely empty because it has the caret in it at
274   // least.
275   CaretLine.erase(CaretLine.find_last_not_of(' ')+1);
276   
277   // Print out the source line one character at a time, so we can expand tabs.
278   for (unsigned i = 0, e = LineContents.size(), OutCol = 0; i != e; ++i) {
279     if (LineContents[i] != '\t') {
280       S << LineContents[i];
281       ++OutCol;
282       continue;
283     }
284     
285     // If we have a tab, emit at least one space, then round up to 8 columns.
286     do {
287       S << ' ';
288       ++OutCol;
289     } while (OutCol & 7);
290   }
291   S << '\n';
292
293   // Print out the caret line, matching tabs in the source line.
294   for (unsigned i = 0, e = CaretLine.size(), OutCol = 0; i != e; ++i) {
295     if (i >= LineContents.size() || LineContents[i] != '\t') {
296       S << CaretLine[i];
297       ++OutCol;
298       continue;
299     }
300     
301     // Okay, we have a tab.  Insert the appropriate number of characters.
302     do {
303       S << CaretLine[i];
304       ++OutCol;
305     } while (OutCol & 7);
306   }
307   
308   S << '\n';
309 }
310
311