support: add a utility function to normalise path separators
[oota-llvm.git] / include / llvm / Support / FileSystem.h
1 //===- llvm/Support/FileSystem.h - File System OS Concept -------*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file declares the llvm::sys::fs namespace. It is designed after
11 // TR2/boost filesystem (v3), but modified to remove exception handling and the
12 // path class.
13 //
14 // All functions return an error_code and their actual work via the last out
15 // argument. The out argument is defined if and only if errc::success is
16 // returned. A function may return any error code in the generic or system
17 // category. However, they shall be equivalent to any error conditions listed
18 // in each functions respective documentation if the condition applies. [ note:
19 // this does not guarantee that error_code will be in the set of explicitly
20 // listed codes, but it does guarantee that if any of the explicitly listed
21 // errors occur, the correct error_code will be used ]. All functions may
22 // return errc::not_enough_memory if there is not enough memory to complete the
23 // operation.
24 //
25 //===----------------------------------------------------------------------===//
26
27 #ifndef LLVM_SUPPORT_FILESYSTEM_H
28 #define LLVM_SUPPORT_FILESYSTEM_H
29
30 #include "llvm/ADT/IntrusiveRefCntPtr.h"
31 #include "llvm/ADT/SmallString.h"
32 #include "llvm/ADT/Twine.h"
33 #include "llvm/Support/DataTypes.h"
34 #include "llvm/Support/ErrorHandling.h"
35 #include "llvm/Support/TimeValue.h"
36 #include "llvm/Support/system_error.h"
37 #include <ctime>
38 #include <iterator>
39 #include <stack>
40 #include <string>
41 #include <tuple>
42 #include <vector>
43
44 #ifdef HAVE_SYS_STAT_H
45 #include <sys/stat.h>
46 #endif
47
48 namespace llvm {
49 namespace sys {
50 namespace fs {
51
52 /// An "enum class" enumeration for the file system's view of the type.
53 struct file_type {
54   enum Impl {
55     status_error,
56     file_not_found,
57     regular_file,
58     directory_file,
59     symlink_file,
60     block_file,
61     character_file,
62     fifo_file,
63     socket_file,
64     type_unknown
65   };
66
67   file_type(Impl V) : V(V) {}
68   operator Impl() const { return V; }
69
70 private:
71   Impl V;
72 };
73
74 /// space_info - Self explanatory.
75 struct space_info {
76   uint64_t capacity;
77   uint64_t free;
78   uint64_t available;
79 };
80
81 enum perms {
82   no_perms = 0,
83   owner_read = 0400,
84   owner_write = 0200,
85   owner_exe = 0100,
86   owner_all = owner_read | owner_write | owner_exe,
87   group_read = 040,
88   group_write = 020,
89   group_exe = 010,
90   group_all = group_read | group_write | group_exe,
91   others_read = 04,
92   others_write = 02,
93   others_exe = 01,
94   others_all = others_read | others_write | others_exe,
95   all_read = owner_read | group_read | others_read,
96   all_write = owner_write | group_write | others_write,
97   all_exe = owner_exe | group_exe | others_exe,
98   all_all = owner_all | group_all | others_all,
99   set_uid_on_exe = 04000,
100   set_gid_on_exe = 02000,
101   sticky_bit = 01000,
102   perms_not_known = 0xFFFF
103 };
104
105 // Helper functions so that you can use & and | to manipulate perms bits:
106 inline perms operator|(perms l , perms r) {
107   return static_cast<perms>(
108              static_cast<unsigned short>(l) | static_cast<unsigned short>(r)); 
109 }
110 inline perms operator&(perms l , perms r) {
111   return static_cast<perms>(
112              static_cast<unsigned short>(l) & static_cast<unsigned short>(r)); 
113 }
114 inline perms &operator|=(perms &l, perms r) {
115   l = l | r; 
116   return l; 
117 }
118 inline perms &operator&=(perms &l, perms r) {
119   l = l & r; 
120   return l; 
121 }
122 inline perms operator~(perms x) {
123   return static_cast<perms>(~static_cast<unsigned short>(x));
124 }
125
126 class UniqueID {
127   uint64_t Device;
128   uint64_t File;
129
130 public:
131   UniqueID() {}
132   UniqueID(uint64_t Device, uint64_t File) : Device(Device), File(File) {}
133   bool operator==(const UniqueID &Other) const {
134     return Device == Other.Device && File == Other.File;
135   }
136   bool operator!=(const UniqueID &Other) const { return !(*this == Other); }
137   bool operator<(const UniqueID &Other) const {
138     return std::tie(Device, File) < std::tie(Other.Device, Other.File);
139   }
140   uint64_t getDevice() const { return Device; }
141   uint64_t getFile() const { return File; }
142 };
143
144 /// file_status - Represents the result of a call to stat and friends. It has
145 ///               a platform specific member to store the result.
146 class file_status
147 {
148   #if defined(LLVM_ON_UNIX)
149   dev_t fs_st_dev;
150   ino_t fs_st_ino;
151   time_t fs_st_mtime;
152   uid_t fs_st_uid;
153   gid_t fs_st_gid;
154   off_t fs_st_size;
155   #elif defined (LLVM_ON_WIN32)
156   uint32_t LastWriteTimeHigh;
157   uint32_t LastWriteTimeLow;
158   uint32_t VolumeSerialNumber;
159   uint32_t FileSizeHigh;
160   uint32_t FileSizeLow;
161   uint32_t FileIndexHigh;
162   uint32_t FileIndexLow;
163   #endif
164   friend bool equivalent(file_status A, file_status B);
165   file_type Type;
166   perms Perms;
167 public:
168   file_status() : Type(file_type::status_error) {}
169   file_status(file_type Type) : Type(Type) {}
170
171   #if defined(LLVM_ON_UNIX)
172     file_status(file_type Type, perms Perms, dev_t Dev, ino_t Ino, time_t MTime,
173                 uid_t UID, gid_t GID, off_t Size)
174         : fs_st_dev(Dev), fs_st_ino(Ino), fs_st_mtime(MTime), fs_st_uid(UID),
175           fs_st_gid(GID), fs_st_size(Size), Type(Type), Perms(Perms) {}
176   #elif defined(LLVM_ON_WIN32)
177     file_status(file_type Type, uint32_t LastWriteTimeHigh,
178                 uint32_t LastWriteTimeLow, uint32_t VolumeSerialNumber,
179                 uint32_t FileSizeHigh, uint32_t FileSizeLow,
180                 uint32_t FileIndexHigh, uint32_t FileIndexLow)
181         : LastWriteTimeHigh(LastWriteTimeHigh),
182           LastWriteTimeLow(LastWriteTimeLow),
183           VolumeSerialNumber(VolumeSerialNumber), FileSizeHigh(FileSizeHigh),
184           FileSizeLow(FileSizeLow), FileIndexHigh(FileIndexHigh),
185           FileIndexLow(FileIndexLow), Type(Type), Perms(perms_not_known) {}
186   #endif
187
188   // getters
189   file_type type() const { return Type; }
190   perms permissions() const { return Perms; }
191   TimeValue getLastModificationTime() const;
192   UniqueID getUniqueID() const;
193
194   #if defined(LLVM_ON_UNIX)
195   uint32_t getUser() const { return fs_st_uid; }
196   uint32_t getGroup() const { return fs_st_gid; }
197   uint64_t getSize() const { return fs_st_size; }
198   #elif defined (LLVM_ON_WIN32)
199   uint32_t getUser() const {
200     return 9999; // Not applicable to Windows, so...
201   }
202   uint32_t getGroup() const {
203     return 9999; // Not applicable to Windows, so...
204   }
205   uint64_t getSize() const {
206     return (uint64_t(FileSizeHigh) << 32) + FileSizeLow;
207   }
208   #endif
209
210   // setters
211   void type(file_type v) { Type = v; }
212   void permissions(perms p) { Perms = p; }
213 };
214
215 /// file_magic - An "enum class" enumeration of file types based on magic (the first
216 ///         N bytes of the file).
217 struct file_magic {
218   enum Impl {
219     unknown = 0,              ///< Unrecognized file
220     bitcode,                  ///< Bitcode file
221     archive,                  ///< ar style archive file
222     elf_relocatable,          ///< ELF Relocatable object file
223     elf_executable,           ///< ELF Executable image
224     elf_shared_object,        ///< ELF dynamically linked shared lib
225     elf_core,                 ///< ELF core image
226     macho_object,             ///< Mach-O Object file
227     macho_executable,         ///< Mach-O Executable
228     macho_fixed_virtual_memory_shared_lib, ///< Mach-O Shared Lib, FVM
229     macho_core,               ///< Mach-O Core File
230     macho_preload_executable, ///< Mach-O Preloaded Executable
231     macho_dynamically_linked_shared_lib, ///< Mach-O dynlinked shared lib
232     macho_dynamic_linker,     ///< The Mach-O dynamic linker
233     macho_bundle,             ///< Mach-O Bundle file
234     macho_dynamically_linked_shared_lib_stub, ///< Mach-O Shared lib stub
235     macho_dsym_companion,     ///< Mach-O dSYM companion file
236     macho_universal_binary,   ///< Mach-O universal binary
237     coff_object,              ///< COFF object file
238     coff_import_library,      ///< COFF import library
239     pecoff_executable,        ///< PECOFF executable file
240     windows_resource          ///< Windows compiled resource file (.rc)
241   };
242
243   bool is_object() const {
244     return V == unknown ? false : true;
245   }
246
247   file_magic() : V(unknown) {}
248   file_magic(Impl V) : V(V) {}
249   operator Impl() const { return V; }
250
251 private:
252   Impl V;
253 };
254
255 /// @}
256 /// @name Physical Operators
257 /// @{
258
259 /// @brief Make \a path an absolute path.
260 ///
261 /// Makes \a path absolute using the current directory if it is not already. An
262 /// empty \a path will result in the current directory.
263 ///
264 /// /absolute/path   => /absolute/path
265 /// relative/../path => <current-directory>/relative/../path
266 ///
267 /// @param path A path that is modified to be an absolute path.
268 /// @returns errc::success if \a path has been made absolute, otherwise a
269 ///          platform specific error_code.
270 error_code make_absolute(SmallVectorImpl<char> &path);
271
272 /// @brief Normalize path separators in \a Path
273 ///
274 /// If the path contains any '\' separators, they are transformed into '/'.
275 /// This is particularly useful when cross-compiling Windows on Linux, but is
276 /// safe to invoke on Windows, which accepts both characters as a path
277 /// separator.
278 error_code normalize_separators(SmallVectorImpl<char> &Path);
279
280 /// @brief Create all the non-existent directories in path.
281 ///
282 /// @param path Directories to create.
283 /// @returns errc::success if is_directory(path), otherwise a platform
284 ///          specific error_code. If IgnoreExisting is false, also returns
285 ///          error if the directory already existed.
286 error_code create_directories(const Twine &path, bool IgnoreExisting = true);
287
288 /// @brief Create the directory in path.
289 ///
290 /// @param path Directory to create.
291 /// @returns errc::success if is_directory(path), otherwise a platform
292 ///          specific error_code. If IgnoreExisting is false, also returns
293 ///          error if the directory already existed.
294 error_code create_directory(const Twine &path, bool IgnoreExisting = true);
295
296 /// @brief Create a link from \a from to \a to.
297 ///
298 /// The link may be a soft or a hard link, depending on the platform. The caller
299 /// may not assume which one. Currently on windows it creates a hard link since
300 /// soft links require extra privileges. On unix, it creates a soft link since
301 /// hard links don't work on SMB file systems.
302 ///
303 /// @param to The path to hard link to.
304 /// @param from The path to hard link from. This is created.
305 /// @returns errc::success if the link was created, otherwise a platform
306 /// specific error_code.
307 error_code create_link(const Twine &to, const Twine &from);
308
309 /// @brief Get the current path.
310 ///
311 /// @param result Holds the current path on return.
312 /// @returns errc::success if the current path has been stored in result,
313 ///          otherwise a platform specific error_code.
314 error_code current_path(SmallVectorImpl<char> &result);
315
316 /// @brief Remove path. Equivalent to POSIX remove().
317 ///
318 /// @param path Input path.
319 /// @returns errc::success if path has been removed or didn't exist, otherwise a
320 ///          platform specific error code. If IgnoreNonExisting is false, also
321 ///          returns error if the file didn't exist.
322 error_code remove(const Twine &path, bool IgnoreNonExisting = true);
323
324 /// @brief Rename \a from to \a to. Files are renamed as if by POSIX rename().
325 ///
326 /// @param from The path to rename from.
327 /// @param to The path to rename to. This is created.
328 error_code rename(const Twine &from, const Twine &to);
329
330 /// @brief Resize path to size. File is resized as if by POSIX truncate().
331 ///
332 /// @param path Input path.
333 /// @param size Size to resize to.
334 /// @returns errc::success if \a path has been resized to \a size, otherwise a
335 ///          platform specific error_code.
336 error_code resize_file(const Twine &path, uint64_t size);
337
338 /// @}
339 /// @name Physical Observers
340 /// @{
341
342 /// @brief Does file exist?
343 ///
344 /// @param status A file_status previously returned from stat.
345 /// @returns True if the file represented by status exists, false if it does
346 ///          not.
347 bool exists(file_status status);
348
349 /// @brief Does file exist?
350 ///
351 /// @param path Input path.
352 /// @param result Set to true if the file represented by status exists, false if
353 ///               it does not. Undefined otherwise.
354 /// @returns errc::success if result has been successfully set, otherwise a
355 ///          platform specific error_code.
356 error_code exists(const Twine &path, bool &result);
357
358 /// @brief Simpler version of exists for clients that don't need to
359 ///        differentiate between an error and false.
360 inline bool exists(const Twine &path) {
361   bool result;
362   return !exists(path, result) && result;
363 }
364
365 /// @brief Can we execute this file?
366 ///
367 /// @param Path Input path.
368 /// @returns True if we can execute it, false otherwise.
369 bool can_execute(const Twine &Path);
370
371 /// @brief Can we write this file?
372 ///
373 /// @param Path Input path.
374 /// @returns True if we can write to it, false otherwise.
375 bool can_write(const Twine &Path);
376
377 /// @brief Do file_status's represent the same thing?
378 ///
379 /// @param A Input file_status.
380 /// @param B Input file_status.
381 ///
382 /// assert(status_known(A) || status_known(B));
383 ///
384 /// @returns True if A and B both represent the same file system entity, false
385 ///          otherwise.
386 bool equivalent(file_status A, file_status B);
387
388 /// @brief Do paths represent the same thing?
389 ///
390 /// assert(status_known(A) || status_known(B));
391 ///
392 /// @param A Input path A.
393 /// @param B Input path B.
394 /// @param result Set to true if stat(A) and stat(B) have the same device and
395 ///               inode (or equivalent).
396 /// @returns errc::success if result has been successfully set, otherwise a
397 ///          platform specific error_code.
398 error_code equivalent(const Twine &A, const Twine &B, bool &result);
399
400 /// @brief Simpler version of equivalent for clients that don't need to
401 ///        differentiate between an error and false.
402 inline bool equivalent(const Twine &A, const Twine &B) {
403   bool result;
404   return !equivalent(A, B, result) && result;
405 }
406
407 /// @brief Does status represent a directory?
408 ///
409 /// @param status A file_status previously returned from status.
410 /// @returns status.type() == file_type::directory_file.
411 bool is_directory(file_status status);
412
413 /// @brief Is path a directory?
414 ///
415 /// @param path Input path.
416 /// @param result Set to true if \a path is a directory, false if it is not.
417 ///               Undefined otherwise.
418 /// @returns errc::success if result has been successfully set, otherwise a
419 ///          platform specific error_code.
420 error_code is_directory(const Twine &path, bool &result);
421
422 /// @brief Simpler version of is_directory for clients that don't need to
423 ///        differentiate between an error and false.
424 inline bool is_directory(const Twine &Path) {
425   bool Result;
426   return !is_directory(Path, Result) && Result;
427 }
428
429 /// @brief Does status represent a regular file?
430 ///
431 /// @param status A file_status previously returned from status.
432 /// @returns status_known(status) && status.type() == file_type::regular_file.
433 bool is_regular_file(file_status status);
434
435 /// @brief Is path a regular file?
436 ///
437 /// @param path Input path.
438 /// @param result Set to true if \a path is a regular file, false if it is not.
439 ///               Undefined otherwise.
440 /// @returns errc::success if result has been successfully set, otherwise a
441 ///          platform specific error_code.
442 error_code is_regular_file(const Twine &path, bool &result);
443
444 /// @brief Simpler version of is_regular_file for clients that don't need to
445 ///        differentiate between an error and false.
446 inline bool is_regular_file(const Twine &Path) {
447   bool Result;
448   if (is_regular_file(Path, Result))
449     return false;
450   return Result;
451 }
452
453 /// @brief Does this status represent something that exists but is not a
454 ///        directory, regular file, or symlink?
455 ///
456 /// @param status A file_status previously returned from status.
457 /// @returns exists(s) && !is_regular_file(s) && !is_directory(s) &&
458 ///          !is_symlink(s)
459 bool is_other(file_status status);
460
461 /// @brief Is path something that exists but is not a directory,
462 ///        regular file, or symlink?
463 ///
464 /// @param path Input path.
465 /// @param result Set to true if \a path exists, but is not a directory, regular
466 ///               file, or a symlink, false if it does not. Undefined otherwise.
467 /// @returns errc::success if result has been successfully set, otherwise a
468 ///          platform specific error_code.
469 error_code is_other(const Twine &path, bool &result);
470
471 /// @brief Does status represent a symlink?
472 ///
473 /// @param status A file_status previously returned from stat.
474 /// @returns status.type() == symlink_file.
475 bool is_symlink(file_status status);
476
477 /// @brief Is path a symlink?
478 ///
479 /// @param path Input path.
480 /// @param result Set to true if \a path is a symlink, false if it is not.
481 ///               Undefined otherwise.
482 /// @returns errc::success if result has been successfully set, otherwise a
483 ///          platform specific error_code.
484 error_code is_symlink(const Twine &path, bool &result);
485
486 /// @brief Get file status as if by POSIX stat().
487 ///
488 /// @param path Input path.
489 /// @param result Set to the file status.
490 /// @returns errc::success if result has been successfully set, otherwise a
491 ///          platform specific error_code.
492 error_code status(const Twine &path, file_status &result);
493
494 /// @brief A version for when a file descriptor is already available.
495 error_code status(int FD, file_status &Result);
496
497 /// @brief Get file size.
498 ///
499 /// @param Path Input path.
500 /// @param Result Set to the size of the file in \a Path.
501 /// @returns errc::success if result has been successfully set, otherwise a
502 ///          platform specific error_code.
503 inline error_code file_size(const Twine &Path, uint64_t &Result) {
504   file_status Status;
505   error_code EC = status(Path, Status);
506   if (EC)
507     return EC;
508   Result = Status.getSize();
509   return error_code::success();
510 }
511
512 /// @brief Set the file modification and access time.
513 ///
514 /// @returns errc::success if the file times were successfully set, otherwise a
515 ///          platform specific error_code or errc::not_supported on platforms
516 ///          where the functionality isn't available.
517 error_code setLastModificationAndAccessTime(int FD, TimeValue Time);
518
519 /// @brief Is status available?
520 ///
521 /// @param s Input file status.
522 /// @returns True if status() != status_error.
523 bool status_known(file_status s);
524
525 /// @brief Is status available?
526 ///
527 /// @param path Input path.
528 /// @param result Set to true if status() != status_error.
529 /// @returns errc::success if result has been successfully set, otherwise a
530 ///          platform specific error_code.
531 error_code status_known(const Twine &path, bool &result);
532
533 /// @brief Create a uniquely named file.
534 ///
535 /// Generates a unique path suitable for a temporary file and then opens it as a
536 /// file. The name is based on \a model with '%' replaced by a random char in
537 /// [0-9a-f]. If \a model is not an absolute path, a suitable temporary
538 /// directory will be prepended.
539 ///
540 /// Example: clang-%%-%%-%%-%%-%%.s => clang-a0-b1-c2-d3-e4.s
541 ///
542 /// This is an atomic operation. Either the file is created and opened, or the
543 /// file system is left untouched.
544 ///
545 /// The intendend use is for files that are to be kept, possibly after
546 /// renaming them. For example, when running 'clang -c foo.o', the file can
547 /// be first created as foo-abc123.o and then renamed.
548 ///
549 /// @param Model Name to base unique path off of.
550 /// @param ResultFD Set to the opened file's file descriptor.
551 /// @param ResultPath Set to the opened file's absolute path.
552 /// @returns errc::success if Result{FD,Path} have been successfully set,
553 ///          otherwise a platform specific error_code.
554 error_code createUniqueFile(const Twine &Model, int &ResultFD,
555                             SmallVectorImpl<char> &ResultPath,
556                             unsigned Mode = all_read | all_write);
557
558 /// @brief Simpler version for clients that don't want an open file.
559 error_code createUniqueFile(const Twine &Model,
560                             SmallVectorImpl<char> &ResultPath);
561
562 /// @brief Create a file in the system temporary directory.
563 ///
564 /// The filename is of the form prefix-random_chars.suffix. Since the directory
565 /// is not know to the caller, Prefix and Suffix cannot have path separators.
566 /// The files are created with mode 0600.
567 ///
568 /// This should be used for things like a temporary .s that is removed after
569 /// running the assembler.
570 error_code createTemporaryFile(const Twine &Prefix, StringRef Suffix,
571                                int &ResultFD,
572                                SmallVectorImpl<char> &ResultPath);
573
574 /// @brief Simpler version for clients that don't want an open file.
575 error_code createTemporaryFile(const Twine &Prefix, StringRef Suffix,
576                                SmallVectorImpl<char> &ResultPath);
577
578 error_code createUniqueDirectory(const Twine &Prefix,
579                                  SmallVectorImpl<char> &ResultPath);
580
581 enum OpenFlags {
582   F_None = 0,
583
584   /// F_Excl - When opening a file, this flag makes raw_fd_ostream
585   /// report an error if the file already exists.
586   F_Excl = 1,
587
588   /// F_Append - When opening a file, if it already exists append to the
589   /// existing file instead of returning an error.  This may not be specified
590   /// with F_Excl.
591   F_Append = 2,
592
593   /// The file should be opened in text mode on platforms that make this
594   /// distinction.
595   F_Text = 4,
596
597   /// Open the file for read and write.
598   F_RW = 8
599 };
600
601 inline OpenFlags operator|(OpenFlags A, OpenFlags B) {
602   return OpenFlags(unsigned(A) | unsigned(B));
603 }
604
605 inline OpenFlags &operator|=(OpenFlags &A, OpenFlags B) {
606   A = A | B;
607   return A;
608 }
609
610 error_code openFileForWrite(const Twine &Name, int &ResultFD, OpenFlags Flags,
611                             unsigned Mode = 0666);
612
613 error_code openFileForRead(const Twine &Name, int &ResultFD);
614
615 /// @brief Are \a path's first bytes \a magic?
616 ///
617 /// @param path Input path.
618 /// @param magic Byte sequence to compare \a path's first len(magic) bytes to.
619 /// @returns errc::success if result has been successfully set, otherwise a
620 ///          platform specific error_code.
621 error_code has_magic(const Twine &path, const Twine &magic, bool &result);
622
623 /// @brief Get \a path's first \a len bytes.
624 ///
625 /// @param path Input path.
626 /// @param len Number of magic bytes to get.
627 /// @param result Set to the first \a len bytes in the file pointed to by
628 ///               \a path. Or the entire file if file_size(path) < len, in which
629 ///               case result.size() returns the size of the file.
630 /// @returns errc::success if result has been successfully set,
631 ///          errc::value_too_large if len is larger then the file pointed to by
632 ///          \a path, otherwise a platform specific error_code.
633 error_code get_magic(const Twine &path, uint32_t len,
634                      SmallVectorImpl<char> &result);
635
636 /// @brief Identify the type of a binary file based on how magical it is.
637 file_magic identify_magic(StringRef magic);
638
639 /// @brief Get and identify \a path's type based on its content.
640 ///
641 /// @param path Input path.
642 /// @param result Set to the type of file, or file_magic::unknown.
643 /// @returns errc::success if result has been successfully set, otherwise a
644 ///          platform specific error_code.
645 error_code identify_magic(const Twine &path, file_magic &result);
646
647 error_code getUniqueID(const Twine Path, UniqueID &Result);
648
649 /// This class represents a memory mapped file. It is based on
650 /// boost::iostreams::mapped_file.
651 class mapped_file_region {
652   mapped_file_region() LLVM_DELETED_FUNCTION;
653   mapped_file_region(mapped_file_region&) LLVM_DELETED_FUNCTION;
654   mapped_file_region &operator =(mapped_file_region&) LLVM_DELETED_FUNCTION;
655
656 public:
657   enum mapmode {
658     readonly, ///< May only access map via const_data as read only.
659     readwrite, ///< May access map via data and modify it. Written to path.
660     priv ///< May modify via data, but changes are lost on destruction.
661   };
662
663 private:
664   /// Platform specific mapping state.
665   mapmode Mode;
666   uint64_t Size;
667   void *Mapping;
668 #ifdef LLVM_ON_WIN32
669   int FileDescriptor;
670   void *FileHandle;
671   void *FileMappingHandle;
672 #endif
673
674   error_code init(int FD, bool CloseFD, uint64_t Offset);
675
676 public:
677   typedef char char_type;
678
679   mapped_file_region(mapped_file_region&&);
680   mapped_file_region &operator =(mapped_file_region&&);
681
682   /// Construct a mapped_file_region at \a path starting at \a offset of length
683   /// \a length and with access \a mode.
684   ///
685   /// \param path Path to the file to map. If it does not exist it will be
686   ///             created.
687   /// \param mode How to map the memory.
688   /// \param length Number of bytes to map in starting at \a offset. If the file
689   ///               is shorter than this, it will be extended. If \a length is
690   ///               0, the entire file will be mapped.
691   /// \param offset Byte offset from the beginning of the file where the map
692   ///               should begin. Must be a multiple of
693   ///               mapped_file_region::alignment().
694   /// \param ec This is set to errc::success if the map was constructed
695   ///           successfully. Otherwise it is set to a platform dependent error.
696   mapped_file_region(const Twine &path,
697                      mapmode mode,
698                      uint64_t length,
699                      uint64_t offset,
700                      error_code &ec);
701
702   /// \param fd An open file descriptor to map. mapped_file_region takes
703   ///   ownership if closefd is true. It must have been opended in the correct
704   ///   mode.
705   mapped_file_region(int fd,
706                      bool closefd,
707                      mapmode mode,
708                      uint64_t length,
709                      uint64_t offset,
710                      error_code &ec);
711
712   ~mapped_file_region();
713
714   mapmode flags() const;
715   uint64_t size() const;
716   char *data() const;
717
718   /// Get a const view of the data. Modifying this memory has undefined
719   /// behavior.
720   const char *const_data() const;
721
722   /// \returns The minimum alignment offset must be.
723   static int alignment();
724 };
725
726 /// @brief Memory maps the contents of a file
727 ///
728 /// @param path Path to file to map.
729 /// @param file_offset Byte offset in file where mapping should begin.
730 /// @param size Byte length of range of the file to map.
731 /// @param map_writable If true, the file will be mapped in r/w such
732 ///        that changes to the mapped buffer will be flushed back
733 ///        to the file.  If false, the file will be mapped read-only
734 ///        and the buffer will be read-only.
735 /// @param result Set to the start address of the mapped buffer.
736 /// @returns errc::success if result has been successfully set, otherwise a
737 ///          platform specific error_code.
738 error_code map_file_pages(const Twine &path, off_t file_offset, size_t size,  
739                           bool map_writable, void *&result);
740
741
742 /// @brief Memory unmaps the contents of a file
743 ///
744 /// @param base Pointer to the start of the buffer.
745 /// @param size Byte length of the range to unmmap.
746 /// @returns errc::success if result has been successfully set, otherwise a
747 ///          platform specific error_code.
748 error_code unmap_file_pages(void *base, size_t size);
749
750 /// Return the path to the main executable, given the value of argv[0] from
751 /// program startup and the address of main itself. In extremis, this function
752 /// may fail and return an empty path.
753 std::string getMainExecutable(const char *argv0, void *MainExecAddr);
754
755 /// @}
756 /// @name Iterators
757 /// @{
758
759 /// directory_entry - A single entry in a directory. Caches the status either
760 /// from the result of the iteration syscall, or the first time status is
761 /// called.
762 class directory_entry {
763   std::string Path;
764   mutable file_status Status;
765
766 public:
767   explicit directory_entry(const Twine &path, file_status st = file_status())
768     : Path(path.str())
769     , Status(st) {}
770
771   directory_entry() {}
772
773   void assign(const Twine &path, file_status st = file_status()) {
774     Path = path.str();
775     Status = st;
776   }
777
778   void replace_filename(const Twine &filename, file_status st = file_status());
779
780   const std::string &path() const { return Path; }
781   error_code status(file_status &result) const;
782
783   bool operator==(const directory_entry& rhs) const { return Path == rhs.Path; }
784   bool operator!=(const directory_entry& rhs) const { return !(*this == rhs); }
785   bool operator< (const directory_entry& rhs) const;
786   bool operator<=(const directory_entry& rhs) const;
787   bool operator> (const directory_entry& rhs) const;
788   bool operator>=(const directory_entry& rhs) const;
789 };
790
791 namespace detail {
792   struct DirIterState;
793
794   error_code directory_iterator_construct(DirIterState&, StringRef);
795   error_code directory_iterator_increment(DirIterState&);
796   error_code directory_iterator_destruct(DirIterState&);
797
798   /// DirIterState - Keeps state for the directory_iterator. It is reference
799   /// counted in order to preserve InputIterator semantics on copy.
800   struct DirIterState : public RefCountedBase<DirIterState> {
801     DirIterState()
802       : IterationHandle(0) {}
803
804     ~DirIterState() {
805       directory_iterator_destruct(*this);
806     }
807
808     intptr_t IterationHandle;
809     directory_entry CurrentEntry;
810   };
811 }
812
813 /// directory_iterator - Iterates through the entries in path. There is no
814 /// operator++ because we need an error_code. If it's really needed we can make
815 /// it call report_fatal_error on error.
816 class directory_iterator {
817   IntrusiveRefCntPtr<detail::DirIterState> State;
818
819 public:
820   explicit directory_iterator(const Twine &path, error_code &ec) {
821     State = new detail::DirIterState;
822     SmallString<128> path_storage;
823     ec = detail::directory_iterator_construct(*State,
824             path.toStringRef(path_storage));
825   }
826
827   explicit directory_iterator(const directory_entry &de, error_code &ec) {
828     State = new detail::DirIterState;
829     ec = detail::directory_iterator_construct(*State, de.path());
830   }
831
832   /// Construct end iterator.
833   directory_iterator() : State(0) {}
834
835   // No operator++ because we need error_code.
836   directory_iterator &increment(error_code &ec) {
837     ec = directory_iterator_increment(*State);
838     return *this;
839   }
840
841   const directory_entry &operator*() const { return State->CurrentEntry; }
842   const directory_entry *operator->() const { return &State->CurrentEntry; }
843
844   bool operator==(const directory_iterator &RHS) const {
845     if (State == RHS.State)
846       return true;
847     if (RHS.State == 0)
848       return State->CurrentEntry == directory_entry();
849     if (State == 0)
850       return RHS.State->CurrentEntry == directory_entry();
851     return State->CurrentEntry == RHS.State->CurrentEntry;
852   }
853
854   bool operator!=(const directory_iterator &RHS) const {
855     return !(*this == RHS);
856   }
857   // Other members as required by
858   // C++ Std, 24.1.1 Input iterators [input.iterators]
859 };
860
861 namespace detail {
862   /// RecDirIterState - Keeps state for the recursive_directory_iterator. It is
863   /// reference counted in order to preserve InputIterator semantics on copy.
864   struct RecDirIterState : public RefCountedBase<RecDirIterState> {
865     RecDirIterState()
866       : Level(0)
867       , HasNoPushRequest(false) {}
868
869     std::stack<directory_iterator, std::vector<directory_iterator> > Stack;
870     uint16_t Level;
871     bool HasNoPushRequest;
872   };
873 }
874
875 /// recursive_directory_iterator - Same as directory_iterator except for it
876 /// recurses down into child directories.
877 class recursive_directory_iterator {
878   IntrusiveRefCntPtr<detail::RecDirIterState> State;
879
880 public:
881   recursive_directory_iterator() {}
882   explicit recursive_directory_iterator(const Twine &path, error_code &ec)
883     : State(new detail::RecDirIterState) {
884     State->Stack.push(directory_iterator(path, ec));
885     if (State->Stack.top() == directory_iterator())
886       State.reset();
887   }
888   // No operator++ because we need error_code.
889   recursive_directory_iterator &increment(error_code &ec) {
890     const directory_iterator end_itr;
891
892     if (State->HasNoPushRequest)
893       State->HasNoPushRequest = false;
894     else {
895       file_status st;
896       if ((ec = State->Stack.top()->status(st))) return *this;
897       if (is_directory(st)) {
898         State->Stack.push(directory_iterator(*State->Stack.top(), ec));
899         if (ec) return *this;
900         if (State->Stack.top() != end_itr) {
901           ++State->Level;
902           return *this;
903         }
904         State->Stack.pop();
905       }
906     }
907
908     while (!State->Stack.empty()
909            && State->Stack.top().increment(ec) == end_itr) {
910       State->Stack.pop();
911       --State->Level;
912     }
913
914     // Check if we are done. If so, create an end iterator.
915     if (State->Stack.empty())
916       State.reset();
917
918     return *this;
919   }
920
921   const directory_entry &operator*() const { return *State->Stack.top(); }
922   const directory_entry *operator->() const { return &*State->Stack.top(); }
923
924   // observers
925   /// Gets the current level. Starting path is at level 0.
926   int level() const { return State->Level; }
927
928   /// Returns true if no_push has been called for this directory_entry.
929   bool no_push_request() const { return State->HasNoPushRequest; }
930
931   // modifiers
932   /// Goes up one level if Level > 0.
933   void pop() {
934     assert(State && "Cannot pop an end iterator!");
935     assert(State->Level > 0 && "Cannot pop an iterator with level < 1");
936
937     const directory_iterator end_itr;
938     error_code ec;
939     do {
940       if (ec)
941         report_fatal_error("Error incrementing directory iterator.");
942       State->Stack.pop();
943       --State->Level;
944     } while (!State->Stack.empty()
945              && State->Stack.top().increment(ec) == end_itr);
946
947     // Check if we are done. If so, create an end iterator.
948     if (State->Stack.empty())
949       State.reset();
950   }
951
952   /// Does not go down into the current directory_entry.
953   void no_push() { State->HasNoPushRequest = true; }
954
955   bool operator==(const recursive_directory_iterator &RHS) const {
956     return State == RHS.State;
957   }
958
959   bool operator!=(const recursive_directory_iterator &RHS) const {
960     return !(*this == RHS);
961   }
962   // Other members as required by
963   // C++ Std, 24.1.1 Input iterators [input.iterators]
964 };
965
966 /// @}
967
968 } // end namespace fs
969 } // end namespace sys
970 } // end namespace llvm
971
972 #endif