Extract endianness checks into Portability.h
[folly.git] / folly / FBString.h
1 /*
2  * Copyright 2015 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 // @author: Andrei Alexandrescu (aalexandre)
18 // String type.
19
20 #ifndef FOLLY_BASE_FBSTRING_H_
21 #define FOLLY_BASE_FBSTRING_H_
22
23 #include <atomic>
24 #include <limits>
25 #include <type_traits>
26
27 // This file appears in two locations: inside fbcode and in the
28 // libstdc++ source code (when embedding fbstring as std::string).
29 // To aid in this schizophrenic use, _LIBSTDCXX_FBSTRING is defined in
30 // libstdc++'s c++config.h, to gate use inside fbcode v. libstdc++.
31 #ifdef _LIBSTDCXX_FBSTRING
32
33 #pragma GCC system_header
34
35 // When used as std::string replacement always disable assertions.
36 #ifndef NDEBUG
37 #define NDEBUG
38 #define FOLLY_DEFINED_NDEBUG_FOR_FBSTRING
39 #endif // NDEBUG
40
41 // Handle the cases where the fbcode version (folly/Malloc.h) is included
42 // either before or after this inclusion.
43 #ifdef FOLLY_MALLOC_H_
44 #undef FOLLY_MALLOC_H_
45 #include "basic_fbstring_malloc.h" // nolint
46 #else
47 #include "basic_fbstring_malloc.h" // nolint
48 #undef FOLLY_MALLOC_H_
49 #endif
50
51 #else // !_LIBSTDCXX_FBSTRING
52
53 #include <folly/Portability.h>
54
55 // libc++ doesn't provide this header, nor does msvc
56 #ifdef FOLLY_HAVE_BITS_CXXCONFIG_H
57 #include <bits/c++config.h>
58 #endif
59
60 #include <string>
61 #include <cstring>
62 #include <cassert>
63 #include <algorithm>
64
65 #include <folly/Traits.h>
66 #include <folly/Malloc.h>
67 #include <folly/Hash.h>
68 #include <folly/ScopeGuard.h>
69
70 #if FOLLY_HAVE_DEPRECATED_ASSOC
71 #ifdef _GLIBCXX_SYMVER
72 #include <ext/hash_set>
73 #include <ext/hash_map>
74 #endif
75 #endif
76
77 #endif
78
79 // We defined these here rather than including Likely.h to avoid
80 // redefinition errors when fbstring is imported into libstdc++.
81 #if defined(__GNUC__) && __GNUC__ >= 4
82 #define FBSTRING_LIKELY(x)   (__builtin_expect((x), 1))
83 #define FBSTRING_UNLIKELY(x) (__builtin_expect((x), 0))
84 #else
85 #define FBSTRING_LIKELY(x)   (x)
86 #define FBSTRING_UNLIKELY(x) (x)
87 #endif
88
89 // Ignore shadowing warnings within this file, so includers can use -Wshadow.
90 #pragma GCC diagnostic push
91 #pragma GCC diagnostic ignored "-Wshadow"
92
93 // FBString cannot use throw when replacing std::string, though it may still
94 // use std::__throw_*
95 // nolint
96 #define throw FOLLY_FBSTRING_MAY_NOT_USE_THROW
97
98 #ifdef _LIBSTDCXX_FBSTRING
99 namespace std _GLIBCXX_VISIBILITY(default) {
100 _GLIBCXX_BEGIN_NAMESPACE_VERSION
101 #else
102 namespace folly {
103 #endif
104
105 // Different versions of gcc/clang support different versions of
106 // the address sanitizer attribute.  Unfortunately, this attribute
107 // has issues when inlining is used, so disable that as well.
108 #if defined(__clang__)
109 # if __has_feature(address_sanitizer)
110 #  if __has_attribute(__no_sanitize__)
111 #   define FBSTRING_DISABLE_ADDRESS_SANITIZER \
112       __attribute__((__no_sanitize__("address"), __noinline__))
113 #  elif __has_attribute(__no_address_safety_analysis__)
114 #   define FBSTRING_DISABLE_ADDRESS_SANITIZER \
115       __attribute__((__no_address_safety_analysis__, __noinline__))
116 #  elif __has_attribute(__no_sanitize_address__)
117 #   define FBSTRING_DISABLE_ADDRESS_SANITIZER \
118       __attribute__((__no_sanitize_address__, __noinline__))
119 #  endif
120 # endif
121 #elif defined (__GNUC__) && \
122       __SANITIZE_ADDRESS__
123 # define FBSTRING_DISABLE_ADDRESS_SANITIZER \
124     __attribute__((__no_address_safety_analysis__, __noinline__))
125 #endif
126 #ifndef FBSTRING_DISABLE_ADDRESS_SANITIZER
127 # define FBSTRING_DISABLE_ADDRESS_SANITIZER
128 #endif
129
130 namespace fbstring_detail {
131
132 template <class InIt, class OutIt>
133 inline
134 OutIt copy_n(InIt b,
135              typename std::iterator_traits<InIt>::difference_type n,
136              OutIt d) {
137   for (; n != 0; --n, ++b, ++d) {
138     *d = *b;
139   }
140   return d;
141 }
142
143 template <class Pod, class T>
144 inline void pod_fill(Pod* b, Pod* e, T c) {
145   assert(b && e && b <= e);
146   /*static*/ if (sizeof(T) == 1) {
147     memset(b, c, e - b);
148   } else {
149     auto const ee = b + ((e - b) & ~7u);
150     for (; b != ee; b += 8) {
151       b[0] = c;
152       b[1] = c;
153       b[2] = c;
154       b[3] = c;
155       b[4] = c;
156       b[5] = c;
157       b[6] = c;
158       b[7] = c;
159     }
160     // Leftovers
161     for (; b != e; ++b) {
162       *b = c;
163     }
164   }
165 }
166
167 /*
168  * Lightly structured memcpy, simplifies copying PODs and introduces
169  * some asserts. Unfortunately using this function may cause
170  * measurable overhead (presumably because it adjusts from a begin/end
171  * convention to a pointer/size convention, so it does some extra
172  * arithmetic even though the caller might have done the inverse
173  * adaptation outside).
174  */
175 template <class Pod>
176 inline void pod_copy(const Pod* b, const Pod* e, Pod* d) {
177   assert(e >= b);
178   assert(d >= e || d + (e - b) <= b);
179   memcpy(d, b, (e - b) * sizeof(Pod));
180 }
181
182 /*
183  * Lightly structured memmove, simplifies copying PODs and introduces
184  * some asserts
185  */
186 template <class Pod>
187 inline void pod_move(const Pod* b, const Pod* e, Pod* d) {
188   assert(e >= b);
189   memmove(d, b, (e - b) * sizeof(*b));
190 }
191
192 } // namespace fbstring_detail
193
194 /**
195  * Defines a special acquisition method for constructing fbstring
196  * objects. AcquireMallocatedString means that the user passes a
197  * pointer to a malloc-allocated string that the fbstring object will
198  * take into custody.
199  */
200 enum class AcquireMallocatedString {};
201
202 /*
203  * fbstring_core_model is a mock-up type that defines all required
204  * signatures of a fbstring core. The fbstring class itself uses such
205  * a core object to implement all of the numerous member functions
206  * required by the standard.
207  *
208  * If you want to define a new core, copy the definition below and
209  * implement the primitives. Then plug the core into basic_fbstring as
210  * a template argument.
211
212 template <class Char>
213 class fbstring_core_model {
214 public:
215   fbstring_core_model();
216   fbstring_core_model(const fbstring_core_model &);
217   ~fbstring_core_model();
218   // Returns a pointer to string's buffer (currently only contiguous
219   // strings are supported). The pointer is guaranteed to be valid
220   // until the next call to a non-const member function.
221   const Char * data() const;
222   // Much like data(), except the string is prepared to support
223   // character-level changes. This call is a signal for
224   // e.g. reference-counted implementation to fork the data. The
225   // pointer is guaranteed to be valid until the next call to a
226   // non-const member function.
227   Char * mutable_data();
228   // Returns a pointer to string's buffer and guarantees that a
229   // readable '\0' lies right after the buffer. The pointer is
230   // guaranteed to be valid until the next call to a non-const member
231   // function.
232   const Char * c_str() const;
233   // Shrinks the string by delta characters. Asserts that delta <=
234   // size().
235   void shrink(size_t delta);
236   // Expands the string by delta characters (i.e. after this call
237   // size() will report the old size() plus delta) but without
238   // initializing the expanded region. Returns a pointer to the memory
239   // to be initialized (the beginning of the expanded portion). The
240   // caller is expected to fill the expanded area appropriately.
241   Char* expand_noinit(size_t delta);
242   // Expands the string by one character and sets the last character
243   // to c.
244   void push_back(Char c);
245   // Returns the string's size.
246   size_t size() const;
247   // Returns the string's capacity, i.e. maximum size that the string
248   // can grow to without reallocation. Note that for reference counted
249   // strings that's technically a lie - even assigning characters
250   // within the existing size would cause a reallocation.
251   size_t capacity() const;
252   // Returns true if the data underlying the string is actually shared
253   // across multiple strings (in a refcounted fashion).
254   bool isShared() const;
255   // Makes sure that at least minCapacity characters are available for
256   // the string without reallocation. For reference-counted strings,
257   // it should fork the data even if minCapacity < size().
258   void reserve(size_t minCapacity);
259 private:
260   // Do not implement
261   fbstring_core_model& operator=(const fbstring_core_model &);
262 };
263 */
264
265 /**
266  * This is the core of the string. The code should work on 32- and
267  * 64-bit and both big- and little-endianan architectures with any
268  * Char size.
269  *
270  * The storage is selected as follows (assuming we store one-byte
271  * characters on a 64-bit machine): (a) "small" strings between 0 and
272  * 23 chars are stored in-situ without allocation (the rightmost byte
273  * stores the size); (b) "medium" strings from 24 through 254 chars
274  * are stored in malloc-allocated memory that is copied eagerly; (c)
275  * "large" strings of 255 chars and above are stored in a similar
276  * structure as medium arrays, except that the string is
277  * reference-counted and copied lazily. the reference count is
278  * allocated right before the character array.
279  *
280  * The discriminator between these three strategies sits in two
281  * bits of the rightmost char of the storage. If neither is set, then the
282  * string is small (and its length sits in the lower-order bits on
283  * little-endian or the high-order bits on big-endian of that
284  * rightmost character). If the MSb is set, the string is medium width.
285  * If the second MSb is set, then the string is large. On little-endian,
286  * these 2 bits are the 2 MSbs of MediumLarge::capacity_, while on
287  * big-endian, these 2 bits are the 2 LSbs. This keeps both little-endian
288  * and big-endian fbstring_core equivalent with merely different ops used
289  * to extract capacity/category.
290  */
291 template <class Char> class fbstring_core {
292 public:
293   fbstring_core() noexcept { reset(); }
294
295   fbstring_core(const fbstring_core & rhs) {
296     assert(&rhs != this);
297     // Simplest case first: small strings are bitblitted
298     if (rhs.category() == Category::isSmall) {
299       static_assert(offsetof(MediumLarge, data_) == 0,
300           "fbstring layout failure");
301       static_assert(offsetof(MediumLarge, size_) == sizeof(ml_.data_),
302           "fbstring layout failure");
303       static_assert(offsetof(MediumLarge, capacity_) == 2 * sizeof(ml_.data_),
304           "fbstring layout failure");
305       // Just write the whole thing, don't look at details. In
306       // particular we need to copy capacity anyway because we want
307       // to set the size (don't forget that the last character,
308       // which stores a short string's length, is shared with the
309       // ml_.capacity field).
310       ml_ = rhs.ml_;
311       assert(category() == Category::isSmall && this->size() == rhs.size());
312     } else if (rhs.category() == Category::isLarge) {
313       // Large strings are just refcounted
314       ml_ = rhs.ml_;
315       RefCounted::incrementRefs(ml_.data_);
316       assert(category() == Category::isLarge && size() == rhs.size());
317     } else {
318       // Medium strings are copied eagerly. Don't forget to allocate
319       // one extra Char for the null terminator.
320       auto const allocSize =
321            goodMallocSize((1 + rhs.ml_.size_) * sizeof(Char));
322       ml_.data_ = static_cast<Char*>(checkedMalloc(allocSize));
323       fbstring_detail::pod_copy(rhs.ml_.data_,
324                                 // 1 for terminator
325                                 rhs.ml_.data_ + rhs.ml_.size_ + 1,
326                                 ml_.data_);
327       // No need for writeTerminator() here, we copied one extra
328       // element just above.
329       ml_.size_ = rhs.ml_.size_;
330       ml_.setCapacity(allocSize / sizeof(Char) - 1, Category::isMedium);
331       assert(category() == Category::isMedium);
332     }
333     assert(size() == rhs.size());
334     assert(memcmp(data(), rhs.data(), size() * sizeof(Char)) == 0);
335   }
336
337   fbstring_core(fbstring_core&& goner) noexcept {
338     // Take goner's guts
339     ml_ = goner.ml_;
340     if (goner.category() != Category::isSmall) {
341       // Clean goner's carcass
342       goner.reset();
343     }
344   }
345
346   // NOTE(agallagher): The word-aligned copy path copies bytes which are
347   // outside the range of the string, and makes address sanitizer unhappy,
348   // so just disable it on this function.
349   fbstring_core(const Char *const data, const size_t size)
350       FBSTRING_DISABLE_ADDRESS_SANITIZER {
351 #ifndef NDEBUG
352 #ifndef _LIBSTDCXX_FBSTRING
353     SCOPE_EXIT {
354       assert(this->size() == size);
355       assert(memcmp(this->data(), data, size * sizeof(Char)) == 0);
356     };
357 #endif
358 #endif
359
360     // Simplest case first: small strings are bitblitted
361     if (size <= maxSmallSize) {
362       // Layout is: Char* data_, size_t size_, size_t capacity_
363       static_assert(sizeof(*this) == sizeof(Char*) + 2 * sizeof(size_t),
364           "fbstring has unexpected size");
365       static_assert(sizeof(Char*) == sizeof(size_t),
366           "fbstring size assumption violation");
367       // sizeof(size_t) must be a power of 2
368       static_assert((sizeof(size_t) & (sizeof(size_t) - 1)) == 0,
369           "fbstring size assumption violation");
370
371       // If data is aligned, use fast word-wise copying. Otherwise,
372       // use conservative memcpy.
373       if (reinterpret_cast<size_t>(data) & (sizeof(size_t) - 1)) {
374         fbstring_detail::pod_copy(data, data + size, small_);
375       } else {
376         // Copy one word (64 bits) at a time
377         const size_t byteSize = size * sizeof(Char);
378         if (byteSize > 2 * sizeof(size_t)) {
379           // Copy three words
380           ml_.capacity_ = reinterpret_cast<const size_t*>(data)[2];
381           copyTwo:
382           ml_.size_ = reinterpret_cast<const size_t*>(data)[1];
383           copyOne:
384           ml_.data_ = *reinterpret_cast<Char**>(const_cast<Char*>(data));
385         } else if (byteSize > sizeof(size_t)) {
386           // Copy two words
387           goto copyTwo;
388         } else if (size > 0) {
389           // Copy one word
390           goto copyOne;
391         }
392       }
393       setSmallSize(size);
394       return;
395     } else if (size <= maxMediumSize) {
396       // Medium strings are allocated normally. Don't forget to
397       // allocate one extra Char for the terminating null.
398       auto const allocSize = goodMallocSize((1 + size) * sizeof(Char));
399       ml_.data_ = static_cast<Char*>(checkedMalloc(allocSize));
400       fbstring_detail::pod_copy(data, data + size, ml_.data_);
401       ml_.size_ = size;
402       ml_.setCapacity(allocSize / sizeof(Char) - 1, Category::isMedium);
403     } else {
404       // Large strings are allocated differently
405       size_t effectiveCapacity = size;
406       auto const newRC = RefCounted::create(data, & effectiveCapacity);
407       ml_.data_ = newRC->data_;
408       ml_.size_ = size;
409       ml_.setCapacity(effectiveCapacity, Category::isLarge);
410     }
411     writeTerminator();
412   }
413
414   ~fbstring_core() noexcept {
415     auto const c = category();
416     if (c == Category::isSmall) {
417       return;
418     }
419     if (c == Category::isMedium) {
420       free(ml_.data_);
421       return;
422     }
423     RefCounted::decrementRefs(ml_.data_);
424   }
425
426   // Snatches a previously mallocated string. The parameter "size"
427   // is the size of the string, and the parameter "allocatedSize"
428   // is the size of the mallocated block.  The string must be
429   // \0-terminated, so allocatedSize >= size + 1 and data[size] == '\0'.
430   //
431   // So if you want a 2-character string, pass malloc(3) as "data",
432   // pass 2 as "size", and pass 3 as "allocatedSize".
433   fbstring_core(Char * const data,
434                 const size_t size,
435                 const size_t allocatedSize,
436                 AcquireMallocatedString) {
437     if (size > 0) {
438       assert(allocatedSize >= size + 1);
439       assert(data[size] == '\0');
440       // Use the medium string storage
441       ml_.data_ = data;
442       ml_.size_ = size;
443       // Don't forget about null terminator
444       ml_.setCapacity(allocatedSize - 1, Category::isMedium);
445     } else {
446       // No need for the memory
447       free(data);
448       reset();
449     }
450   }
451
452   // swap below doesn't test whether &rhs == this (and instead
453   // potentially does extra work) on the premise that the rarity of
454   // that situation actually makes the check more expensive than is
455   // worth.
456   void swap(fbstring_core & rhs) {
457     auto const t = ml_;
458     ml_ = rhs.ml_;
459     rhs.ml_ = t;
460   }
461
462   // In C++11 data() and c_str() are 100% equivalent.
463   const Char * data() const {
464     return c_str();
465   }
466
467   Char * mutable_data() {
468     auto const c = category();
469     if (c == Category::isSmall) {
470       return small_;
471     }
472     assert(c == Category::isMedium || c == Category::isLarge);
473     if (c == Category::isLarge && RefCounted::refs(ml_.data_) > 1) {
474       // Ensure unique.
475       size_t effectiveCapacity = ml_.capacity();
476       auto const newRC = RefCounted::create(& effectiveCapacity);
477       // If this fails, someone placed the wrong capacity in an
478       // fbstring.
479       assert(effectiveCapacity >= ml_.capacity());
480       fbstring_detail::pod_copy(ml_.data_, ml_.data_ + ml_.size_ + 1,
481                                 newRC->data_);
482       RefCounted::decrementRefs(ml_.data_);
483       ml_.data_ = newRC->data_;
484       // No need to call writeTerminator(), we have + 1 above.
485     }
486     return ml_.data_;
487   }
488
489   const Char * c_str() const {
490     auto const c = category();
491     if (c == Category::isSmall) {
492       assert(small_[smallSize()] == '\0');
493       return small_;
494     }
495     assert(c == Category::isMedium || c == Category::isLarge);
496     assert(ml_.data_[ml_.size_] == '\0');
497     return ml_.data_;
498   }
499
500   void shrink(const size_t delta) {
501     if (category() == Category::isSmall) {
502       // Check for underflow
503       assert(delta <= smallSize());
504       setSmallSize(smallSize() - delta);
505     } else if (category() == Category::isMedium ||
506                RefCounted::refs(ml_.data_) == 1) {
507       // Medium strings and unique large strings need no special
508       // handling.
509       assert(ml_.size_ >= delta);
510       ml_.size_ -= delta;
511       writeTerminator();
512     } else {
513       assert(ml_.size_ >= delta);
514       // Shared large string, must make unique. This is because of the
515       // durn terminator must be written, which may trample the shared
516       // data.
517       if (delta) {
518         fbstring_core(ml_.data_, ml_.size_ - delta).swap(*this);
519       }
520       // No need to write the terminator.
521     }
522   }
523
524   void reserve(size_t minCapacity) {
525     if (category() == Category::isLarge) {
526       // Ensure unique
527       if (RefCounted::refs(ml_.data_) > 1) {
528         // We must make it unique regardless; in-place reallocation is
529         // useless if the string is shared. In order to not surprise
530         // people, reserve the new block at current capacity or
531         // more. That way, a string's capacity never shrinks after a
532         // call to reserve.
533         minCapacity = std::max(minCapacity, ml_.capacity());
534         auto const newRC = RefCounted::create(& minCapacity);
535         fbstring_detail::pod_copy(ml_.data_, ml_.data_ + ml_.size_ + 1,
536                                    newRC->data_);
537         // Done with the old data. No need to call writeTerminator(),
538         // we have + 1 above.
539         RefCounted::decrementRefs(ml_.data_);
540         ml_.data_ = newRC->data_;
541         ml_.setCapacity(minCapacity, Category::isLarge);
542         // size remains unchanged
543       } else {
544         // String is not shared, so let's try to realloc (if needed)
545         if (minCapacity > ml_.capacity()) {
546           // Asking for more memory
547           auto const newRC =
548                RefCounted::reallocate(ml_.data_, ml_.size_,
549                                       ml_.capacity(), minCapacity);
550           ml_.data_ = newRC->data_;
551           ml_.setCapacity(minCapacity, Category::isLarge);
552           writeTerminator();
553         }
554         assert(capacity() >= minCapacity);
555       }
556     } else if (category() == Category::isMedium) {
557       // String is not shared
558       if (minCapacity <= ml_.capacity()) {
559         return; // nothing to do, there's enough room
560       }
561       if (minCapacity <= maxMediumSize) {
562         // Keep the string at medium size. Don't forget to allocate
563         // one extra Char for the terminating null.
564         size_t capacityBytes = goodMallocSize((1 + minCapacity) * sizeof(Char));
565         ml_.data_ = static_cast<Char *>(
566           smartRealloc(
567             ml_.data_,
568             ml_.size_ * sizeof(Char),
569             (ml_.capacity() + 1) * sizeof(Char),
570             capacityBytes));
571         writeTerminator();
572         ml_.setCapacity(capacityBytes / sizeof(Char) - 1, Category::isMedium);
573       } else {
574         // Conversion from medium to large string
575         fbstring_core nascent;
576         // Will recurse to another branch of this function
577         nascent.reserve(minCapacity);
578         nascent.ml_.size_ = ml_.size_;
579         fbstring_detail::pod_copy(ml_.data_, ml_.data_ + ml_.size_,
580                                   nascent.ml_.data_);
581         nascent.swap(*this);
582         writeTerminator();
583         assert(capacity() >= minCapacity);
584       }
585     } else {
586       assert(category() == Category::isSmall);
587       if (minCapacity > maxMediumSize) {
588         // large
589         auto const newRC = RefCounted::create(& minCapacity);
590         auto const size = smallSize();
591         fbstring_detail::pod_copy(small_, small_ + size + 1, newRC->data_);
592         // No need for writeTerminator(), we wrote it above with + 1.
593         ml_.data_ = newRC->data_;
594         ml_.size_ = size;
595         ml_.setCapacity(minCapacity, Category::isLarge);
596         assert(capacity() >= minCapacity);
597       } else if (minCapacity > maxSmallSize) {
598         // medium
599         // Don't forget to allocate one extra Char for the terminating null
600         auto const allocSizeBytes =
601           goodMallocSize((1 + minCapacity) * sizeof(Char));
602         auto const data = static_cast<Char*>(checkedMalloc(allocSizeBytes));
603         auto const size = smallSize();
604         fbstring_detail::pod_copy(small_, small_ + size + 1, data);
605         // No need for writeTerminator(), we wrote it above with + 1.
606         ml_.data_ = data;
607         ml_.size_ = size;
608         ml_.setCapacity(allocSizeBytes / sizeof(Char) - 1, Category::isMedium);
609       } else {
610         // small
611         // Nothing to do, everything stays put
612       }
613     }
614     assert(capacity() >= minCapacity);
615   }
616
617   Char * expand_noinit(const size_t delta) {
618     // Strategy is simple: make room, then change size
619     assert(capacity() >= size());
620     size_t sz, newSz;
621     if (category() == Category::isSmall) {
622       sz = smallSize();
623       newSz = sz + delta;
624       if (newSz <= maxSmallSize) {
625         setSmallSize(newSz);
626         return small_ + sz;
627       }
628       reserve(newSz);
629     } else {
630       sz = ml_.size_;
631       newSz = ml_.size_ + delta;
632       if (newSz > capacity()) {
633         reserve(newSz);
634       }
635     }
636     assert(capacity() >= newSz);
637     // Category can't be small - we took care of that above
638     assert(category() == Category::isMedium || category() == Category::isLarge);
639     ml_.size_ = newSz;
640     writeTerminator();
641     assert(size() == newSz);
642     return ml_.data_ + sz;
643   }
644
645   void push_back(Char c) {
646     assert(capacity() >= size());
647     size_t sz;
648     if (category() == Category::isSmall) {
649       sz = smallSize();
650       if (sz < maxSmallSize) {
651         small_[sz] = c;
652         setSmallSize(sz + 1);
653         return;
654       }
655       reserve(maxSmallSize * 2);
656     } else {
657       sz = ml_.size_;
658       if (sz == capacity()) {  // always true for isShared()
659         reserve(1 + sz * 3 / 2);  // ensures not shared
660       }
661     }
662     assert(!isShared());
663     assert(capacity() >= sz + 1);
664     // Category can't be small - we took care of that above
665     assert(category() == Category::isMedium || category() == Category::isLarge);
666     ml_.size_ = sz + 1;
667     ml_.data_[sz] = c;
668     writeTerminator();
669   }
670
671   size_t size() const {
672     return category() == Category::isSmall ? smallSize() : ml_.size_;
673   }
674
675   size_t capacity() const {
676     switch (category()) {
677       case Category::isSmall:
678         return maxSmallSize;
679       case Category::isLarge:
680         // For large-sized strings, a multi-referenced chunk has no
681         // available capacity. This is because any attempt to append
682         // data would trigger a new allocation.
683         if (RefCounted::refs(ml_.data_) > 1) return ml_.size_;
684       default: {}
685     }
686     return ml_.capacity();
687   }
688
689   bool isShared() const {
690     return category() == Category::isLarge && RefCounted::refs(ml_.data_) > 1;
691   }
692
693   void writeTerminator() {
694     if (category() == Category::isSmall) {
695       const auto s = smallSize();
696       if (s != maxSmallSize) {
697         small_[s] = '\0';
698       }
699     } else {
700       ml_.data_[ml_.size_] = '\0';
701     }
702   }
703
704 private:
705   // Disabled
706   fbstring_core & operator=(const fbstring_core & rhs);
707
708   // Equivalent to setSmallSize(0), but with specialized
709   // writeTerminator which doesn't re-check the category after
710   // capacity_ is overwritten.
711   void reset() {
712     // Only initialize the tag, will set the MSBs (i.e. the small
713     // string size) to zero too.
714     ml_.capacity_ = kIsLittleEndian
715       ? maxSmallSize << (8 * (sizeof(size_t) - sizeof(Char)))
716       : maxSmallSize << 2;
717     small_[0] = '\0';
718     assert(category() == Category::isSmall && size() == 0);
719   }
720
721   struct RefCounted {
722     std::atomic<size_t> refCount_;
723     Char data_[1];
724
725     static RefCounted * fromData(Char * p) {
726       return static_cast<RefCounted*>(
727         static_cast<void*>(
728           static_cast<unsigned char*>(static_cast<void*>(p))
729           - sizeof(refCount_)));
730     }
731
732     static size_t refs(Char * p) {
733       return fromData(p)->refCount_.load(std::memory_order_acquire);
734     }
735
736     static void incrementRefs(Char * p) {
737       fromData(p)->refCount_.fetch_add(1, std::memory_order_acq_rel);
738     }
739
740     static void decrementRefs(Char * p) {
741       auto const dis = fromData(p);
742       size_t oldcnt = dis->refCount_.fetch_sub(1, std::memory_order_acq_rel);
743       assert(oldcnt > 0);
744       if (oldcnt == 1) {
745         free(dis);
746       }
747     }
748
749     static RefCounted * create(size_t * size) {
750       // Don't forget to allocate one extra Char for the terminating
751       // null. In this case, however, one Char is already part of the
752       // struct.
753       const size_t allocSize = goodMallocSize(
754         sizeof(RefCounted) + *size * sizeof(Char));
755       auto result = static_cast<RefCounted*>(checkedMalloc(allocSize));
756       result->refCount_.store(1, std::memory_order_release);
757       *size = (allocSize - sizeof(RefCounted)) / sizeof(Char);
758       return result;
759     }
760
761     static RefCounted * create(const Char * data, size_t * size) {
762       const size_t effectiveSize = *size;
763       auto result = create(size);
764       fbstring_detail::pod_copy(data, data + effectiveSize, result->data_);
765       return result;
766     }
767
768     static RefCounted * reallocate(Char *const data,
769                                    const size_t currentSize,
770                                    const size_t currentCapacity,
771                                    const size_t newCapacity) {
772       assert(newCapacity > 0 && newCapacity > currentSize);
773       auto const dis = fromData(data);
774       assert(dis->refCount_.load(std::memory_order_acquire) == 1);
775       // Don't forget to allocate one extra Char for the terminating
776       // null. In this case, however, one Char is already part of the
777       // struct.
778       auto result = static_cast<RefCounted*>(
779              smartRealloc(dis,
780                           sizeof(RefCounted) + currentSize * sizeof(Char),
781                           sizeof(RefCounted) + currentCapacity * sizeof(Char),
782                           sizeof(RefCounted) + newCapacity * sizeof(Char)));
783       assert(result->refCount_.load(std::memory_order_acquire) == 1);
784       return result;
785     }
786   };
787
788   typedef std::conditional<sizeof(size_t) == 4, uint32_t, uint64_t>::type
789           category_type;
790
791   enum class Category : category_type {
792     isSmall = 0,
793     isMedium = kIsLittleEndian
794       ? sizeof(size_t) == 4 ? 0x80000000 : 0x8000000000000000
795       : 0x2,
796     isLarge =  kIsLittleEndian
797       ? sizeof(size_t) == 4 ? 0x40000000 : 0x4000000000000000
798       : 0x1,
799   };
800
801   Category category() const {
802     // works for both big-endian and little-endian
803     return static_cast<Category>(ml_.capacity_ & categoryExtractMask);
804   }
805
806   struct MediumLarge {
807     Char * data_;
808     size_t size_;
809     size_t capacity_;
810
811     size_t capacity() const {
812       return kIsLittleEndian
813         ? capacity_ & capacityExtractMask
814         : capacity_ >> 2;
815     }
816
817     void setCapacity(size_t cap, Category cat) {
818         capacity_ = kIsLittleEndian
819           ? cap | static_cast<category_type>(cat)
820           : (cap << 2) | static_cast<category_type>(cat);
821     }
822   };
823
824   union {
825     Char small_[sizeof(MediumLarge) / sizeof(Char)];
826     MediumLarge ml_;
827   };
828
829   enum : size_t {
830     lastChar = sizeof(MediumLarge) - 1,
831     maxSmallSize = lastChar / sizeof(Char),
832     maxMediumSize = 254 / sizeof(Char),            // coincides with the small
833                                                    // bin size in dlmalloc
834     categoryExtractMask = kIsLittleEndian
835       ? sizeof(size_t) == 4 ? 0xC0000000 : 0xC000000000000000
836       : 0x3,
837     capacityExtractMask = kIsLittleEndian
838       ? ~categoryExtractMask
839       : 0x0 /*unused*/,
840   };
841   static_assert(!(sizeof(MediumLarge) % sizeof(Char)),
842                 "Corrupt memory layout for fbstring.");
843
844   size_t smallSize() const {
845     assert(category() == Category::isSmall);
846     auto shift = kIsLittleEndian ? 0 : 2;
847     auto smallShifted = static_cast<size_t>(small_[maxSmallSize]) >> shift;
848     assert(static_cast<size_t>(maxSmallSize) >= smallShifted);
849     return static_cast<size_t>(maxSmallSize) - smallShifted;
850   }
851
852   void setSmallSize(size_t s) {
853     // Warning: this should work with uninitialized strings too,
854     // so don't assume anything about the previous value of
855     // small_[maxSmallSize].
856     assert(s <= maxSmallSize);
857     small_[maxSmallSize] = kIsLittleEndian
858       ? maxSmallSize - s
859       : (maxSmallSize - s) << 2;
860     writeTerminator();
861   }
862 };
863
864 #ifndef _LIBSTDCXX_FBSTRING
865 /**
866  * Dummy fbstring core that uses an actual std::string. This doesn't
867  * make any sense - it's just for testing purposes.
868  */
869 template <class Char>
870 class dummy_fbstring_core {
871 public:
872   dummy_fbstring_core() {
873   }
874   dummy_fbstring_core(const dummy_fbstring_core& another)
875       : backend_(another.backend_) {
876   }
877   dummy_fbstring_core(const Char * s, size_t n)
878       : backend_(s, n) {
879   }
880   void swap(dummy_fbstring_core & rhs) {
881     backend_.swap(rhs.backend_);
882   }
883   const Char * data() const {
884     return backend_.data();
885   }
886   Char * mutable_data() {
887     //assert(!backend_.empty());
888     return &*backend_.begin();
889   }
890   void shrink(size_t delta) {
891     assert(delta <= size());
892     backend_.resize(size() - delta);
893   }
894   Char * expand_noinit(size_t delta) {
895     auto const sz = size();
896     backend_.resize(size() + delta);
897     return backend_.data() + sz;
898   }
899   void push_back(Char c) {
900     backend_.push_back(c);
901   }
902   size_t size() const {
903     return backend_.size();
904   }
905   size_t capacity() const {
906     return backend_.capacity();
907   }
908   bool isShared() const {
909     return false;
910   }
911   void reserve(size_t minCapacity) {
912     backend_.reserve(minCapacity);
913   }
914
915 private:
916   std::basic_string<Char> backend_;
917 };
918 #endif // !_LIBSTDCXX_FBSTRING
919
920 /**
921  * This is the basic_string replacement. For conformity,
922  * basic_fbstring takes the same template parameters, plus the last
923  * one which is the core.
924  */
925 #ifdef _LIBSTDCXX_FBSTRING
926 template <typename E, class T, class A, class Storage>
927 #else
928 template <typename E,
929           class T = std::char_traits<E>,
930           class A = std::allocator<E>,
931           class Storage = fbstring_core<E> >
932 #endif
933 class basic_fbstring {
934
935   static void enforce(
936       bool condition,
937       void (*throw_exc)(const char*),
938       const char* msg) {
939     if (!condition) throw_exc(msg);
940   }
941
942   bool isSane() const {
943     return
944       begin() <= end() &&
945       empty() == (size() == 0) &&
946       empty() == (begin() == end()) &&
947       size() <= max_size() &&
948       capacity() <= max_size() &&
949       size() <= capacity() &&
950       begin()[size()] == '\0';
951   }
952
953   struct Invariant;
954   friend struct Invariant;
955   struct Invariant {
956 #ifndef NDEBUG
957     explicit Invariant(const basic_fbstring& s) : s_(s) {
958       assert(s_.isSane());
959     }
960     ~Invariant() {
961       assert(s_.isSane());
962     }
963   private:
964     const basic_fbstring& s_;
965 #else
966     explicit Invariant(const basic_fbstring&) {}
967 #endif
968     Invariant& operator=(const Invariant&);
969   };
970
971 public:
972   // types
973   typedef T traits_type;
974   typedef typename traits_type::char_type value_type;
975   typedef A allocator_type;
976   typedef typename A::size_type size_type;
977   typedef typename A::difference_type difference_type;
978
979   typedef typename A::reference reference;
980   typedef typename A::const_reference const_reference;
981   typedef typename A::pointer pointer;
982   typedef typename A::const_pointer const_pointer;
983
984   typedef E* iterator;
985   typedef const E* const_iterator;
986   typedef std::reverse_iterator<iterator
987 #ifdef NO_ITERATOR_TRAITS
988                                 , value_type
989 #endif
990                                 > reverse_iterator;
991   typedef std::reverse_iterator<const_iterator
992 #ifdef NO_ITERATOR_TRAITS
993                                 , const value_type
994 #endif
995                                 > const_reverse_iterator;
996
997   static const size_type npos;                     // = size_type(-1)
998
999 private:
1000   static void procrustes(size_type& n, size_type nmax) {
1001     if (n > nmax) n = nmax;
1002   }
1003
1004 public:
1005   // C++11 21.4.2 construct/copy/destroy
1006
1007   // Note: while the following two constructors can be (and previously were)
1008   // collapsed into one constructor written this way:
1009   //
1010   //   explicit basic_fbstring(const A& a = A()) noexcept { }
1011   //
1012   // This can cause Clang (at least version 3.7) to fail with the error:
1013   //   "chosen constructor is explicit in copy-initialization ...
1014   //   in implicit initialization of field '(x)' with omitted initializer"
1015   //
1016   // if used in a struct which is default-initialized.  Hence the split into
1017   // these two separate constructors.
1018
1019   basic_fbstring() noexcept : basic_fbstring(A()) {
1020   }
1021
1022   explicit basic_fbstring(const A&) noexcept {
1023   }
1024
1025   basic_fbstring(const basic_fbstring& str)
1026       : store_(str.store_) {
1027   }
1028
1029   // Move constructor
1030   basic_fbstring(basic_fbstring&& goner) noexcept
1031       : store_(std::move(goner.store_)) {
1032   }
1033
1034 #ifndef _LIBSTDCXX_FBSTRING
1035   // This is defined for compatibility with std::string
1036   /* implicit */ basic_fbstring(const std::string& str)
1037       : store_(str.data(), str.size()) {
1038   }
1039 #endif
1040
1041   basic_fbstring(const basic_fbstring& str, size_type pos,
1042                  size_type n = npos, const A& a = A()) {
1043     assign(str, pos, n);
1044   }
1045
1046   /* implicit */ basic_fbstring(const value_type* s, const A& /*a*/ = A())
1047       : store_(s, s
1048           ? traits_type::length(s)
1049           : (std::__throw_logic_error(
1050                 "basic_fbstring: null pointer initializer not valid"),
1051              0)) {
1052   }
1053
1054   basic_fbstring(const value_type* s, size_type n, const A& /*a*/ = A())
1055       : store_(s, n) {
1056   }
1057
1058   basic_fbstring(size_type n, value_type c, const A& /*a*/ = A()) {
1059     auto const data = store_.expand_noinit(n);
1060     fbstring_detail::pod_fill(data, data + n, c);
1061     store_.writeTerminator();
1062   }
1063
1064   template <class InIt>
1065   basic_fbstring(InIt begin, InIt end,
1066                  typename std::enable_if<
1067                  !std::is_same<typename std::remove_const<InIt>::type,
1068                  value_type*>::value, const A>::type & /*a*/ = A()) {
1069     assign(begin, end);
1070   }
1071
1072   // Specialization for const char*, const char*
1073   basic_fbstring(const value_type* b, const value_type* e)
1074       : store_(b, e - b) {
1075   }
1076
1077   // Nonstandard constructor
1078   basic_fbstring(value_type *s, size_type n, size_type c,
1079                  AcquireMallocatedString a)
1080       : store_(s, n, c, a) {
1081   }
1082
1083   // Construction from initialization list
1084   basic_fbstring(std::initializer_list<value_type> il) {
1085     assign(il.begin(), il.end());
1086   }
1087
1088   ~basic_fbstring() noexcept {
1089   }
1090
1091   basic_fbstring& operator=(const basic_fbstring& lhs) {
1092     if (FBSTRING_UNLIKELY(&lhs == this)) {
1093       return *this;
1094     }
1095     auto const oldSize = size();
1096     auto const srcSize = lhs.size();
1097     if (capacity() >= srcSize && !store_.isShared()) {
1098       // great, just copy the contents
1099       if (oldSize < srcSize)
1100         store_.expand_noinit(srcSize - oldSize);
1101       else
1102         store_.shrink(oldSize - srcSize);
1103       assert(size() == srcSize);
1104       fbstring_detail::pod_copy(lhs.begin(), lhs.end(), begin());
1105       store_.writeTerminator();
1106     } else {
1107       // need to reallocate, so we may as well create a brand new string
1108       basic_fbstring(lhs).swap(*this);
1109     }
1110     return *this;
1111   }
1112
1113   // Move assignment
1114   basic_fbstring& operator=(basic_fbstring&& goner) noexcept {
1115     if (FBSTRING_UNLIKELY(&goner == this)) {
1116       // Compatibility with std::basic_string<>,
1117       // C++11 21.4.2 [string.cons] / 23 requires self-move-assignment support.
1118       return *this;
1119     }
1120     // No need of this anymore
1121     this->~basic_fbstring();
1122     // Move the goner into this
1123     new(&store_) fbstring_core<E>(std::move(goner.store_));
1124     return *this;
1125   }
1126
1127 #ifndef _LIBSTDCXX_FBSTRING
1128   // Compatibility with std::string
1129   basic_fbstring & operator=(const std::string & rhs) {
1130     return assign(rhs.data(), rhs.size());
1131   }
1132
1133   // Compatibility with std::string
1134   std::string toStdString() const {
1135     return std::string(data(), size());
1136   }
1137 #else
1138   // A lot of code in fbcode still uses this method, so keep it here for now.
1139   const basic_fbstring& toStdString() const {
1140     return *this;
1141   }
1142 #endif
1143
1144   basic_fbstring& operator=(const value_type* s) {
1145     return assign(s);
1146   }
1147
1148   basic_fbstring& operator=(value_type c) {
1149     if (empty()) {
1150       store_.expand_noinit(1);
1151     } else if (store_.isShared()) {
1152       basic_fbstring(1, c).swap(*this);
1153       return *this;
1154     } else {
1155       store_.shrink(size() - 1);
1156     }
1157     *store_.mutable_data() = c;
1158     store_.writeTerminator();
1159     return *this;
1160   }
1161
1162   basic_fbstring& operator=(std::initializer_list<value_type> il) {
1163     return assign(il.begin(), il.end());
1164   }
1165
1166   // C++11 21.4.3 iterators:
1167   iterator begin() { return store_.mutable_data(); }
1168
1169   const_iterator begin() const { return store_.data(); }
1170
1171   const_iterator cbegin() const { return begin(); }
1172
1173   iterator end() {
1174     return store_.mutable_data() + store_.size();
1175   }
1176
1177   const_iterator end() const {
1178     return store_.data() + store_.size();
1179   }
1180
1181   const_iterator cend() const { return end(); }
1182
1183   reverse_iterator rbegin() {
1184     return reverse_iterator(end());
1185   }
1186
1187   const_reverse_iterator rbegin() const {
1188     return const_reverse_iterator(end());
1189   }
1190
1191   const_reverse_iterator crbegin() const { return rbegin(); }
1192
1193   reverse_iterator rend() {
1194     return reverse_iterator(begin());
1195   }
1196
1197   const_reverse_iterator rend() const {
1198     return const_reverse_iterator(begin());
1199   }
1200
1201   const_reverse_iterator crend() const { return rend(); }
1202
1203   // Added by C++11
1204   // C++11 21.4.5, element access:
1205   const value_type& front() const { return *begin(); }
1206   const value_type& back() const {
1207     assert(!empty());
1208     // Should be begin()[size() - 1], but that branches twice
1209     return *(end() - 1);
1210   }
1211   value_type& front() { return *begin(); }
1212   value_type& back() {
1213     assert(!empty());
1214     // Should be begin()[size() - 1], but that branches twice
1215     return *(end() - 1);
1216   }
1217   void pop_back() {
1218     assert(!empty());
1219     store_.shrink(1);
1220   }
1221
1222   // C++11 21.4.4 capacity:
1223   size_type size() const { return store_.size(); }
1224
1225   size_type length() const { return size(); }
1226
1227   size_type max_size() const {
1228     return std::numeric_limits<size_type>::max();
1229   }
1230
1231   void resize(const size_type n, const value_type c = value_type()) {
1232     auto size = this->size();
1233     if (n <= size) {
1234       store_.shrink(size - n);
1235     } else {
1236       // Do this in two steps to minimize slack memory copied (see
1237       // smartRealloc).
1238       auto const capacity = this->capacity();
1239       assert(capacity >= size);
1240       if (size < capacity) {
1241         auto delta = std::min(n, capacity) - size;
1242         store_.expand_noinit(delta);
1243         fbstring_detail::pod_fill(begin() + size, end(), c);
1244         size += delta;
1245         if (size == n) {
1246           store_.writeTerminator();
1247           return;
1248         }
1249         assert(size < n);
1250       }
1251       auto const delta = n - size;
1252       store_.expand_noinit(delta);
1253       fbstring_detail::pod_fill(end() - delta, end(), c);
1254       store_.writeTerminator();
1255     }
1256     assert(this->size() == n);
1257   }
1258
1259   size_type capacity() const { return store_.capacity(); }
1260
1261   void reserve(size_type res_arg = 0) {
1262     enforce(res_arg <= max_size(), std::__throw_length_error, "");
1263     store_.reserve(res_arg);
1264   }
1265
1266   void shrink_to_fit() {
1267     // Shrink only if slack memory is sufficiently large
1268     if (capacity() < size() * 3 / 2) {
1269       return;
1270     }
1271     basic_fbstring(cbegin(), cend()).swap(*this);
1272   }
1273
1274   void clear() { resize(0); }
1275
1276   bool empty() const { return size() == 0; }
1277
1278   // C++11 21.4.5 element access:
1279   const_reference operator[](size_type pos) const {
1280     return *(begin() + pos);
1281   }
1282
1283   reference operator[](size_type pos) {
1284     return *(begin() + pos);
1285   }
1286
1287   const_reference at(size_type n) const {
1288     enforce(n <= size(), std::__throw_out_of_range, "");
1289     return (*this)[n];
1290   }
1291
1292   reference at(size_type n) {
1293     enforce(n < size(), std::__throw_out_of_range, "");
1294     return (*this)[n];
1295   }
1296
1297   // C++11 21.4.6 modifiers:
1298   basic_fbstring& operator+=(const basic_fbstring& str) {
1299     return append(str);
1300   }
1301
1302   basic_fbstring& operator+=(const value_type* s) {
1303     return append(s);
1304   }
1305
1306   basic_fbstring& operator+=(const value_type c) {
1307     push_back(c);
1308     return *this;
1309   }
1310
1311   basic_fbstring& operator+=(std::initializer_list<value_type> il) {
1312     append(il);
1313     return *this;
1314   }
1315
1316   basic_fbstring& append(const basic_fbstring& str) {
1317 #ifndef NDEBUG
1318     auto desiredSize = size() + str.size();
1319 #endif
1320     append(str.data(), str.size());
1321     assert(size() == desiredSize);
1322     return *this;
1323   }
1324
1325   basic_fbstring& append(const basic_fbstring& str, const size_type pos,
1326                          size_type n) {
1327     const size_type sz = str.size();
1328     enforce(pos <= sz, std::__throw_out_of_range, "");
1329     procrustes(n, sz - pos);
1330     return append(str.data() + pos, n);
1331   }
1332
1333   basic_fbstring& append(const value_type* s, size_type n) {
1334 #ifndef NDEBUG
1335     Invariant checker(*this);
1336     (void) checker;
1337 #endif
1338     if (FBSTRING_UNLIKELY(!n)) {
1339       // Unlikely but must be done
1340       return *this;
1341     }
1342     auto const oldSize = size();
1343     auto const oldData = data();
1344     // Check for aliasing (rare). We could use "<=" here but in theory
1345     // those do not work for pointers unless the pointers point to
1346     // elements in the same array. For that reason we use
1347     // std::less_equal, which is guaranteed to offer a total order
1348     // over pointers. See discussion at http://goo.gl/Cy2ya for more
1349     // info.
1350     std::less_equal<const value_type*> le;
1351     if (FBSTRING_UNLIKELY(le(oldData, s) && !le(oldData + oldSize, s))) {
1352       assert(le(s + n, oldData + oldSize));
1353       const size_type offset = s - oldData;
1354       store_.reserve(oldSize + n);
1355       // Restore the source
1356       s = data() + offset;
1357     }
1358     // Warning! Repeated appends with short strings may actually incur
1359     // practically quadratic performance. Avoid that by pushing back
1360     // the first character (which ensures exponential growth) and then
1361     // appending the rest normally. Worst case the append may incur a
1362     // second allocation but that will be rare.
1363     push_back(*s++);
1364     --n;
1365     memcpy(store_.expand_noinit(n), s, n * sizeof(value_type));
1366     assert(size() == oldSize + n + 1);
1367     return *this;
1368   }
1369
1370   basic_fbstring& append(const value_type* s) {
1371     return append(s, traits_type::length(s));
1372   }
1373
1374   basic_fbstring& append(size_type n, value_type c) {
1375     resize(size() + n, c);
1376     return *this;
1377   }
1378
1379   template<class InputIterator>
1380   basic_fbstring& append(InputIterator first, InputIterator last) {
1381     insert(end(), first, last);
1382     return *this;
1383   }
1384
1385   basic_fbstring& append(std::initializer_list<value_type> il) {
1386     return append(il.begin(), il.end());
1387   }
1388
1389   void push_back(const value_type c) {             // primitive
1390     store_.push_back(c);
1391   }
1392
1393   basic_fbstring& assign(const basic_fbstring& str) {
1394     if (&str == this) return *this;
1395     return assign(str.data(), str.size());
1396   }
1397
1398   basic_fbstring& assign(basic_fbstring&& str) {
1399     return *this = std::move(str);
1400   }
1401
1402   basic_fbstring& assign(const basic_fbstring& str, const size_type pos,
1403                          size_type n) {
1404     const size_type sz = str.size();
1405     enforce(pos <= sz, std::__throw_out_of_range, "");
1406     procrustes(n, sz - pos);
1407     return assign(str.data() + pos, n);
1408   }
1409
1410   basic_fbstring& assign(const value_type* s, const size_type n) {
1411     Invariant checker(*this);
1412     (void) checker;
1413     if (size() >= n) {
1414       std::copy(s, s + n, begin());
1415       resize(n);
1416       assert(size() == n);
1417     } else {
1418       const value_type *const s2 = s + size();
1419       std::copy(s, s2, begin());
1420       append(s2, n - size());
1421       assert(size() == n);
1422     }
1423     store_.writeTerminator();
1424     assert(size() == n);
1425     return *this;
1426   }
1427
1428   basic_fbstring& assign(const value_type* s) {
1429     return assign(s, traits_type::length(s));
1430   }
1431
1432   basic_fbstring& assign(std::initializer_list<value_type> il) {
1433     return assign(il.begin(), il.end());
1434   }
1435
1436   template <class ItOrLength, class ItOrChar>
1437   basic_fbstring& assign(ItOrLength first_or_n, ItOrChar last_or_c) {
1438     return replace(begin(), end(), first_or_n, last_or_c);
1439   }
1440
1441   basic_fbstring& insert(size_type pos1, const basic_fbstring& str) {
1442     return insert(pos1, str.data(), str.size());
1443   }
1444
1445   basic_fbstring& insert(size_type pos1, const basic_fbstring& str,
1446                          size_type pos2, size_type n) {
1447     enforce(pos2 <= str.length(), std::__throw_out_of_range, "");
1448     procrustes(n, str.length() - pos2);
1449     return insert(pos1, str.data() + pos2, n);
1450   }
1451
1452   basic_fbstring& insert(size_type pos, const value_type* s, size_type n) {
1453     enforce(pos <= length(), std::__throw_out_of_range, "");
1454     insert(begin() + pos, s, s + n);
1455     return *this;
1456   }
1457
1458   basic_fbstring& insert(size_type pos, const value_type* s) {
1459     return insert(pos, s, traits_type::length(s));
1460   }
1461
1462   basic_fbstring& insert(size_type pos, size_type n, value_type c) {
1463     enforce(pos <= length(), std::__throw_out_of_range, "");
1464     insert(begin() + pos, n, c);
1465     return *this;
1466   }
1467
1468   iterator insert(const_iterator p, const value_type c) {
1469     const size_type pos = p - begin();
1470     insert(p, 1, c);
1471     return begin() + pos;
1472   }
1473
1474 private:
1475   template <int i> class Selector {};
1476
1477   iterator insertImplDiscr(const_iterator p,
1478                            size_type n, value_type c, Selector<1>) {
1479     Invariant checker(*this);
1480     (void) checker;
1481     auto const pos = p - begin();
1482     assert(p >= begin() && p <= end());
1483     if (capacity() - size() < n) {
1484       const size_type sz = p - begin();
1485       reserve(size() + n);
1486       p = begin() + sz;
1487     }
1488     const iterator oldEnd = end();
1489     if (n < size_type(oldEnd - p)) {
1490       append(oldEnd - n, oldEnd);
1491       //std::copy(
1492       //    reverse_iterator(oldEnd - n),
1493       //    reverse_iterator(p),
1494       //    reverse_iterator(oldEnd));
1495       fbstring_detail::pod_move(&*p, &*oldEnd - n,
1496                                 begin() + pos + n);
1497       std::fill(begin() + pos, begin() + pos + n, c);
1498     } else {
1499       append(n - (end() - p), c);
1500       append(iterator(p), oldEnd);
1501       std::fill(iterator(p), oldEnd, c);
1502     }
1503     store_.writeTerminator();
1504     return begin() + pos;
1505   }
1506
1507   template<class InputIter>
1508   iterator insertImplDiscr(const_iterator i,
1509                            InputIter b, InputIter e, Selector<0>) {
1510     return insertImpl(i, b, e,
1511                typename std::iterator_traits<InputIter>::iterator_category());
1512   }
1513
1514   template <class FwdIterator>
1515   iterator insertImpl(const_iterator i,
1516                   FwdIterator s1, FwdIterator s2, std::forward_iterator_tag) {
1517     Invariant checker(*this);
1518     (void) checker;
1519     const size_type pos = i - begin();
1520     const typename std::iterator_traits<FwdIterator>::difference_type n2 =
1521       std::distance(s1, s2);
1522     assert(n2 >= 0);
1523     using namespace fbstring_detail;
1524     assert(pos <= size());
1525
1526     const typename std::iterator_traits<FwdIterator>::difference_type maxn2 =
1527       capacity() - size();
1528     if (maxn2 < n2) {
1529       // realloc the string
1530       reserve(size() + n2);
1531       i = begin() + pos;
1532     }
1533     if (pos + n2 <= size()) {
1534       const iterator tailBegin = end() - n2;
1535       store_.expand_noinit(n2);
1536       fbstring_detail::pod_copy(tailBegin, tailBegin + n2, end() - n2);
1537       std::copy(const_reverse_iterator(tailBegin), const_reverse_iterator(i),
1538                 reverse_iterator(tailBegin + n2));
1539       std::copy(s1, s2, begin() + pos);
1540     } else {
1541       FwdIterator t = s1;
1542       const size_type old_size = size();
1543       std::advance(t, old_size - pos);
1544       const size_t newElems = std::distance(t, s2);
1545       store_.expand_noinit(n2);
1546       std::copy(t, s2, begin() + old_size);
1547       fbstring_detail::pod_copy(data() + pos, data() + old_size,
1548                                  begin() + old_size + newElems);
1549       std::copy(s1, t, begin() + pos);
1550     }
1551     store_.writeTerminator();
1552     return begin() + pos;
1553   }
1554
1555   template <class InputIterator>
1556   iterator insertImpl(const_iterator i,
1557                       InputIterator b, InputIterator e,
1558                       std::input_iterator_tag) {
1559     const auto pos = i - begin();
1560     basic_fbstring temp(begin(), i);
1561     for (; b != e; ++b) {
1562       temp.push_back(*b);
1563     }
1564     temp.append(i, cend());
1565     swap(temp);
1566     return begin() + pos;
1567   }
1568
1569 public:
1570   template <class ItOrLength, class ItOrChar>
1571   iterator insert(const_iterator p, ItOrLength first_or_n, ItOrChar last_or_c) {
1572     Selector<std::numeric_limits<ItOrLength>::is_specialized> sel;
1573     return insertImplDiscr(p, first_or_n, last_or_c, sel);
1574   }
1575
1576   iterator insert(const_iterator p, std::initializer_list<value_type> il) {
1577     return insert(p, il.begin(), il.end());
1578   }
1579
1580   basic_fbstring& erase(size_type pos = 0, size_type n = npos) {
1581     Invariant checker(*this);
1582     (void) checker;
1583     enforce(pos <= length(), std::__throw_out_of_range, "");
1584     procrustes(n, length() - pos);
1585     std::copy(begin() + pos + n, end(), begin() + pos);
1586     resize(length() - n);
1587     return *this;
1588   }
1589
1590   iterator erase(iterator position) {
1591     const size_type pos(position - begin());
1592     enforce(pos <= size(), std::__throw_out_of_range, "");
1593     erase(pos, 1);
1594     return begin() + pos;
1595   }
1596
1597   iterator erase(iterator first, iterator last) {
1598     const size_type pos(first - begin());
1599     erase(pos, last - first);
1600     return begin() + pos;
1601   }
1602
1603   // Replaces at most n1 chars of *this, starting with pos1 with the
1604   // content of str
1605   basic_fbstring& replace(size_type pos1, size_type n1,
1606                           const basic_fbstring& str) {
1607     return replace(pos1, n1, str.data(), str.size());
1608   }
1609
1610   // Replaces at most n1 chars of *this, starting with pos1,
1611   // with at most n2 chars of str starting with pos2
1612   basic_fbstring& replace(size_type pos1, size_type n1,
1613                           const basic_fbstring& str,
1614                           size_type pos2, size_type n2) {
1615     enforce(pos2 <= str.length(), std::__throw_out_of_range, "");
1616     return replace(pos1, n1, str.data() + pos2,
1617                    std::min(n2, str.size() - pos2));
1618   }
1619
1620   // Replaces at most n1 chars of *this, starting with pos, with chars from s
1621   basic_fbstring& replace(size_type pos, size_type n1, const value_type* s) {
1622     return replace(pos, n1, s, traits_type::length(s));
1623   }
1624
1625   // Replaces at most n1 chars of *this, starting with pos, with n2
1626   // occurrences of c
1627   //
1628   // consolidated with
1629   //
1630   // Replaces at most n1 chars of *this, starting with pos, with at
1631   // most n2 chars of str.  str must have at least n2 chars.
1632   template <class StrOrLength, class NumOrChar>
1633   basic_fbstring& replace(size_type pos, size_type n1,
1634                           StrOrLength s_or_n2, NumOrChar n_or_c) {
1635     Invariant checker(*this);
1636     (void) checker;
1637     enforce(pos <= size(), std::__throw_out_of_range, "");
1638     procrustes(n1, length() - pos);
1639     const iterator b = begin() + pos;
1640     return replace(b, b + n1, s_or_n2, n_or_c);
1641   }
1642
1643   basic_fbstring& replace(iterator i1, iterator i2, const basic_fbstring& str) {
1644     return replace(i1, i2, str.data(), str.length());
1645   }
1646
1647   basic_fbstring& replace(iterator i1, iterator i2, const value_type* s) {
1648     return replace(i1, i2, s, traits_type::length(s));
1649   }
1650
1651 private:
1652   basic_fbstring& replaceImplDiscr(iterator i1, iterator i2,
1653                                    const value_type* s, size_type n,
1654                                    Selector<2>) {
1655     assert(i1 <= i2);
1656     assert(begin() <= i1 && i1 <= end());
1657     assert(begin() <= i2 && i2 <= end());
1658     return replace(i1, i2, s, s + n);
1659   }
1660
1661   basic_fbstring& replaceImplDiscr(iterator i1, iterator i2,
1662                                    size_type n2, value_type c, Selector<1>) {
1663     const size_type n1 = i2 - i1;
1664     if (n1 > n2) {
1665       std::fill(i1, i1 + n2, c);
1666       erase(i1 + n2, i2);
1667     } else {
1668       std::fill(i1, i2, c);
1669       insert(i2, n2 - n1, c);
1670     }
1671     assert(isSane());
1672     return *this;
1673   }
1674
1675   template <class InputIter>
1676   basic_fbstring& replaceImplDiscr(iterator i1, iterator i2,
1677                                    InputIter b, InputIter e,
1678                                    Selector<0>) {
1679     replaceImpl(i1, i2, b, e,
1680                 typename std::iterator_traits<InputIter>::iterator_category());
1681     return *this;
1682   }
1683
1684 private:
1685   template <class FwdIterator>
1686   bool replaceAliased(iterator i1, iterator i2,
1687                       FwdIterator s1, FwdIterator s2, std::false_type) {
1688     return false;
1689   }
1690
1691   template <class FwdIterator>
1692   bool replaceAliased(iterator i1, iterator i2,
1693                       FwdIterator s1, FwdIterator s2, std::true_type) {
1694     static const std::less_equal<const value_type*> le =
1695       std::less_equal<const value_type*>();
1696     const bool aliased = le(&*begin(), &*s1) && le(&*s1, &*end());
1697     if (!aliased) {
1698       return false;
1699     }
1700     // Aliased replace, copy to new string
1701     basic_fbstring temp;
1702     temp.reserve(size() - (i2 - i1) + std::distance(s1, s2));
1703     temp.append(begin(), i1).append(s1, s2).append(i2, end());
1704     swap(temp);
1705     return true;
1706   }
1707
1708   template <class FwdIterator>
1709   void replaceImpl(iterator i1, iterator i2,
1710                    FwdIterator s1, FwdIterator s2, std::forward_iterator_tag) {
1711     Invariant checker(*this);
1712     (void) checker;
1713
1714     // Handle aliased replace
1715     if (replaceAliased(i1, i2, s1, s2,
1716           std::integral_constant<bool,
1717             std::is_same<FwdIterator, iterator>::value ||
1718             std::is_same<FwdIterator, const_iterator>::value>())) {
1719       return;
1720     }
1721
1722     auto const n1 = i2 - i1;
1723     assert(n1 >= 0);
1724     auto const n2 = std::distance(s1, s2);
1725     assert(n2 >= 0);
1726
1727     if (n1 > n2) {
1728       // shrinks
1729       std::copy(s1, s2, i1);
1730       erase(i1 + n2, i2);
1731     } else {
1732       // grows
1733       fbstring_detail::copy_n(s1, n1, i1);
1734       std::advance(s1, n1);
1735       insert(i2, s1, s2);
1736     }
1737     assert(isSane());
1738   }
1739
1740   template <class InputIterator>
1741   void replaceImpl(iterator i1, iterator i2,
1742                    InputIterator b, InputIterator e, std::input_iterator_tag) {
1743     basic_fbstring temp(begin(), i1);
1744     temp.append(b, e).append(i2, end());
1745     swap(temp);
1746   }
1747
1748 public:
1749   template <class T1, class T2>
1750   basic_fbstring& replace(iterator i1, iterator i2,
1751                           T1 first_or_n_or_s, T2 last_or_c_or_n) {
1752     const bool
1753       num1 = std::numeric_limits<T1>::is_specialized,
1754       num2 = std::numeric_limits<T2>::is_specialized;
1755     return replaceImplDiscr(
1756       i1, i2, first_or_n_or_s, last_or_c_or_n,
1757       Selector<num1 ? (num2 ? 1 : -1) : (num2 ? 2 : 0)>());
1758   }
1759
1760   size_type copy(value_type* s, size_type n, size_type pos = 0) const {
1761     enforce(pos <= size(), std::__throw_out_of_range, "");
1762     procrustes(n, size() - pos);
1763
1764     fbstring_detail::pod_copy(
1765       data() + pos,
1766       data() + pos + n,
1767       s);
1768     return n;
1769   }
1770
1771   void swap(basic_fbstring& rhs) {
1772     store_.swap(rhs.store_);
1773   }
1774
1775   const value_type* c_str() const {
1776     return store_.c_str();
1777   }
1778
1779   const value_type* data() const { return c_str(); }
1780
1781   allocator_type get_allocator() const {
1782     return allocator_type();
1783   }
1784
1785   size_type find(const basic_fbstring& str, size_type pos = 0) const {
1786     return find(str.data(), pos, str.length());
1787   }
1788
1789   size_type find(const value_type* needle, const size_type pos,
1790                  const size_type nsize) const {
1791     if (!nsize) return pos;
1792     auto const size = this->size();
1793     // nsize + pos can overflow (eg pos == npos), guard against that by checking
1794     // that nsize + pos does not wrap around.
1795     if (nsize + pos > size || nsize + pos < pos) return npos;
1796     // Don't use std::search, use a Boyer-Moore-like trick by comparing
1797     // the last characters first
1798     auto const haystack = data();
1799     auto const nsize_1 = nsize - 1;
1800     auto const lastNeedle = needle[nsize_1];
1801
1802     // Boyer-Moore skip value for the last char in the needle. Zero is
1803     // not a valid value; skip will be computed the first time it's
1804     // needed.
1805     size_type skip = 0;
1806
1807     const E * i = haystack + pos;
1808     auto iEnd = haystack + size - nsize_1;
1809
1810     while (i < iEnd) {
1811       // Boyer-Moore: match the last element in the needle
1812       while (i[nsize_1] != lastNeedle) {
1813         if (++i == iEnd) {
1814           // not found
1815           return npos;
1816         }
1817       }
1818       // Here we know that the last char matches
1819       // Continue in pedestrian mode
1820       for (size_t j = 0; ; ) {
1821         assert(j < nsize);
1822         if (i[j] != needle[j]) {
1823           // Not found, we can skip
1824           // Compute the skip value lazily
1825           if (skip == 0) {
1826             skip = 1;
1827             while (skip <= nsize_1 && needle[nsize_1 - skip] != lastNeedle) {
1828               ++skip;
1829             }
1830           }
1831           i += skip;
1832           break;
1833         }
1834         // Check if done searching
1835         if (++j == nsize) {
1836           // Yay
1837           return i - haystack;
1838         }
1839       }
1840     }
1841     return npos;
1842   }
1843
1844   size_type find(const value_type* s, size_type pos = 0) const {
1845     return find(s, pos, traits_type::length(s));
1846   }
1847
1848   size_type find (value_type c, size_type pos = 0) const {
1849     return find(&c, pos, 1);
1850   }
1851
1852   size_type rfind(const basic_fbstring& str, size_type pos = npos) const {
1853     return rfind(str.data(), pos, str.length());
1854   }
1855
1856   size_type rfind(const value_type* s, size_type pos, size_type n) const {
1857     if (n > length()) return npos;
1858     pos = std::min(pos, length() - n);
1859     if (n == 0) return pos;
1860
1861     const_iterator i(begin() + pos);
1862     for (; ; --i) {
1863       if (traits_type::eq(*i, *s)
1864           && traits_type::compare(&*i, s, n) == 0) {
1865         return i - begin();
1866       }
1867       if (i == begin()) break;
1868     }
1869     return npos;
1870   }
1871
1872   size_type rfind(const value_type* s, size_type pos = npos) const {
1873     return rfind(s, pos, traits_type::length(s));
1874   }
1875
1876   size_type rfind(value_type c, size_type pos = npos) const {
1877     return rfind(&c, pos, 1);
1878   }
1879
1880   size_type find_first_of(const basic_fbstring& str, size_type pos = 0) const {
1881     return find_first_of(str.data(), pos, str.length());
1882   }
1883
1884   size_type find_first_of(const value_type* s,
1885                           size_type pos, size_type n) const {
1886     if (pos > length() || n == 0) return npos;
1887     const_iterator i(begin() + pos),
1888       finish(end());
1889     for (; i != finish; ++i) {
1890       if (traits_type::find(s, n, *i) != 0) {
1891         return i - begin();
1892       }
1893     }
1894     return npos;
1895   }
1896
1897   size_type find_first_of(const value_type* s, size_type pos = 0) const {
1898     return find_first_of(s, pos, traits_type::length(s));
1899   }
1900
1901   size_type find_first_of(value_type c, size_type pos = 0) const {
1902     return find_first_of(&c, pos, 1);
1903   }
1904
1905   size_type find_last_of (const basic_fbstring& str,
1906                           size_type pos = npos) const {
1907     return find_last_of(str.data(), pos, str.length());
1908   }
1909
1910   size_type find_last_of (const value_type* s, size_type pos,
1911                           size_type n) const {
1912     if (!empty() && n > 0) {
1913       pos = std::min(pos, length() - 1);
1914       const_iterator i(begin() + pos);
1915       for (;; --i) {
1916         if (traits_type::find(s, n, *i) != 0) {
1917           return i - begin();
1918         }
1919         if (i == begin()) break;
1920       }
1921     }
1922     return npos;
1923   }
1924
1925   size_type find_last_of (const value_type* s,
1926                           size_type pos = npos) const {
1927     return find_last_of(s, pos, traits_type::length(s));
1928   }
1929
1930   size_type find_last_of (value_type c, size_type pos = npos) const {
1931     return find_last_of(&c, pos, 1);
1932   }
1933
1934   size_type find_first_not_of(const basic_fbstring& str,
1935                               size_type pos = 0) const {
1936     return find_first_not_of(str.data(), pos, str.size());
1937   }
1938
1939   size_type find_first_not_of(const value_type* s, size_type pos,
1940                               size_type n) const {
1941     if (pos < length()) {
1942       const_iterator
1943         i(begin() + pos),
1944         finish(end());
1945       for (; i != finish; ++i) {
1946         if (traits_type::find(s, n, *i) == 0) {
1947           return i - begin();
1948         }
1949       }
1950     }
1951     return npos;
1952   }
1953
1954   size_type find_first_not_of(const value_type* s,
1955                               size_type pos = 0) const {
1956     return find_first_not_of(s, pos, traits_type::length(s));
1957   }
1958
1959   size_type find_first_not_of(value_type c, size_type pos = 0) const {
1960     return find_first_not_of(&c, pos, 1);
1961   }
1962
1963   size_type find_last_not_of(const basic_fbstring& str,
1964                              size_type pos = npos) const {
1965     return find_last_not_of(str.data(), pos, str.length());
1966   }
1967
1968   size_type find_last_not_of(const value_type* s, size_type pos,
1969                              size_type n) const {
1970     if (!this->empty()) {
1971       pos = std::min(pos, size() - 1);
1972       const_iterator i(begin() + pos);
1973       for (;; --i) {
1974         if (traits_type::find(s, n, *i) == 0) {
1975           return i - begin();
1976         }
1977         if (i == begin()) break;
1978       }
1979     }
1980     return npos;
1981   }
1982
1983   size_type find_last_not_of(const value_type* s,
1984                              size_type pos = npos) const {
1985     return find_last_not_of(s, pos, traits_type::length(s));
1986   }
1987
1988   size_type find_last_not_of (value_type c, size_type pos = npos) const {
1989     return find_last_not_of(&c, pos, 1);
1990   }
1991
1992   basic_fbstring substr(size_type pos = 0, size_type n = npos) const& {
1993     enforce(pos <= size(), std::__throw_out_of_range, "");
1994     return basic_fbstring(data() + pos, std::min(n, size() - pos));
1995   }
1996
1997   basic_fbstring substr(size_type pos = 0, size_type n = npos) && {
1998     enforce(pos <= size(), std::__throw_out_of_range, "");
1999     erase(0, pos);
2000     if (n < size()) resize(n);
2001     return std::move(*this);
2002   }
2003
2004   int compare(const basic_fbstring& str) const {
2005     // FIX due to Goncalo N M de Carvalho July 18, 2005
2006     return compare(0, size(), str);
2007   }
2008
2009   int compare(size_type pos1, size_type n1,
2010               const basic_fbstring& str) const {
2011     return compare(pos1, n1, str.data(), str.size());
2012   }
2013
2014   int compare(size_type pos1, size_type n1,
2015               const value_type* s) const {
2016     return compare(pos1, n1, s, traits_type::length(s));
2017   }
2018
2019   int compare(size_type pos1, size_type n1,
2020               const value_type* s, size_type n2) const {
2021     enforce(pos1 <= size(), std::__throw_out_of_range, "");
2022     procrustes(n1, size() - pos1);
2023     // The line below fixed by Jean-Francois Bastien, 04-23-2007. Thanks!
2024     const int r = traits_type::compare(pos1 + data(), s, std::min(n1, n2));
2025     return r != 0 ? r : n1 > n2 ? 1 : n1 < n2 ? -1 : 0;
2026   }
2027
2028   int compare(size_type pos1, size_type n1,
2029               const basic_fbstring& str,
2030               size_type pos2, size_type n2) const {
2031     enforce(pos2 <= str.size(), std::__throw_out_of_range, "");
2032     return compare(pos1, n1, str.data() + pos2,
2033                    std::min(n2, str.size() - pos2));
2034   }
2035
2036   // Code from Jean-Francois Bastien (03/26/2007)
2037   int compare(const value_type* s) const {
2038     // Could forward to compare(0, size(), s, traits_type::length(s))
2039     // but that does two extra checks
2040     const size_type n1(size()), n2(traits_type::length(s));
2041     const int r = traits_type::compare(data(), s, std::min(n1, n2));
2042     return r != 0 ? r : n1 > n2 ? 1 : n1 < n2 ? -1 : 0;
2043   }
2044
2045 private:
2046   // Data
2047   Storage store_;
2048 };
2049
2050 // non-member functions
2051 // C++11 21.4.8.1/1
2052 template <typename E, class T, class A, class S>
2053 inline
2054 basic_fbstring<E, T, A, S> operator+(const basic_fbstring<E, T, A, S>& lhs,
2055                                      const basic_fbstring<E, T, A, S>& rhs) {
2056
2057   basic_fbstring<E, T, A, S> result;
2058   result.reserve(lhs.size() + rhs.size());
2059   result.append(lhs).append(rhs);
2060   return std::move(result);
2061 }
2062
2063 // C++11 21.4.8.1/2
2064 template <typename E, class T, class A, class S>
2065 inline
2066 basic_fbstring<E, T, A, S> operator+(basic_fbstring<E, T, A, S>&& lhs,
2067                                      const basic_fbstring<E, T, A, S>& rhs) {
2068   return std::move(lhs.append(rhs));
2069 }
2070
2071 // C++11 21.4.8.1/3
2072 template <typename E, class T, class A, class S>
2073 inline
2074 basic_fbstring<E, T, A, S> operator+(const basic_fbstring<E, T, A, S>& lhs,
2075                                      basic_fbstring<E, T, A, S>&& rhs) {
2076   if (rhs.capacity() >= lhs.size() + rhs.size()) {
2077     // Good, at least we don't need to reallocate
2078     return std::move(rhs.insert(0, lhs));
2079   }
2080   // Meh, no go. Forward to operator+(const&, const&).
2081   auto const& rhsC = rhs;
2082   return lhs + rhsC;
2083 }
2084
2085 // C++11 21.4.8.1/4
2086 template <typename E, class T, class A, class S>
2087 inline
2088 basic_fbstring<E, T, A, S> operator+(basic_fbstring<E, T, A, S>&& lhs,
2089                                      basic_fbstring<E, T, A, S>&& rhs) {
2090   return std::move(lhs.append(rhs));
2091 }
2092
2093 // C++11 21.4.8.1/5
2094 template <typename E, class T, class A, class S>
2095 inline
2096 basic_fbstring<E, T, A, S> operator+(
2097   const E* lhs,
2098   const basic_fbstring<E, T, A, S>& rhs) {
2099   //
2100   basic_fbstring<E, T, A, S> result;
2101   const auto len = basic_fbstring<E, T, A, S>::traits_type::length(lhs);
2102   result.reserve(len + rhs.size());
2103   result.append(lhs, len).append(rhs);
2104   return result;
2105 }
2106
2107 // C++11 21.4.8.1/6
2108 template <typename E, class T, class A, class S>
2109 inline
2110 basic_fbstring<E, T, A, S> operator+(
2111   const E* lhs,
2112   basic_fbstring<E, T, A, S>&& rhs) {
2113   //
2114   const auto len = basic_fbstring<E, T, A, S>::traits_type::length(lhs);
2115   if (rhs.capacity() >= len + rhs.size()) {
2116     // Good, at least we don't need to reallocate
2117     rhs.insert(rhs.begin(), lhs, lhs + len);
2118     return rhs;
2119   }
2120   // Meh, no go. Do it by hand since we have len already.
2121   basic_fbstring<E, T, A, S> result;
2122   result.reserve(len + rhs.size());
2123   result.append(lhs, len).append(rhs);
2124   return result;
2125 }
2126
2127 // C++11 21.4.8.1/7
2128 template <typename E, class T, class A, class S>
2129 inline
2130 basic_fbstring<E, T, A, S> operator+(
2131   E lhs,
2132   const basic_fbstring<E, T, A, S>& rhs) {
2133
2134   basic_fbstring<E, T, A, S> result;
2135   result.reserve(1 + rhs.size());
2136   result.push_back(lhs);
2137   result.append(rhs);
2138   return result;
2139 }
2140
2141 // C++11 21.4.8.1/8
2142 template <typename E, class T, class A, class S>
2143 inline
2144 basic_fbstring<E, T, A, S> operator+(
2145   E lhs,
2146   basic_fbstring<E, T, A, S>&& rhs) {
2147   //
2148   if (rhs.capacity() > rhs.size()) {
2149     // Good, at least we don't need to reallocate
2150     rhs.insert(rhs.begin(), lhs);
2151     return rhs;
2152   }
2153   // Meh, no go. Forward to operator+(E, const&).
2154   auto const& rhsC = rhs;
2155   return lhs + rhsC;
2156 }
2157
2158 // C++11 21.4.8.1/9
2159 template <typename E, class T, class A, class S>
2160 inline
2161 basic_fbstring<E, T, A, S> operator+(
2162   const basic_fbstring<E, T, A, S>& lhs,
2163   const E* rhs) {
2164
2165   typedef typename basic_fbstring<E, T, A, S>::size_type size_type;
2166   typedef typename basic_fbstring<E, T, A, S>::traits_type traits_type;
2167
2168   basic_fbstring<E, T, A, S> result;
2169   const size_type len = traits_type::length(rhs);
2170   result.reserve(lhs.size() + len);
2171   result.append(lhs).append(rhs, len);
2172   return result;
2173 }
2174
2175 // C++11 21.4.8.1/10
2176 template <typename E, class T, class A, class S>
2177 inline
2178 basic_fbstring<E, T, A, S> operator+(
2179   basic_fbstring<E, T, A, S>&& lhs,
2180   const E* rhs) {
2181   //
2182   return std::move(lhs += rhs);
2183 }
2184
2185 // C++11 21.4.8.1/11
2186 template <typename E, class T, class A, class S>
2187 inline
2188 basic_fbstring<E, T, A, S> operator+(
2189   const basic_fbstring<E, T, A, S>& lhs,
2190   E rhs) {
2191
2192   basic_fbstring<E, T, A, S> result;
2193   result.reserve(lhs.size() + 1);
2194   result.append(lhs);
2195   result.push_back(rhs);
2196   return result;
2197 }
2198
2199 // C++11 21.4.8.1/12
2200 template <typename E, class T, class A, class S>
2201 inline
2202 basic_fbstring<E, T, A, S> operator+(
2203   basic_fbstring<E, T, A, S>&& lhs,
2204   E rhs) {
2205   //
2206   return std::move(lhs += rhs);
2207 }
2208
2209 template <typename E, class T, class A, class S>
2210 inline
2211 bool operator==(const basic_fbstring<E, T, A, S>& lhs,
2212                 const basic_fbstring<E, T, A, S>& rhs) {
2213   return lhs.size() == rhs.size() && lhs.compare(rhs) == 0; }
2214
2215 template <typename E, class T, class A, class S>
2216 inline
2217 bool operator==(const typename basic_fbstring<E, T, A, S>::value_type* lhs,
2218                 const basic_fbstring<E, T, A, S>& rhs) {
2219   return rhs == lhs; }
2220
2221 template <typename E, class T, class A, class S>
2222 inline
2223 bool operator==(const basic_fbstring<E, T, A, S>& lhs,
2224                 const typename basic_fbstring<E, T, A, S>::value_type* rhs) {
2225   return lhs.compare(rhs) == 0; }
2226
2227 template <typename E, class T, class A, class S>
2228 inline
2229 bool operator!=(const basic_fbstring<E, T, A, S>& lhs,
2230                 const basic_fbstring<E, T, A, S>& rhs) {
2231   return !(lhs == rhs); }
2232
2233 template <typename E, class T, class A, class S>
2234 inline
2235 bool operator!=(const typename basic_fbstring<E, T, A, S>::value_type* lhs,
2236                 const basic_fbstring<E, T, A, S>& rhs) {
2237   return !(lhs == rhs); }
2238
2239 template <typename E, class T, class A, class S>
2240 inline
2241 bool operator!=(const basic_fbstring<E, T, A, S>& lhs,
2242                 const typename basic_fbstring<E, T, A, S>::value_type* rhs) {
2243   return !(lhs == rhs); }
2244
2245 template <typename E, class T, class A, class S>
2246 inline
2247 bool operator<(const basic_fbstring<E, T, A, S>& lhs,
2248                const basic_fbstring<E, T, A, S>& rhs) {
2249   return lhs.compare(rhs) < 0; }
2250
2251 template <typename E, class T, class A, class S>
2252 inline
2253 bool operator<(const basic_fbstring<E, T, A, S>& lhs,
2254                const typename basic_fbstring<E, T, A, S>::value_type* rhs) {
2255   return lhs.compare(rhs) < 0; }
2256
2257 template <typename E, class T, class A, class S>
2258 inline
2259 bool operator<(const typename basic_fbstring<E, T, A, S>::value_type* lhs,
2260                const basic_fbstring<E, T, A, S>& rhs) {
2261   return rhs.compare(lhs) > 0; }
2262
2263 template <typename E, class T, class A, class S>
2264 inline
2265 bool operator>(const basic_fbstring<E, T, A, S>& lhs,
2266                const basic_fbstring<E, T, A, S>& rhs) {
2267   return rhs < lhs; }
2268
2269 template <typename E, class T, class A, class S>
2270 inline
2271 bool operator>(const basic_fbstring<E, T, A, S>& lhs,
2272                const typename basic_fbstring<E, T, A, S>::value_type* rhs) {
2273   return rhs < lhs; }
2274
2275 template <typename E, class T, class A, class S>
2276 inline
2277 bool operator>(const typename basic_fbstring<E, T, A, S>::value_type* lhs,
2278                const basic_fbstring<E, T, A, S>& rhs) {
2279   return rhs < lhs; }
2280
2281 template <typename E, class T, class A, class S>
2282 inline
2283 bool operator<=(const basic_fbstring<E, T, A, S>& lhs,
2284                 const basic_fbstring<E, T, A, S>& rhs) {
2285   return !(rhs < lhs); }
2286
2287 template <typename E, class T, class A, class S>
2288 inline
2289 bool operator<=(const basic_fbstring<E, T, A, S>& lhs,
2290                 const typename basic_fbstring<E, T, A, S>::value_type* rhs) {
2291   return !(rhs < lhs); }
2292
2293 template <typename E, class T, class A, class S>
2294 inline
2295 bool operator<=(const typename basic_fbstring<E, T, A, S>::value_type* lhs,
2296                 const basic_fbstring<E, T, A, S>& rhs) {
2297   return !(rhs < lhs); }
2298
2299 template <typename E, class T, class A, class S>
2300 inline
2301 bool operator>=(const basic_fbstring<E, T, A, S>& lhs,
2302                 const basic_fbstring<E, T, A, S>& rhs) {
2303   return !(lhs < rhs); }
2304
2305 template <typename E, class T, class A, class S>
2306 inline
2307 bool operator>=(const basic_fbstring<E, T, A, S>& lhs,
2308                 const typename basic_fbstring<E, T, A, S>::value_type* rhs) {
2309   return !(lhs < rhs); }
2310
2311 template <typename E, class T, class A, class S>
2312 inline
2313 bool operator>=(const typename basic_fbstring<E, T, A, S>::value_type* lhs,
2314                 const basic_fbstring<E, T, A, S>& rhs) {
2315  return !(lhs < rhs);
2316 }
2317
2318 // C++11 21.4.8.8
2319 template <typename E, class T, class A, class S>
2320 void swap(basic_fbstring<E, T, A, S>& lhs, basic_fbstring<E, T, A, S>& rhs) {
2321   lhs.swap(rhs);
2322 }
2323
2324 // TODO: make this faster.
2325 template <typename E, class T, class A, class S>
2326 inline
2327 std::basic_istream<
2328   typename basic_fbstring<E, T, A, S>::value_type,
2329   typename basic_fbstring<E, T, A, S>::traits_type>&
2330   operator>>(
2331     std::basic_istream<typename basic_fbstring<E, T, A, S>::value_type,
2332     typename basic_fbstring<E, T, A, S>::traits_type>& is,
2333     basic_fbstring<E, T, A, S>& str) {
2334   typename std::basic_istream<E, T>::sentry sentry(is);
2335   typedef std::basic_istream<typename basic_fbstring<E, T, A, S>::value_type,
2336                              typename basic_fbstring<E, T, A, S>::traits_type>
2337                         __istream_type;
2338   typedef typename __istream_type::ios_base __ios_base;
2339   size_t extracted = 0;
2340   auto err = __ios_base::goodbit;
2341   if (sentry) {
2342     auto n = is.width();
2343     if (n <= 0) {
2344       n = str.max_size();
2345     }
2346     str.erase();
2347     for (auto got = is.rdbuf()->sgetc(); extracted != size_t(n); ++extracted) {
2348       if (got == T::eof()) {
2349         err |= __ios_base::eofbit;
2350         is.width(0);
2351         break;
2352       }
2353       if (isspace(got)) break;
2354       str.push_back(got);
2355       got = is.rdbuf()->snextc();
2356     }
2357   }
2358   if (!extracted) {
2359     err |= __ios_base::failbit;
2360   }
2361   if (err) {
2362     is.setstate(err);
2363   }
2364   return is;
2365 }
2366
2367 template <typename E, class T, class A, class S>
2368 inline
2369 std::basic_ostream<typename basic_fbstring<E, T, A, S>::value_type,
2370                    typename basic_fbstring<E, T, A, S>::traits_type>&
2371 operator<<(
2372   std::basic_ostream<typename basic_fbstring<E, T, A, S>::value_type,
2373   typename basic_fbstring<E, T, A, S>::traits_type>& os,
2374     const basic_fbstring<E, T, A, S>& str) {
2375 #if _LIBCPP_VERSION
2376   typename std::basic_ostream<
2377     typename basic_fbstring<E, T, A, S>::value_type,
2378     typename basic_fbstring<E, T, A, S>::traits_type>::sentry __s(os);
2379   if (__s) {
2380     typedef std::ostreambuf_iterator<
2381       typename basic_fbstring<E, T, A, S>::value_type,
2382       typename basic_fbstring<E, T, A, S>::traits_type> _Ip;
2383     size_t __len = str.size();
2384     bool __left =
2385       (os.flags() & std::ios_base::adjustfield) == std::ios_base::left;
2386     if (__pad_and_output(_Ip(os),
2387                          str.data(),
2388                          __left ? str.data() + __len : str.data(),
2389                          str.data() + __len,
2390                          os,
2391                          os.fill()).failed()) {
2392       os.setstate(std::ios_base::badbit | std::ios_base::failbit);
2393     }
2394   }
2395 #elif defined(_MSC_VER)
2396   // MSVC doesn't define __ostream_insert
2397   os.write(str.data(), str.size());
2398 #else
2399   std::__ostream_insert(os, str.data(), str.size());
2400 #endif
2401   return os;
2402 }
2403
2404 #ifndef _LIBSTDCXX_FBSTRING
2405
2406 template <typename E, class T, class A, class S>
2407 inline
2408 std::basic_istream<typename basic_fbstring<E, T, A, S>::value_type,
2409                    typename basic_fbstring<E, T, A, S>::traits_type>&
2410 getline(
2411   std::basic_istream<typename basic_fbstring<E, T, A, S>::value_type,
2412   typename basic_fbstring<E, T, A, S>::traits_type>& is,
2413     basic_fbstring<E, T, A, S>& str,
2414   typename basic_fbstring<E, T, A, S>::value_type delim) {
2415   // Use the nonstandard getdelim()
2416   char * buf = nullptr;
2417   size_t size = 0;
2418   for (;;) {
2419     // This looks quadratic but it really depends on realloc
2420     auto const newSize = size + 128;
2421     buf = static_cast<char*>(checkedRealloc(buf, newSize));
2422     is.getline(buf + size, newSize - size, delim);
2423     if (is.bad() || is.eof() || !is.fail()) {
2424       // done by either failure, end of file, or normal read
2425       size += std::strlen(buf + size);
2426       break;
2427     }
2428     // Here we have failed due to too short a buffer
2429     // Minus one to discount the terminating '\0'
2430     size = newSize - 1;
2431     assert(buf[size] == 0);
2432     // Clear the error so we can continue reading
2433     is.clear();
2434   }
2435   basic_fbstring<E, T, A, S> result(buf, size, size + 1,
2436                                     AcquireMallocatedString());
2437   result.swap(str);
2438   return is;
2439 }
2440
2441 template <typename E, class T, class A, class S>
2442 inline
2443 std::basic_istream<typename basic_fbstring<E, T, A, S>::value_type,
2444                    typename basic_fbstring<E, T, A, S>::traits_type>&
2445 getline(
2446   std::basic_istream<typename basic_fbstring<E, T, A, S>::value_type,
2447   typename basic_fbstring<E, T, A, S>::traits_type>& is,
2448   basic_fbstring<E, T, A, S>& str) {
2449   // Just forward to the version with a delimiter
2450   return getline(is, str, '\n');
2451 }
2452
2453 #endif
2454
2455 template <typename E1, class T, class A, class S>
2456 const typename basic_fbstring<E1, T, A, S>::size_type
2457 basic_fbstring<E1, T, A, S>::npos =
2458               static_cast<typename basic_fbstring<E1, T, A, S>::size_type>(-1);
2459
2460 #ifndef _LIBSTDCXX_FBSTRING
2461 // basic_string compatibility routines
2462
2463 template <typename E, class T, class A, class S>
2464 inline
2465 bool operator==(const basic_fbstring<E, T, A, S>& lhs,
2466                 const std::string& rhs) {
2467   return lhs.compare(0, lhs.size(), rhs.data(), rhs.size()) == 0;
2468 }
2469
2470 template <typename E, class T, class A, class S>
2471 inline
2472 bool operator==(const std::string& lhs,
2473                 const basic_fbstring<E, T, A, S>& rhs) {
2474   return rhs == lhs;
2475 }
2476
2477 template <typename E, class T, class A, class S>
2478 inline
2479 bool operator!=(const basic_fbstring<E, T, A, S>& lhs,
2480                 const std::string& rhs) {
2481   return !(lhs == rhs);
2482 }
2483
2484 template <typename E, class T, class A, class S>
2485 inline
2486 bool operator!=(const std::string& lhs,
2487                 const basic_fbstring<E, T, A, S>& rhs) {
2488   return !(lhs == rhs);
2489 }
2490
2491 #if !defined(_LIBSTDCXX_FBSTRING)
2492 typedef basic_fbstring<char> fbstring;
2493 #endif
2494
2495 // fbstring is relocatable
2496 template <class T, class R, class A, class S>
2497 FOLLY_ASSUME_RELOCATABLE(basic_fbstring<T, R, A, S>);
2498
2499 #else
2500 _GLIBCXX_END_NAMESPACE_VERSION
2501 #endif
2502
2503 } // namespace folly
2504
2505 #ifndef _LIBSTDCXX_FBSTRING
2506
2507 // Hash functions to make fbstring usable with e.g. hash_map
2508 //
2509 // Handle interaction with different C++ standard libraries, which
2510 // expect these types to be in different namespaces.
2511
2512 #define FOLLY_FBSTRING_HASH1(T) \
2513   template <> \
2514   struct hash< ::folly::basic_fbstring<T> > { \
2515     size_t operator()(const ::folly::fbstring& s) const { \
2516       return ::folly::hash::fnv32_buf(s.data(), s.size()); \
2517     } \
2518   };
2519
2520 // The C++11 standard says that these four are defined
2521 #define FOLLY_FBSTRING_HASH \
2522   FOLLY_FBSTRING_HASH1(char) \
2523   FOLLY_FBSTRING_HASH1(char16_t) \
2524   FOLLY_FBSTRING_HASH1(char32_t) \
2525   FOLLY_FBSTRING_HASH1(wchar_t)
2526
2527 namespace std {
2528
2529 FOLLY_FBSTRING_HASH
2530
2531 }  // namespace std
2532
2533 #if FOLLY_HAVE_DEPRECATED_ASSOC
2534 #if defined(_GLIBCXX_SYMVER) && !defined(__BIONIC__)
2535 namespace __gnu_cxx {
2536
2537 FOLLY_FBSTRING_HASH
2538
2539 }  // namespace __gnu_cxx
2540 #endif // _GLIBCXX_SYMVER && !__BIONIC__
2541 #endif // FOLLY_HAVE_DEPRECATED_ASSOC
2542
2543 #undef FOLLY_FBSTRING_HASH
2544 #undef FOLLY_FBSTRING_HASH1
2545
2546 #endif // _LIBSTDCXX_FBSTRING
2547
2548 #pragma GCC diagnostic pop
2549
2550 #undef FBSTRING_DISABLE_ADDRESS_SANITIZER
2551 #undef throw
2552 #undef FBSTRING_LIKELY
2553 #undef FBSTRING_UNLIKELY
2554
2555 #ifdef FOLLY_DEFINED_NDEBUG_FOR_FBSTRING
2556 #undef NDEBUG
2557 #undef FOLLY_DEFINED_NDEBUG_FOR_FBSTRING
2558 #endif // FOLLY_DEFINED_NDEBUG_FOR_FBSTRING
2559
2560 #endif // FOLLY_BASE_FBSTRING_H_