Add a comment about takeOwnership()
[folly.git] / folly / io / IOBuf.h
1 /*
2  * Copyright 2013 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef FOLLY_IO_IOBUF_H_
18 #define FOLLY_IO_IOBUF_H_
19
20 #include <glog/logging.h>
21 #include <atomic>
22 #include <cassert>
23 #include <cinttypes>
24 #include <cstddef>
25 #include <cstring>
26 #include <memory>
27 #include <limits>
28 #include <sys/uio.h>
29 #include <type_traits>
30
31 #include <boost/iterator/iterator_facade.hpp>
32
33 #include "folly/FBString.h"
34 #include "folly/Range.h"
35 #include "folly/FBVector.h"
36
37 // Ignore shadowing warnings within this file, so includers can use -Wshadow.
38 #pragma GCC diagnostic push
39 #pragma GCC diagnostic ignored "-Wshadow"
40
41 namespace folly {
42
43 /**
44  * An IOBuf is a pointer to a buffer of data.
45  *
46  * IOBuf objects are intended to be used primarily for networking code, and are
47  * modelled somewhat after FreeBSD's mbuf data structure, and Linux's sk_buff
48  * structure.
49  *
50  * IOBuf objects facilitate zero-copy network programming, by allowing multiple
51  * IOBuf objects to point to the same underlying buffer of data, using a
52  * reference count to track when the buffer is no longer needed and can be
53  * freed.
54  *
55  *
56  * Data Layout
57  * -----------
58  *
59  * The IOBuf itself is a small object containing a pointer to the buffer and
60  * information about which segment of the buffer contains valid data.
61  *
62  * The data layout looks like this:
63  *
64  *  +-------+
65  *  | IOBuf |
66  *  +-------+
67  *   /
68  *  |
69  *  v
70  *  +------------+--------------------+-----------+
71  *  | headroom   |        data        |  tailroom |
72  *  +------------+--------------------+-----------+
73  *  ^            ^                    ^           ^
74  *  buffer()   data()               tail()      bufferEnd()
75  *
76  *  The length() method returns the length of the valid data; capacity()
77  *  returns the entire capacity of the buffer (from buffer() to bufferEnd()).
78  *  The headroom() and tailroom() methods return the amount of unused capacity
79  *  available before and after the data.
80  *
81  *
82  * Buffer Sharing
83  * --------------
84  *
85  * The buffer itself is reference counted, and multiple IOBuf objects may point
86  * to the same buffer.  Each IOBuf may point to a different section of valid
87  * data within the underlying buffer.  For example, if multiple protocol
88  * requests are read from the network into a single buffer, a separate IOBuf
89  * may be created for each request, all sharing the same underlying buffer.
90  *
91  * In other words, when multiple IOBufs share the same underlying buffer, the
92  * data() and tail() methods on each IOBuf may point to a different segment of
93  * the data.  However, the buffer() and bufferEnd() methods will point to the
94  * same location for all IOBufs sharing the same underlying buffer.
95  *
96  *       +-----------+     +---------+
97  *       |  IOBuf 1  |     | IOBuf 2 |
98  *       +-----------+     +---------+
99  *        |         | _____/        |
100  *   data |    tail |/    data      | tail
101  *        v         v               v
102  *  +-------------------------------------+
103  *  |     |         |               |     |
104  *  +-------------------------------------+
105  *
106  * If you only read data from an IOBuf, you don't need to worry about other
107  * IOBuf objects possibly sharing the same underlying buffer.  However, if you
108  * ever write to the buffer you need to first ensure that no other IOBufs point
109  * to the same buffer.  The unshare() method may be used to ensure that you
110  * have an unshared buffer.
111  *
112  *
113  * IOBuf Chains
114  * ------------
115  *
116  * IOBuf objects also contain pointers to next and previous IOBuf objects.
117  * This can be used to represent a single logical piece of data that its stored
118  * in non-contiguous chunks in separate buffers.
119  *
120  * A single IOBuf object can only belong to one chain at a time.
121  *
122  * IOBuf chains are always circular.  The "prev" pointer in the head of the
123  * chain points to the tail of the chain.  However, it is up to the user to
124  * decide which IOBuf is the head.  Internally the IOBuf code does not care
125  * which element is the head.
126  *
127  * The lifetime of all IOBufs in the chain are linked: when one element in the
128  * chain is deleted, all other chained elements are also deleted.  Conceptually
129  * it is simplest to treat this as if the head of the chain owns all other
130  * IOBufs in the chain.  When you delete the head of the chain, it will delete
131  * the other elements as well.  For this reason, prependChain() and
132  * appendChain() take ownership of of the new elements being added to this
133  * chain.
134  *
135  * When the coalesce() method is used to coalesce an entire IOBuf chain into a
136  * single IOBuf, all other IOBufs in the chain are eliminated and automatically
137  * deleted.  The unshare() method may coalesce the chain; if it does it will
138  * similarly delete all IOBufs eliminated from the chain.
139  *
140  * As discussed in the following section, it is up to the user to maintain a
141  * lock around the entire IOBuf chain if multiple threads need to access the
142  * chain.  IOBuf does not provide any internal locking.
143  *
144  *
145  * Synchronization
146  * ---------------
147  *
148  * When used in multithread programs, a single IOBuf object should only be used
149  * in a single thread at a time.  If a caller uses a single IOBuf across
150  * multiple threads the caller is responsible for using an external lock to
151  * synchronize access to the IOBuf.
152  *
153  * Two separate IOBuf objects may be accessed concurrently in separate threads
154  * without locking, even if they point to the same underlying buffer.  The
155  * buffer reference count is always accessed atomically, and no other
156  * operations should affect other IOBufs that point to the same data segment.
157  * The caller is responsible for using unshare() to ensure that the data buffer
158  * is not shared by other IOBufs before writing to it, and this ensures that
159  * the data itself is not modified in one thread while also being accessed from
160  * another thread.
161  *
162  * For IOBuf chains, no two IOBufs in the same chain should be accessed
163  * simultaneously in separate threads.  The caller must maintain a lock around
164  * the entire chain if the chain, or individual IOBufs in the chain, may be
165  * accessed by multiple threads.
166  *
167  *
168  * IOBuf Object Allocation/Sharing
169  * -------------------------------
170  *
171  * IOBuf objects themselves are always allocated on the heap.  The IOBuf
172  * constructors are private, so IOBuf objects may not be created on the stack.
173  * In part this is done since some IOBuf objects use small-buffer optimization
174  * and contain the buffer data immediately after the IOBuf object itself.  The
175  * coalesce() and unshare() methods also expect to be able to delete subsequent
176  * IOBuf objects in the chain if they are no longer needed due to coalescing.
177  *
178  * The IOBuf structure also does not provide room for an intrusive refcount on
179  * the IOBuf object itself, only the underlying data buffer is reference
180  * counted.  If users want to share the same IOBuf object between multiple
181  * parts of the code, they are responsible for managing this sharing on their
182  * own.  (For example, by using a shared_ptr.  Alternatively, users always have
183  * the option of using clone() to create a second IOBuf that points to the same
184  * underlying buffer.)
185  *
186  * With jemalloc, allocating small objects like IOBuf objects should be
187  * relatively fast, and the cost of allocating IOBuf objects on the heap and
188  * cloning new IOBufs should be relatively cheap.
189  */
190 namespace detail {
191 // Is T a unique_ptr<> to a standard-layout type?
192 template <class T, class Enable=void> struct IsUniquePtrToSL
193   : public std::false_type { };
194 template <class T, class D>
195 struct IsUniquePtrToSL<
196   std::unique_ptr<T, D>,
197   typename std::enable_if<std::is_standard_layout<T>::value>::type>
198   : public std::true_type { };
199 }  // namespace detail
200
201 class IOBuf {
202  public:
203   class Iterator;
204
205   typedef ByteRange value_type;
206   typedef Iterator iterator;
207   typedef Iterator const_iterator;
208
209   typedef void (*FreeFunction)(void* buf, void* userData);
210
211   /**
212    * Allocate a new IOBuf object with the requested capacity.
213    *
214    * Returns a new IOBuf object that must be (eventually) deleted by the
215    * caller.  The returned IOBuf may actually have slightly more capacity than
216    * requested.
217    *
218    * The data pointer will initially point to the start of the newly allocated
219    * buffer, and will have a data length of 0.
220    *
221    * Throws std::bad_alloc on error.
222    */
223   static std::unique_ptr<IOBuf> create(uint32_t capacity);
224
225   /**
226    * Allocate a new IOBuf chain with the requested total capacity, allocating
227    * no more than maxBufCapacity to each buffer.
228    */
229   static std::unique_ptr<IOBuf> createChain(
230       size_t totalCapacity, uint32_t maxBufCapacity);
231
232   /**
233    * Create a new IOBuf pointing to an existing data buffer.
234    *
235    * The new IOBuffer will assume ownership of the buffer, and free it by
236    * calling the specified FreeFunction when the last IOBuf pointing to this
237    * buffer is destroyed.  The function will be called with a pointer to the
238    * buffer as the first argument, and the supplied userData value as the
239    * second argument.  The free function must never throw exceptions.
240    *
241    * If no FreeFunction is specified, the buffer will be freed using free()
242    * which will result in undefined behavior if the memory was allocated
243    * using 'new'.
244    *
245    * The IOBuf data pointer will initially point to the start of the buffer,
246    *
247    * In the first version of this function, the length of data is unspecified
248    * and is initialized to the capacity of the buffer
249    *
250    * In the second version, the user specifies the valid length of data
251    * in the buffer
252    *
253    * On error, std::bad_alloc will be thrown.  If freeOnError is true (the
254    * default) the buffer will be freed before throwing the error.
255    */
256   static std::unique_ptr<IOBuf> takeOwnership(void* buf, uint32_t capacity,
257                                               FreeFunction freeFn = NULL,
258                                               void* userData = NULL,
259                                               bool freeOnError = true) {
260     return takeOwnership(buf, capacity, capacity, freeFn,
261                          userData, freeOnError);
262   }
263
264   static std::unique_ptr<IOBuf> takeOwnership(void* buf, uint32_t capacity,
265                                               uint32_t length,
266                                               FreeFunction freeFn = NULL,
267                                               void* userData = NULL,
268                                               bool freeOnError = true);
269
270   /**
271    * Create a new IOBuf pointing to an existing data buffer made up of
272    * count objects of a given standard-layout type.
273    *
274    * This is dangerous -- it is essentially equivalent to doing
275    * reinterpret_cast<unsigned char*> on your data -- but it's often useful
276    * for serialization / deserialization.
277    *
278    * The new IOBuffer will assume ownership of the buffer, and free it
279    * appropriately (by calling the UniquePtr's custom deleter, or by calling
280    * delete or delete[] appropriately if there is no custom deleter)
281    * when the buffer is destroyed.  The custom deleter, if any, must never
282    * throw exceptions.
283    *
284    * The IOBuf data pointer will initially point to the start of the buffer,
285    * and the length will be the full capacity of the buffer (count *
286    * sizeof(T)).
287    *
288    * On error, std::bad_alloc will be thrown, and the buffer will be freed
289    * before throwing the error.
290    */
291   template <class UniquePtr>
292   static typename std::enable_if<detail::IsUniquePtrToSL<UniquePtr>::value,
293                                  std::unique_ptr<IOBuf>>::type
294   takeOwnership(UniquePtr&& buf, size_t count=1);
295
296   /**
297    * Create a new IOBuf object that points to an existing user-owned buffer.
298    *
299    * This should only be used when the caller knows the lifetime of the IOBuf
300    * object ahead of time and can ensure that all IOBuf objects that will point
301    * to this buffer will be destroyed before the buffer itself is destroyed.
302    *
303    * This buffer will not be freed automatically when the last IOBuf
304    * referencing it is destroyed.  It is the caller's responsibility to free
305    * the buffer after the last IOBuf has been destroyed.
306    *
307    * The IOBuf data pointer will initially point to the start of the buffer,
308    * and the length will be the full capacity of the buffer.
309    *
310    * An IOBuf created using wrapBuffer() will always be reported as shared.
311    * unshare() may be used to create a writable copy of the buffer.
312    *
313    * On error, std::bad_alloc will be thrown.
314    */
315   static std::unique_ptr<IOBuf> wrapBuffer(const void* buf, uint32_t capacity);
316
317   /**
318    * Convenience function to create a new IOBuf object that copies data from a
319    * user-supplied buffer, optionally allocating a given amount of
320    * headroom and tailroom.
321    */
322   static std::unique_ptr<IOBuf> copyBuffer(const void* buf, uint32_t size,
323                                            uint32_t headroom=0,
324                                            uint32_t minTailroom=0);
325
326   /**
327    * Convenience function to create a new IOBuf object that copies data from a
328    * user-supplied string, optionally allocating a given amount of
329    * headroom and tailroom.
330    *
331    * Beware when attempting to invoke this function with a constant string
332    * literal and a headroom argument: you will likely end up invoking the
333    * version of copyBuffer() above.  IOBuf::copyBuffer("hello", 3) will treat
334    * the first argument as a const void*, and will invoke the version of
335    * copyBuffer() above, with the size argument of 3.
336    */
337   static std::unique_ptr<IOBuf> copyBuffer(const std::string& buf,
338                                            uint32_t headroom=0,
339                                            uint32_t minTailroom=0);
340
341   /**
342    * A version of copyBuffer() that returns a null pointer if the input string
343    * is empty.
344    */
345   static std::unique_ptr<IOBuf> maybeCopyBuffer(const std::string& buf,
346                                                 uint32_t headroom=0,
347                                                 uint32_t minTailroom=0);
348
349   /**
350    * Convenience function to free a chain of IOBufs held by a unique_ptr.
351    */
352   static void destroy(std::unique_ptr<IOBuf>&& data) {
353     auto destroyer = std::move(data);
354   }
355
356   /**
357    * Destroy this IOBuf.
358    *
359    * Deleting an IOBuf will automatically destroy all IOBufs in the chain.
360    * (See the comments above regarding the ownership model of IOBuf chains.
361    * All subsequent IOBufs in the chain are considered to be owned by the head
362    * of the chain.  Users should only explicitly delete the head of a chain.)
363    *
364    * When each individual IOBuf is destroyed, it will release its reference
365    * count on the underlying buffer.  If it was the last user of the buffer,
366    * the buffer will be freed.
367    */
368   ~IOBuf();
369
370   /**
371    * Check whether the chain is empty (i.e., whether the IOBufs in the
372    * chain have a total data length of zero).
373    *
374    * This method is semantically equivalent to
375    *   i->computeChainDataLength()==0
376    * but may run faster because it can short-circuit as soon as it
377    * encounters a buffer with length()!=0
378    */
379   bool empty() const;
380
381   /**
382    * Get the pointer to the start of the data.
383    */
384   const uint8_t* data() const {
385     return data_;
386   }
387
388   /**
389    * Get a writable pointer to the start of the data.
390    *
391    * The caller is responsible for calling unshare() first to ensure that it is
392    * actually safe to write to the buffer.
393    */
394   uint8_t* writableData() {
395     return data_;
396   }
397
398   /**
399    * Get the pointer to the end of the data.
400    */
401   const uint8_t* tail() const {
402     return data_ + length_;
403   }
404
405   /**
406    * Get a writable pointer to the end of the data.
407    *
408    * The caller is responsible for calling unshare() first to ensure that it is
409    * actually safe to write to the buffer.
410    */
411   uint8_t* writableTail() {
412     return data_ + length_;
413   }
414
415   /**
416    * Get the data length.
417    */
418   uint32_t length() const {
419     return length_;
420   }
421
422   /**
423    * Get the amount of head room.
424    *
425    * Returns the number of bytes in the buffer before the start of the data.
426    */
427   uint32_t headroom() const {
428     return data_ - buffer();
429   }
430
431   /**
432    * Get the amount of tail room.
433    *
434    * Returns the number of bytes in the buffer after the end of the data.
435    */
436   uint32_t tailroom() const {
437     return bufferEnd() - tail();
438   }
439
440   /**
441    * Get the pointer to the start of the buffer.
442    *
443    * Note that this is the pointer to the very beginning of the usable buffer,
444    * not the start of valid data within the buffer.  Use the data() method to
445    * get a pointer to the start of the data within the buffer.
446    */
447   const uint8_t* buffer() const {
448     return (flags_ & kFlagExt) ? ext_.buf : int_.buf;
449   }
450
451   /**
452    * Get a writable pointer to the start of the buffer.
453    *
454    * The caller is responsible for calling unshare() first to ensure that it is
455    * actually safe to write to the buffer.
456    */
457   uint8_t* writableBuffer() {
458     return (flags_ & kFlagExt) ? ext_.buf : int_.buf;
459   }
460
461   /**
462    * Get the pointer to the end of the buffer.
463    *
464    * Note that this is the pointer to the very end of the usable buffer,
465    * not the end of valid data within the buffer.  Use the tail() method to
466    * get a pointer to the end of the data within the buffer.
467    */
468   const uint8_t* bufferEnd() const {
469     return (flags_ & kFlagExt) ?
470       ext_.buf + ext_.capacity :
471       int_.buf + kMaxInternalDataSize;
472   }
473
474   /**
475    * Get the total size of the buffer.
476    *
477    * This returns the total usable length of the buffer.  Use the length()
478    * method to get the length of the actual valid data in this IOBuf.
479    */
480   uint32_t capacity() const {
481     return (flags_ & kFlagExt) ?  ext_.capacity : kMaxInternalDataSize;
482   }
483
484   /**
485    * Get a pointer to the next IOBuf in this chain.
486    */
487   IOBuf* next() {
488     return next_;
489   }
490   const IOBuf* next() const {
491     return next_;
492   }
493
494   /**
495    * Get a pointer to the previous IOBuf in this chain.
496    */
497   IOBuf* prev() {
498     return prev_;
499   }
500   const IOBuf* prev() const {
501     return prev_;
502   }
503
504   /**
505    * Shift the data forwards in the buffer.
506    *
507    * This shifts the data pointer forwards in the buffer to increase the
508    * headroom.  This is commonly used to increase the headroom in a newly
509    * allocated buffer.
510    *
511    * The caller is responsible for ensuring that there is sufficient
512    * tailroom in the buffer before calling advance().
513    *
514    * If there is a non-zero data length, advance() will use memmove() to shift
515    * the data forwards in the buffer.  In this case, the caller is responsible
516    * for making sure the buffer is unshared, so it will not affect other IOBufs
517    * that may be sharing the same underlying buffer.
518    */
519   void advance(uint32_t amount) {
520     // In debug builds, assert if there is a problem.
521     assert(amount <= tailroom());
522
523     if (length_ > 0) {
524       memmove(data_ + amount, data_, length_);
525     }
526     data_ += amount;
527   }
528
529   /**
530    * Shift the data backwards in the buffer.
531    *
532    * The caller is responsible for ensuring that there is sufficient headroom
533    * in the buffer before calling retreat().
534    *
535    * If there is a non-zero data length, retreat() will use memmove() to shift
536    * the data backwards in the buffer.  In this case, the caller is responsible
537    * for making sure the buffer is unshared, so it will not affect other IOBufs
538    * that may be sharing the same underlying buffer.
539    */
540   void retreat(uint32_t amount) {
541     // In debug builds, assert if there is a problem.
542     assert(amount <= headroom());
543
544     if (length_ > 0) {
545       memmove(data_ - amount, data_, length_);
546     }
547     data_ -= amount;
548   }
549
550   /**
551    * Adjust the data pointer to include more valid data at the beginning.
552    *
553    * This moves the data pointer backwards to include more of the available
554    * buffer.  The caller is responsible for ensuring that there is sufficient
555    * headroom for the new data.  The caller is also responsible for populating
556    * this section with valid data.
557    *
558    * This does not modify any actual data in the buffer.
559    */
560   void prepend(uint32_t amount) {
561     DCHECK_LE(amount, headroom());
562     data_ -= amount;
563     length_ += amount;
564   }
565
566   /**
567    * Adjust the tail pointer to include more valid data at the end.
568    *
569    * This moves the tail pointer forwards to include more of the available
570    * buffer.  The caller is responsible for ensuring that there is sufficient
571    * tailroom for the new data.  The caller is also responsible for populating
572    * this section with valid data.
573    *
574    * This does not modify any actual data in the buffer.
575    */
576   void append(uint32_t amount) {
577     DCHECK_LE(amount, tailroom());
578     length_ += amount;
579   }
580
581   /**
582    * Adjust the data pointer forwards to include less valid data.
583    *
584    * This moves the data pointer forwards so that the first amount bytes are no
585    * longer considered valid data.  The caller is responsible for ensuring that
586    * amount is less than or equal to the actual data length.
587    *
588    * This does not modify any actual data in the buffer.
589    */
590   void trimStart(uint32_t amount) {
591     DCHECK_LE(amount, length_);
592     data_ += amount;
593     length_ -= amount;
594   }
595
596   /**
597    * Adjust the tail pointer backwards to include less valid data.
598    *
599    * This moves the tail pointer backwards so that the last amount bytes are no
600    * longer considered valid data.  The caller is responsible for ensuring that
601    * amount is less than or equal to the actual data length.
602    *
603    * This does not modify any actual data in the buffer.
604    */
605   void trimEnd(uint32_t amount) {
606     DCHECK_LE(amount, length_);
607     length_ -= amount;
608   }
609
610   /**
611    * Clear the buffer.
612    *
613    * Postcondition: headroom() == 0, length() == 0, tailroom() == capacity()
614    */
615   void clear() {
616     data_ = writableBuffer();
617     length_ = 0;
618   }
619
620   /**
621    * Ensure that this buffer has at least minHeadroom headroom bytes and at
622    * least minTailroom tailroom bytes.  The buffer must be writable
623    * (you must call unshare() before this, if necessary).
624    *
625    * Postcondition: headroom() >= minHeadroom, tailroom() >= minTailroom,
626    * the data (between data() and data() + length()) is preserved.
627    */
628   void reserve(uint32_t minHeadroom, uint32_t minTailroom) {
629     // Maybe we don't need to do anything.
630     if (headroom() >= minHeadroom && tailroom() >= minTailroom) {
631       return;
632     }
633     // If the buffer is empty but we have enough total room (head + tail),
634     // move the data_ pointer around.
635     if (length() == 0 &&
636         headroom() + tailroom() >= minHeadroom + minTailroom) {
637       data_ = writableBuffer() + minHeadroom;
638       return;
639     }
640     // Bah, we have to do actual work.
641     reserveSlow(minHeadroom, minTailroom);
642   }
643
644   /**
645    * Return true if this IOBuf is part of a chain of multiple IOBufs, or false
646    * if this is the only IOBuf in its chain.
647    */
648   bool isChained() const {
649     assert((next_ == this) == (prev_ == this));
650     return next_ != this;
651   }
652
653   /**
654    * Get the number of IOBufs in this chain.
655    *
656    * Beware that this method has to walk the entire chain.
657    * Use isChained() if you just want to check if this IOBuf is part of a chain
658    * or not.
659    */
660   uint32_t countChainElements() const;
661
662   /**
663    * Get the length of all the data in this IOBuf chain.
664    *
665    * Beware that this method has to walk the entire chain.
666    */
667   uint64_t computeChainDataLength() const;
668
669   /**
670    * Insert another IOBuf chain immediately before this IOBuf.
671    *
672    * For example, if there are two IOBuf chains (A, B, C) and (D, E, F),
673    * and B->prependChain(D) is called, the (D, E, F) chain will be subsumed
674    * and become part of the chain starting at A, which will now look like
675    * (A, D, E, F, B, C)
676    *
677    * Note that since IOBuf chains are circular, head->prependChain(other) can
678    * be used to append the other chain at the very end of the chain pointed to
679    * by head.  For example, if there are two IOBuf chains (A, B, C) and
680    * (D, E, F), and A->prependChain(D) is called, the chain starting at A will
681    * now consist of (A, B, C, D, E, F)
682    *
683    * The elements in the specified IOBuf chain will become part of this chain,
684    * and will be owned by the head of this chain.  When this chain is
685    * destroyed, all elements in the supplied chain will also be destroyed.
686    *
687    * For this reason, appendChain() only accepts an rvalue-reference to a
688    * unique_ptr(), to make it clear that it is taking ownership of the supplied
689    * chain.  If you have a raw pointer, you can pass in a new temporary
690    * unique_ptr around the raw pointer.  If you have an existing,
691    * non-temporary unique_ptr, you must call std::move(ptr) to make it clear
692    * that you are destroying the original pointer.
693    */
694   void prependChain(std::unique_ptr<IOBuf>&& iobuf);
695
696   /**
697    * Append another IOBuf chain immediately after this IOBuf.
698    *
699    * For example, if there are two IOBuf chains (A, B, C) and (D, E, F),
700    * and B->appendChain(D) is called, the (D, E, F) chain will be subsumed
701    * and become part of the chain starting at A, which will now look like
702    * (A, B, D, E, F, C)
703    *
704    * The elements in the specified IOBuf chain will become part of this chain,
705    * and will be owned by the head of this chain.  When this chain is
706    * destroyed, all elements in the supplied chain will also be destroyed.
707    *
708    * For this reason, appendChain() only accepts an rvalue-reference to a
709    * unique_ptr(), to make it clear that it is taking ownership of the supplied
710    * chain.  If you have a raw pointer, you can pass in a new temporary
711    * unique_ptr around the raw pointer.  If you have an existing,
712    * non-temporary unique_ptr, you must call std::move(ptr) to make it clear
713    * that you are destroying the original pointer.
714    */
715   void appendChain(std::unique_ptr<IOBuf>&& iobuf) {
716     // Just use prependChain() on the next element in our chain
717     next_->prependChain(std::move(iobuf));
718   }
719
720   /**
721    * Remove this IOBuf from its current chain.
722    *
723    * Since ownership of all elements an IOBuf chain is normally maintained by
724    * the head of the chain, unlink() transfers ownership of this IOBuf from the
725    * chain and gives it to the caller.  A new unique_ptr to the IOBuf is
726    * returned to the caller.  The caller must store the returned unique_ptr (or
727    * call release() on it) to take ownership, otherwise the IOBuf will be
728    * immediately destroyed.
729    *
730    * Since unlink transfers ownership of the IOBuf to the caller, be careful
731    * not to call unlink() on the head of a chain if you already maintain
732    * ownership on the head of the chain via other means.  The pop() method
733    * is a better choice for that situation.
734    */
735   std::unique_ptr<IOBuf> unlink() {
736     next_->prev_ = prev_;
737     prev_->next_ = next_;
738     prev_ = this;
739     next_ = this;
740     return std::unique_ptr<IOBuf>(this);
741   }
742
743   /**
744    * Remove this IOBuf from its current chain and return a unique_ptr to
745    * the IOBuf that formerly followed it in the chain.
746    */
747   std::unique_ptr<IOBuf> pop() {
748     IOBuf *next = next_;
749     next_->prev_ = prev_;
750     prev_->next_ = next_;
751     prev_ = this;
752     next_ = this;
753     return std::unique_ptr<IOBuf>((next == this) ? NULL : next);
754   }
755
756   /**
757    * Remove a subchain from this chain.
758    *
759    * Remove the subchain starting at head and ending at tail from this chain.
760    *
761    * Returns a unique_ptr pointing to head.  (In other words, ownership of the
762    * head of the subchain is transferred to the caller.)  If the caller ignores
763    * the return value and lets the unique_ptr be destroyed, the subchain will
764    * be immediately destroyed.
765    *
766    * The subchain referenced by the specified head and tail must be part of the
767    * same chain as the current IOBuf, but must not contain the current IOBuf.
768    * However, the specified head and tail may be equal to each other (i.e.,
769    * they may be a subchain of length 1).
770    */
771   std::unique_ptr<IOBuf> separateChain(IOBuf* head, IOBuf* tail) {
772     assert(head != this);
773     assert(tail != this);
774
775     head->prev_->next_ = tail->next_;
776     tail->next_->prev_ = head->prev_;
777
778     head->prev_ = tail;
779     tail->next_ = head;
780
781     return std::unique_ptr<IOBuf>(head);
782   }
783
784   /**
785    * Return true if at least one of the IOBufs in this chain are shared,
786    * or false if all of the IOBufs point to unique buffers.
787    *
788    * Use isSharedOne() to only check this IOBuf rather than the entire chain.
789    */
790   bool isShared() const {
791     const IOBuf* current = this;
792     while (true) {
793       if (current->isSharedOne()) {
794         return true;
795       }
796       current = current->next_;
797       if (current == this) {
798         return false;
799       }
800     }
801   }
802
803   /**
804    * Return true if other IOBufs are also pointing to the buffer used by this
805    * IOBuf, and false otherwise.
806    *
807    * If this IOBuf points at a buffer owned by another (non-IOBuf) part of the
808    * code (i.e., if the IOBuf was created using wrapBuffer(), or was cloned
809    * from such an IOBuf), it is always considered shared.
810    *
811    * This only checks the current IOBuf, and not other IOBufs in the chain.
812    */
813   bool isSharedOne() const {
814     if (LIKELY(flags_ & (kFlagUserOwned | kFlagMaybeShared)) == 0) {
815       return false;
816     }
817
818     // If this is a user-owned buffer, it is always considered shared
819     if (flags_ & kFlagUserOwned) {
820       return true;
821     }
822
823     // an internal buffer wouldn't have kFlagMaybeShared or kFlagUserOwned
824     // so we would have returned false already.  The only remaining case
825     // is an external buffer which may be shared, so we need to read
826     // the reference count.
827     assert((flags_ & (kFlagExt | kFlagMaybeShared)) ==
828            (kFlagExt | kFlagMaybeShared));
829
830     bool shared =
831       ext_.sharedInfo->refcount.load(std::memory_order_acquire) > 1;
832     if (!shared) {
833       // we're the last one left
834       flags_ &= ~kFlagMaybeShared;
835     }
836     return shared;
837   }
838
839   /**
840    * Ensure that this IOBuf has a unique buffer that is not shared by other
841    * IOBufs.
842    *
843    * unshare() operates on an entire chain of IOBuf objects.  If the chain is
844    * shared, it may also coalesce the chain when making it unique.  If the
845    * chain is coalesced, subsequent IOBuf objects in the current chain will be
846    * automatically deleted.
847    *
848    * Note that buffers owned by other (non-IOBuf) users are automatically
849    * considered shared.
850    *
851    * Throws std::bad_alloc on error.  On error the IOBuf chain will be
852    * unmodified.
853    *
854    * Currently unshare may also throw std::overflow_error if it tries to
855    * coalesce.  (TODO: In the future it would be nice if unshare() were smart
856    * enough not to coalesce the entire buffer if the data is too large.
857    * However, in practice this seems unlikely to become an issue.)
858    */
859   void unshare() {
860     if (isChained()) {
861       unshareChained();
862     } else {
863       unshareOne();
864     }
865   }
866
867   /**
868    * Ensure that this IOBuf has a unique buffer that is not shared by other
869    * IOBufs.
870    *
871    * unshareOne() operates on a single IOBuf object.  This IOBuf will have a
872    * unique buffer after unshareOne() returns, but other IOBufs in the chain
873    * may still be shared after unshareOne() returns.
874    *
875    * Throws std::bad_alloc on error.  On error the IOBuf will be unmodified.
876    */
877   void unshareOne() {
878     if (isSharedOne()) {
879       unshareOneSlow();
880     }
881   }
882
883   /**
884    * Coalesce this IOBuf chain into a single buffer.
885    *
886    * This method moves all of the data in this IOBuf chain into a single
887    * contiguous buffer, if it is not already in one buffer.  After coalesce()
888    * returns, this IOBuf will be a chain of length one.  Other IOBufs in the
889    * chain will be automatically deleted.
890    *
891    * After coalescing, the IOBuf will have at least as much headroom as the
892    * first IOBuf in the chain, and at least as much tailroom as the last IOBuf
893    * in the chain.
894    *
895    * Throws std::bad_alloc on error.  On error the IOBuf chain will be
896    * unmodified.  Throws std::overflow_error if the length of the entire chain
897    * larger than can be described by a uint32_t capacity.
898    */
899   void coalesce() {
900     if (!isChained()) {
901       return;
902     }
903     coalesceSlow();
904   }
905
906   /**
907    * Ensure that this chain has at least maxLength bytes available as a
908    * contiguous memory range.
909    *
910    * This method coalesces whole buffers in the chain into this buffer as
911    * necessary until this buffer's length() is at least maxLength.
912    *
913    * After coalescing, the IOBuf will have at least as much headroom as the
914    * first IOBuf in the chain, and at least as much tailroom as the last IOBuf
915    * that was coalesced.
916    *
917    * Throws std::bad_alloc on error.  On error the IOBuf chain will be
918    * unmodified.  Throws std::overflow_error if the length of the coalesced
919    * portion of the chain is larger than can be described by a uint32_t
920    * capacity.  (Although maxLength is uint32_t, gather() doesn't split
921    * buffers, so coalescing whole buffers may result in a capacity that can't
922    * be described in uint32_t.
923    *
924    * Upon return, either enough of the chain was coalesced into a contiguous
925    * region, or the entire chain was coalesced.  That is,
926    * length() >= maxLength || !isChained() is true.
927    */
928   void gather(uint32_t maxLength) {
929     if (!isChained() || length_ >= maxLength) {
930       return;
931     }
932     coalesceSlow(maxLength);
933   }
934
935   /**
936    * Return a new IOBuf chain sharing the same data as this chain.
937    *
938    * The new IOBuf chain will normally point to the same underlying data
939    * buffers as the original chain.  (The one exception to this is if some of
940    * the IOBufs in this chain contain small internal data buffers which cannot
941    * be shared.)
942    */
943   std::unique_ptr<IOBuf> clone() const;
944
945   /**
946    * Return a new IOBuf with the same data as this IOBuf.
947    *
948    * The new IOBuf returned will not be part of a chain (even if this IOBuf is
949    * part of a larger chain).
950    */
951   std::unique_ptr<IOBuf> cloneOne() const;
952
953   /**
954    * Return an iovector suitable for e.g. writev()
955    *
956    *   auto iov = buf->getIov();
957    *   auto xfer = writev(fd, iov.data(), iov.size());
958    *
959    * Naturally, the returned iovector is invalid if you modify the buffer
960    * chain.
961    */
962   folly::fbvector<struct iovec> getIov() const;
963
964   // Overridden operator new and delete.
965   // These directly use malloc() and free() to allocate the space for IOBuf
966   // objects.  This is needed since IOBuf::create() manually uses malloc when
967   // allocating IOBuf objects with an internal buffer.
968   void* operator new(size_t size);
969   void* operator new(size_t size, void* ptr);
970   void operator delete(void* ptr);
971
972   /**
973    * Destructively convert this IOBuf to a fbstring efficiently.
974    * We rely on fbstring's AcquireMallocatedString constructor to
975    * transfer memory.
976    */
977   fbstring moveToFbString();
978
979   /**
980    * Iteration support: a chain of IOBufs may be iterated through using
981    * STL-style iterators over const ByteRanges.  Iterators are only invalidated
982    * if the IOBuf that they currently point to is removed.
983    */
984   Iterator cbegin() const;
985   Iterator cend() const;
986   Iterator begin() const;
987   Iterator end() const;
988
989  private:
990   enum FlagsEnum : uint32_t {
991     kFlagExt = 0x1,
992     kFlagUserOwned = 0x2,
993     kFlagFreeSharedInfo = 0x4,
994     kFlagMaybeShared = 0x8,
995   };
996
997   // Values for the ExternalBuf type field.
998   // We currently don't really use this for anything, other than to have it
999   // around for debugging purposes.  We store it at the moment just because we
1000   // have the 4 extra bytes in the ExternalBuf struct that would just be
1001   // padding otherwise.
1002   enum ExtBufTypeEnum {
1003     kExtAllocated = 0,
1004     kExtUserSupplied = 1,
1005     kExtUserOwned = 2,
1006   };
1007
1008   struct SharedInfo {
1009     SharedInfo();
1010     SharedInfo(FreeFunction fn, void* arg);
1011
1012     // A pointer to a function to call to free the buffer when the refcount
1013     // hits 0.  If this is NULL, free() will be used instead.
1014     FreeFunction freeFn;
1015     void* userData;
1016     std::atomic<uint32_t> refcount;
1017   };
1018   struct ExternalBuf {
1019     uint32_t capacity;
1020     uint32_t type;
1021     uint8_t* buf;
1022     // SharedInfo may be NULL if kFlagUserOwned is set.  It is non-NULL
1023     // in all other cases.
1024     SharedInfo* sharedInfo;
1025   };
1026   struct InternalBuf {
1027     uint8_t buf[] __attribute__((aligned));
1028   };
1029
1030   // The maximum size for an IOBuf object, including any internal data buffer
1031   static const uint32_t kMaxIOBufSize = 256;
1032   static const uint32_t kMaxInternalDataSize;
1033
1034   // Forbidden copy constructor and assignment opererator
1035   IOBuf(IOBuf const &);
1036   IOBuf& operator=(IOBuf const &);
1037
1038   /**
1039    * Create a new IOBuf with internal data.
1040    *
1041    * end is a pointer to the end of the IOBuf's internal data buffer.
1042    */
1043   explicit IOBuf(uint8_t* end);
1044
1045   /**
1046    * Create a new IOBuf pointing to an external buffer.
1047    *
1048    * The caller is responsible for holding a reference count for this new
1049    * IOBuf.  The IOBuf constructor does not automatically increment the
1050    * reference count.
1051    */
1052   IOBuf(ExtBufTypeEnum type, uint32_t flags,
1053         uint8_t* buf, uint32_t capacity,
1054         uint8_t* data, uint32_t length,
1055         SharedInfo* sharedInfo);
1056
1057   void unshareOneSlow();
1058   void unshareChained();
1059   void coalesceSlow(size_t maxLength=std::numeric_limits<size_t>::max());
1060   // newLength must be the entire length of the buffers between this and
1061   // end (no truncation)
1062   void coalesceAndReallocate(
1063       size_t newHeadroom,
1064       size_t newLength,
1065       IOBuf* end,
1066       size_t newTailroom);
1067   void decrementRefcount();
1068   void reserveSlow(uint32_t minHeadroom, uint32_t minTailroom);
1069
1070   static size_t goodExtBufferSize(uint32_t minCapacity);
1071   static void initExtBuffer(uint8_t* buf, size_t mallocSize,
1072                             SharedInfo** infoReturn,
1073                             uint32_t* capacityReturn);
1074   static void allocExtBuffer(uint32_t minCapacity,
1075                              uint8_t** bufReturn,
1076                              SharedInfo** infoReturn,
1077                              uint32_t* capacityReturn);
1078
1079   /*
1080    * Member variables
1081    */
1082
1083   /*
1084    * Links to the next and the previous IOBuf in this chain.
1085    *
1086    * The chain is circularly linked (the last element in the chain points back
1087    * at the head), and next_ and prev_ can never be NULL.  If this IOBuf is the
1088    * only element in the chain, next_ and prev_ will both point to this.
1089    */
1090   IOBuf* next_;
1091   IOBuf* prev_;
1092
1093   /*
1094    * A pointer to the start of the data referenced by this IOBuf, and the
1095    * length of the data.
1096    *
1097    * This may refer to any subsection of the actual buffer capacity.
1098    */
1099   uint8_t* data_;
1100   uint32_t length_;
1101   mutable uint32_t flags_;
1102
1103   union {
1104     ExternalBuf ext_;
1105     InternalBuf int_;
1106   };
1107
1108   struct DeleterBase {
1109     virtual ~DeleterBase() { }
1110     virtual void dispose(void* p) = 0;
1111   };
1112
1113   template <class UniquePtr>
1114   struct UniquePtrDeleter : public DeleterBase {
1115     typedef typename UniquePtr::pointer Pointer;
1116     typedef typename UniquePtr::deleter_type Deleter;
1117
1118     explicit UniquePtrDeleter(Deleter deleter) : deleter_(std::move(deleter)){ }
1119     void dispose(void* p) {
1120       try {
1121         deleter_(static_cast<Pointer>(p));
1122         delete this;
1123       } catch (...) {
1124         abort();
1125       }
1126     }
1127
1128    private:
1129     Deleter deleter_;
1130   };
1131
1132   static void freeUniquePtrBuffer(void* ptr, void* userData) {
1133     static_cast<DeleterBase*>(userData)->dispose(ptr);
1134   }
1135 };
1136
1137 template <class UniquePtr>
1138 typename std::enable_if<detail::IsUniquePtrToSL<UniquePtr>::value,
1139                         std::unique_ptr<IOBuf>>::type
1140 IOBuf::takeOwnership(UniquePtr&& buf, size_t count) {
1141   size_t size = count * sizeof(typename UniquePtr::element_type);
1142   DCHECK_LT(size, size_t(std::numeric_limits<uint32_t>::max()));
1143   auto deleter = new UniquePtrDeleter<UniquePtr>(buf.get_deleter());
1144   return takeOwnership(buf.release(),
1145                        size,
1146                        &IOBuf::freeUniquePtrBuffer,
1147                        deleter);
1148 }
1149
1150 inline std::unique_ptr<IOBuf> IOBuf::copyBuffer(
1151     const void* data, uint32_t size, uint32_t headroom,
1152     uint32_t minTailroom) {
1153   uint32_t capacity = headroom + size + minTailroom;
1154   std::unique_ptr<IOBuf> buf = create(capacity);
1155   buf->advance(headroom);
1156   memcpy(buf->writableData(), data, size);
1157   buf->append(size);
1158   return buf;
1159 }
1160
1161 inline std::unique_ptr<IOBuf> IOBuf::copyBuffer(const std::string& buf,
1162                                                 uint32_t headroom,
1163                                                 uint32_t minTailroom) {
1164   return copyBuffer(buf.data(), buf.size(), headroom, minTailroom);
1165 }
1166
1167 inline std::unique_ptr<IOBuf> IOBuf::maybeCopyBuffer(const std::string& buf,
1168                                                      uint32_t headroom,
1169                                                      uint32_t minTailroom) {
1170   if (buf.empty()) {
1171     return nullptr;
1172   }
1173   return copyBuffer(buf.data(), buf.size(), headroom, minTailroom);
1174 }
1175
1176 class IOBuf::Iterator : public boost::iterator_facade<
1177     IOBuf::Iterator,  // Derived
1178     const ByteRange,  // Value
1179     boost::forward_traversal_tag  // Category or traversal
1180   > {
1181   friend class boost::iterator_core_access;
1182  public:
1183   // Note that IOBufs are stored as a circular list without a guard node,
1184   // so pos == end is ambiguous (it may mean "begin" or "end").  To solve
1185   // the ambiguity (at the cost of one extra comparison in the "increment"
1186   // code path), we define end iterators as having pos_ == end_ == nullptr
1187   // and we only allow forward iteration.
1188   explicit Iterator(const IOBuf* pos, const IOBuf* end)
1189     : pos_(pos),
1190       end_(end) {
1191     // Sadly, we must return by const reference, not by value.
1192     if (pos_) {
1193       setVal();
1194     }
1195   }
1196
1197  private:
1198   void setVal() {
1199     val_ = ByteRange(pos_->data(), pos_->tail());
1200   }
1201
1202   void adjustForEnd() {
1203     if (pos_ == end_) {
1204       pos_ = end_ = nullptr;
1205       val_ = ByteRange();
1206     } else {
1207       setVal();
1208     }
1209   }
1210
1211   const ByteRange& dereference() const {
1212     return val_;
1213   }
1214
1215   bool equal(const Iterator& other) const {
1216     // We must compare end_ in addition to pos_, because forward traversal
1217     // requires that if two iterators are equal (a == b) and dereferenceable,
1218     // then ++a == ++b.
1219     return pos_ == other.pos_ && end_ == other.end_;
1220   }
1221
1222   void increment() {
1223     pos_ = pos_->next();
1224     adjustForEnd();
1225   }
1226
1227   const IOBuf* pos_;
1228   const IOBuf* end_;
1229   ByteRange val_;
1230 };
1231
1232 inline IOBuf::Iterator IOBuf::begin() const { return cbegin(); }
1233 inline IOBuf::Iterator IOBuf::end() const { return cend(); }
1234
1235 } // folly
1236
1237 #pragma GCC diagnostic pop
1238
1239 #endif // FOLLY_IO_IOBUF_H_