e9048626b0bc7977dd16c17456cd0c2947477bc3
[folly.git] / folly / io / IOBuf.h
1 /*
2  * Copyright 2013 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef FOLLY_IO_IOBUF_H_
18 #define FOLLY_IO_IOBUF_H_
19
20 #include <glog/logging.h>
21 #include <atomic>
22 #include <cassert>
23 #include <cinttypes>
24 #include <cstddef>
25 #include <cstring>
26 #include <memory>
27 #include <limits>
28 #include <sys/uio.h>
29 #include <type_traits>
30
31 #include <boost/iterator/iterator_facade.hpp>
32
33 #include "folly/FBString.h"
34 #include "folly/Range.h"
35 #include "folly/FBVector.h"
36
37 // Ignore shadowing warnings within this file, so includers can use -Wshadow.
38 #pragma GCC diagnostic push
39 #pragma GCC diagnostic ignored "-Wshadow"
40
41 namespace folly {
42
43 /**
44  * An IOBuf is a pointer to a buffer of data.
45  *
46  * IOBuf objects are intended to be used primarily for networking code, and are
47  * modelled somewhat after FreeBSD's mbuf data structure, and Linux's sk_buff
48  * structure.
49  *
50  * IOBuf objects facilitate zero-copy network programming, by allowing multiple
51  * IOBuf objects to point to the same underlying buffer of data, using a
52  * reference count to track when the buffer is no longer needed and can be
53  * freed.
54  *
55  *
56  * Data Layout
57  * -----------
58  *
59  * The IOBuf itself is a small object containing a pointer to the buffer and
60  * information about which segment of the buffer contains valid data.
61  *
62  * The data layout looks like this:
63  *
64  *  +-------+
65  *  | IOBuf |
66  *  +-------+
67  *   /
68  *  |
69  *  v
70  *  +------------+--------------------+-----------+
71  *  | headroom   |        data        |  tailroom |
72  *  +------------+--------------------+-----------+
73  *  ^            ^                    ^           ^
74  *  buffer()   data()               tail()      bufferEnd()
75  *
76  *  The length() method returns the length of the valid data; capacity()
77  *  returns the entire capacity of the buffer (from buffer() to bufferEnd()).
78  *  The headroom() and tailroom() methods return the amount of unused capacity
79  *  available before and after the data.
80  *
81  *
82  * Buffer Sharing
83  * --------------
84  *
85  * The buffer itself is reference counted, and multiple IOBuf objects may point
86  * to the same buffer.  Each IOBuf may point to a different section of valid
87  * data within the underlying buffer.  For example, if multiple protocol
88  * requests are read from the network into a single buffer, a separate IOBuf
89  * may be created for each request, all sharing the same underlying buffer.
90  *
91  * In other words, when multiple IOBufs share the same underlying buffer, the
92  * data() and tail() methods on each IOBuf may point to a different segment of
93  * the data.  However, the buffer() and bufferEnd() methods will point to the
94  * same location for all IOBufs sharing the same underlying buffer.
95  *
96  *       +-----------+     +---------+
97  *       |  IOBuf 1  |     | IOBuf 2 |
98  *       +-----------+     +---------+
99  *        |         | _____/        |
100  *   data |    tail |/    data      | tail
101  *        v         v               v
102  *  +-------------------------------------+
103  *  |     |         |               |     |
104  *  +-------------------------------------+
105  *
106  * If you only read data from an IOBuf, you don't need to worry about other
107  * IOBuf objects possibly sharing the same underlying buffer.  However, if you
108  * ever write to the buffer you need to first ensure that no other IOBufs point
109  * to the same buffer.  The unshare() method may be used to ensure that you
110  * have an unshared buffer.
111  *
112  *
113  * IOBuf Chains
114  * ------------
115  *
116  * IOBuf objects also contain pointers to next and previous IOBuf objects.
117  * This can be used to represent a single logical piece of data that its stored
118  * in non-contiguous chunks in separate buffers.
119  *
120  * A single IOBuf object can only belong to one chain at a time.
121  *
122  * IOBuf chains are always circular.  The "prev" pointer in the head of the
123  * chain points to the tail of the chain.  However, it is up to the user to
124  * decide which IOBuf is the head.  Internally the IOBuf code does not care
125  * which element is the head.
126  *
127  * The lifetime of all IOBufs in the chain are linked: when one element in the
128  * chain is deleted, all other chained elements are also deleted.  Conceptually
129  * it is simplest to treat this as if the head of the chain owns all other
130  * IOBufs in the chain.  When you delete the head of the chain, it will delete
131  * the other elements as well.  For this reason, prependChain() and
132  * appendChain() take ownership of of the new elements being added to this
133  * chain.
134  *
135  * When the coalesce() method is used to coalesce an entire IOBuf chain into a
136  * single IOBuf, all other IOBufs in the chain are eliminated and automatically
137  * deleted.  The unshare() method may coalesce the chain; if it does it will
138  * similarly delete all IOBufs eliminated from the chain.
139  *
140  * As discussed in the following section, it is up to the user to maintain a
141  * lock around the entire IOBuf chain if multiple threads need to access the
142  * chain.  IOBuf does not provide any internal locking.
143  *
144  *
145  * Synchronization
146  * ---------------
147  *
148  * When used in multithread programs, a single IOBuf object should only be used
149  * in a single thread at a time.  If a caller uses a single IOBuf across
150  * multiple threads the caller is responsible for using an external lock to
151  * synchronize access to the IOBuf.
152  *
153  * Two separate IOBuf objects may be accessed concurrently in separate threads
154  * without locking, even if they point to the same underlying buffer.  The
155  * buffer reference count is always accessed atomically, and no other
156  * operations should affect other IOBufs that point to the same data segment.
157  * The caller is responsible for using unshare() to ensure that the data buffer
158  * is not shared by other IOBufs before writing to it, and this ensures that
159  * the data itself is not modified in one thread while also being accessed from
160  * another thread.
161  *
162  * For IOBuf chains, no two IOBufs in the same chain should be accessed
163  * simultaneously in separate threads.  The caller must maintain a lock around
164  * the entire chain if the chain, or individual IOBufs in the chain, may be
165  * accessed by multiple threads.
166  *
167  *
168  * IOBuf Object Allocation/Sharing
169  * -------------------------------
170  *
171  * IOBuf objects themselves are always allocated on the heap.  The IOBuf
172  * constructors are private, so IOBuf objects may not be created on the stack.
173  * In part this is done since some IOBuf objects use small-buffer optimization
174  * and contain the buffer data immediately after the IOBuf object itself.  The
175  * coalesce() and unshare() methods also expect to be able to delete subsequent
176  * IOBuf objects in the chain if they are no longer needed due to coalescing.
177  *
178  * The IOBuf structure also does not provide room for an intrusive refcount on
179  * the IOBuf object itself, only the underlying data buffer is reference
180  * counted.  If users want to share the same IOBuf object between multiple
181  * parts of the code, they are responsible for managing this sharing on their
182  * own.  (For example, by using a shared_ptr.  Alternatively, users always have
183  * the option of using clone() to create a second IOBuf that points to the same
184  * underlying buffer.)
185  *
186  * With jemalloc, allocating small objects like IOBuf objects should be
187  * relatively fast, and the cost of allocating IOBuf objects on the heap and
188  * cloning new IOBufs should be relatively cheap.
189  */
190 namespace detail {
191 // Is T a unique_ptr<> to a standard-layout type?
192 template <class T, class Enable=void> struct IsUniquePtrToSL
193   : public std::false_type { };
194 template <class T, class D>
195 struct IsUniquePtrToSL<
196   std::unique_ptr<T, D>,
197   typename std::enable_if<std::is_standard_layout<T>::value>::type>
198   : public std::true_type { };
199 }  // namespace detail
200
201 class IOBuf {
202  public:
203   class Iterator;
204
205   typedef ByteRange value_type;
206   typedef Iterator iterator;
207   typedef Iterator const_iterator;
208
209   typedef void (*FreeFunction)(void* buf, void* userData);
210
211   /**
212    * Allocate a new IOBuf object with the requested capacity.
213    *
214    * Returns a new IOBuf object that must be (eventually) deleted by the
215    * caller.  The returned IOBuf may actually have slightly more capacity than
216    * requested.
217    *
218    * The data pointer will initially point to the start of the newly allocated
219    * buffer, and will have a data length of 0.
220    *
221    * Throws std::bad_alloc on error.
222    */
223   static std::unique_ptr<IOBuf> create(uint32_t capacity);
224
225   /**
226    * Allocate a new IOBuf chain with the requested total capacity, allocating
227    * no more than maxBufCapacity to each buffer.
228    */
229   static std::unique_ptr<IOBuf> createChain(
230       size_t totalCapacity, uint32_t maxBufCapacity);
231
232   /**
233    * Create a new IOBuf pointing to an existing data buffer.
234    *
235    * The new IOBuffer will assume ownership of the buffer, and free it by
236    * calling the specified FreeFunction when the last IOBuf pointing to this
237    * buffer is destroyed.  The function will be called with a pointer to the
238    * buffer as the first argument, and the supplied userData value as the
239    * second argument.  The free function must never throw exceptions.
240    *
241    * If no FreeFunction is specified, the buffer will be freed using free()
242    * which will result in undefined behavior if the memory was allocated
243    * using 'new'.
244    *
245    * The IOBuf data pointer will initially point to the start of the buffer,
246    *
247    * In the first version of this function, the length of data is unspecified
248    * and is initialized to the capacity of the buffer
249    *
250    * In the second version, the user specifies the valid length of data
251    * in the buffer
252    *
253    * On error, std::bad_alloc will be thrown.  If freeOnError is true (the
254    * default) the buffer will be freed before throwing the error.
255    */
256   static std::unique_ptr<IOBuf> takeOwnership(void* buf, uint32_t capacity,
257                                               FreeFunction freeFn = NULL,
258                                               void* userData = NULL,
259                                               bool freeOnError = true) {
260     return takeOwnership(buf, capacity, capacity, freeFn,
261                          userData, freeOnError);
262   }
263
264   static std::unique_ptr<IOBuf> takeOwnership(void* buf, uint32_t capacity,
265                                               uint32_t length,
266                                               FreeFunction freeFn = NULL,
267                                               void* userData = NULL,
268                                               bool freeOnError = true);
269
270   /**
271    * Create a new IOBuf pointing to an existing data buffer made up of
272    * count objects of a given standard-layout type.
273    *
274    * This is dangerous -- it is essentially equivalent to doing
275    * reinterpret_cast<unsigned char*> on your data -- but it's often useful
276    * for serialization / deserialization.
277    *
278    * The new IOBuffer will assume ownership of the buffer, and free it
279    * appropriately (by calling the UniquePtr's custom deleter, or by calling
280    * delete or delete[] appropriately if there is no custom deleter)
281    * when the buffer is destroyed.  The custom deleter, if any, must never
282    * throw exceptions.
283    *
284    * The IOBuf data pointer will initially point to the start of the buffer,
285    * and the length will be the full capacity of the buffer (count *
286    * sizeof(T)).
287    *
288    * On error, std::bad_alloc will be thrown, and the buffer will be freed
289    * before throwing the error.
290    */
291   template <class UniquePtr>
292   static typename std::enable_if<detail::IsUniquePtrToSL<UniquePtr>::value,
293                                  std::unique_ptr<IOBuf>>::type
294   takeOwnership(UniquePtr&& buf, size_t count=1);
295
296   /**
297    * Create a new IOBuf object that points to an existing user-owned buffer.
298    *
299    * This should only be used when the caller knows the lifetime of the IOBuf
300    * object ahead of time and can ensure that all IOBuf objects that will point
301    * to this buffer will be destroyed before the buffer itself is destroyed.
302    *
303    * This buffer will not be freed automatically when the last IOBuf
304    * referencing it is destroyed.  It is the caller's responsibility to free
305    * the buffer after the last IOBuf has been destroyed.
306    *
307    * The IOBuf data pointer will initially point to the start of the buffer,
308    * and the length will be the full capacity of the buffer.
309    *
310    * An IOBuf created using wrapBuffer() will always be reported as shared.
311    * unshare() may be used to create a writable copy of the buffer.
312    *
313    * On error, std::bad_alloc will be thrown.
314    */
315   static std::unique_ptr<IOBuf> wrapBuffer(const void* buf, uint32_t capacity);
316   static std::unique_ptr<IOBuf> wrapBuffer(ByteRange br) {
317     CHECK_LE(br.size(), std::numeric_limits<uint32_t>::max());
318     return wrapBuffer(br.data(), br.size());
319   }
320
321   /**
322    * Convenience function to create a new IOBuf object that copies data from a
323    * user-supplied buffer, optionally allocating a given amount of
324    * headroom and tailroom.
325    */
326   static std::unique_ptr<IOBuf> copyBuffer(const void* buf, uint32_t size,
327                                            uint32_t headroom=0,
328                                            uint32_t minTailroom=0);
329   static std::unique_ptr<IOBuf> copyBuffer(ByteRange br,
330                                            uint32_t headroom=0,
331                                            uint32_t minTailroom=0) {
332     CHECK_LE(br.size(), std::numeric_limits<uint32_t>::max());
333     return copyBuffer(br.data(), br.size(), headroom, minTailroom);
334   }
335
336   /**
337    * Convenience function to create a new IOBuf object that copies data from a
338    * user-supplied string, optionally allocating a given amount of
339    * headroom and tailroom.
340    *
341    * Beware when attempting to invoke this function with a constant string
342    * literal and a headroom argument: you will likely end up invoking the
343    * version of copyBuffer() above.  IOBuf::copyBuffer("hello", 3) will treat
344    * the first argument as a const void*, and will invoke the version of
345    * copyBuffer() above, with the size argument of 3.
346    */
347   static std::unique_ptr<IOBuf> copyBuffer(const std::string& buf,
348                                            uint32_t headroom=0,
349                                            uint32_t minTailroom=0);
350
351   /**
352    * A version of copyBuffer() that returns a null pointer if the input string
353    * is empty.
354    */
355   static std::unique_ptr<IOBuf> maybeCopyBuffer(const std::string& buf,
356                                                 uint32_t headroom=0,
357                                                 uint32_t minTailroom=0);
358
359   /**
360    * Convenience function to free a chain of IOBufs held by a unique_ptr.
361    */
362   static void destroy(std::unique_ptr<IOBuf>&& data) {
363     auto destroyer = std::move(data);
364   }
365
366   /**
367    * Destroy this IOBuf.
368    *
369    * Deleting an IOBuf will automatically destroy all IOBufs in the chain.
370    * (See the comments above regarding the ownership model of IOBuf chains.
371    * All subsequent IOBufs in the chain are considered to be owned by the head
372    * of the chain.  Users should only explicitly delete the head of a chain.)
373    *
374    * When each individual IOBuf is destroyed, it will release its reference
375    * count on the underlying buffer.  If it was the last user of the buffer,
376    * the buffer will be freed.
377    */
378   ~IOBuf();
379
380   /**
381    * Check whether the chain is empty (i.e., whether the IOBufs in the
382    * chain have a total data length of zero).
383    *
384    * This method is semantically equivalent to
385    *   i->computeChainDataLength()==0
386    * but may run faster because it can short-circuit as soon as it
387    * encounters a buffer with length()!=0
388    */
389   bool empty() const;
390
391   /**
392    * Get the pointer to the start of the data.
393    */
394   const uint8_t* data() const {
395     return data_;
396   }
397
398   /**
399    * Get a writable pointer to the start of the data.
400    *
401    * The caller is responsible for calling unshare() first to ensure that it is
402    * actually safe to write to the buffer.
403    */
404   uint8_t* writableData() {
405     return data_;
406   }
407
408   /**
409    * Get the pointer to the end of the data.
410    */
411   const uint8_t* tail() const {
412     return data_ + length_;
413   }
414
415   /**
416    * Get a writable pointer to the end of the data.
417    *
418    * The caller is responsible for calling unshare() first to ensure that it is
419    * actually safe to write to the buffer.
420    */
421   uint8_t* writableTail() {
422     return data_ + length_;
423   }
424
425   /**
426    * Get the data length.
427    */
428   uint32_t length() const {
429     return length_;
430   }
431
432   /**
433    * Get the amount of head room.
434    *
435    * Returns the number of bytes in the buffer before the start of the data.
436    */
437   uint32_t headroom() const {
438     return data_ - buffer();
439   }
440
441   /**
442    * Get the amount of tail room.
443    *
444    * Returns the number of bytes in the buffer after the end of the data.
445    */
446   uint32_t tailroom() const {
447     return bufferEnd() - tail();
448   }
449
450   /**
451    * Get the pointer to the start of the buffer.
452    *
453    * Note that this is the pointer to the very beginning of the usable buffer,
454    * not the start of valid data within the buffer.  Use the data() method to
455    * get a pointer to the start of the data within the buffer.
456    */
457   const uint8_t* buffer() const {
458     return (flags_ & kFlagExt) ? ext_.buf : int_.buf;
459   }
460
461   /**
462    * Get a writable pointer to the start of the buffer.
463    *
464    * The caller is responsible for calling unshare() first to ensure that it is
465    * actually safe to write to the buffer.
466    */
467   uint8_t* writableBuffer() {
468     return (flags_ & kFlagExt) ? ext_.buf : int_.buf;
469   }
470
471   /**
472    * Get the pointer to the end of the buffer.
473    *
474    * Note that this is the pointer to the very end of the usable buffer,
475    * not the end of valid data within the buffer.  Use the tail() method to
476    * get a pointer to the end of the data within the buffer.
477    */
478   const uint8_t* bufferEnd() const {
479     return (flags_ & kFlagExt) ?
480       ext_.buf + ext_.capacity :
481       int_.buf + kMaxInternalDataSize;
482   }
483
484   /**
485    * Get the total size of the buffer.
486    *
487    * This returns the total usable length of the buffer.  Use the length()
488    * method to get the length of the actual valid data in this IOBuf.
489    */
490   uint32_t capacity() const {
491     return (flags_ & kFlagExt) ?  ext_.capacity : kMaxInternalDataSize;
492   }
493
494   /**
495    * Get a pointer to the next IOBuf in this chain.
496    */
497   IOBuf* next() {
498     return next_;
499   }
500   const IOBuf* next() const {
501     return next_;
502   }
503
504   /**
505    * Get a pointer to the previous IOBuf in this chain.
506    */
507   IOBuf* prev() {
508     return prev_;
509   }
510   const IOBuf* prev() const {
511     return prev_;
512   }
513
514   /**
515    * Shift the data forwards in the buffer.
516    *
517    * This shifts the data pointer forwards in the buffer to increase the
518    * headroom.  This is commonly used to increase the headroom in a newly
519    * allocated buffer.
520    *
521    * The caller is responsible for ensuring that there is sufficient
522    * tailroom in the buffer before calling advance().
523    *
524    * If there is a non-zero data length, advance() will use memmove() to shift
525    * the data forwards in the buffer.  In this case, the caller is responsible
526    * for making sure the buffer is unshared, so it will not affect other IOBufs
527    * that may be sharing the same underlying buffer.
528    */
529   void advance(uint32_t amount) {
530     // In debug builds, assert if there is a problem.
531     assert(amount <= tailroom());
532
533     if (length_ > 0) {
534       memmove(data_ + amount, data_, length_);
535     }
536     data_ += amount;
537   }
538
539   /**
540    * Shift the data backwards in the buffer.
541    *
542    * The caller is responsible for ensuring that there is sufficient headroom
543    * in the buffer before calling retreat().
544    *
545    * If there is a non-zero data length, retreat() will use memmove() to shift
546    * the data backwards in the buffer.  In this case, the caller is responsible
547    * for making sure the buffer is unshared, so it will not affect other IOBufs
548    * that may be sharing the same underlying buffer.
549    */
550   void retreat(uint32_t amount) {
551     // In debug builds, assert if there is a problem.
552     assert(amount <= headroom());
553
554     if (length_ > 0) {
555       memmove(data_ - amount, data_, length_);
556     }
557     data_ -= amount;
558   }
559
560   /**
561    * Adjust the data pointer to include more valid data at the beginning.
562    *
563    * This moves the data pointer backwards to include more of the available
564    * buffer.  The caller is responsible for ensuring that there is sufficient
565    * headroom for the new data.  The caller is also responsible for populating
566    * this section with valid data.
567    *
568    * This does not modify any actual data in the buffer.
569    */
570   void prepend(uint32_t amount) {
571     DCHECK_LE(amount, headroom());
572     data_ -= amount;
573     length_ += amount;
574   }
575
576   /**
577    * Adjust the tail pointer to include more valid data at the end.
578    *
579    * This moves the tail pointer forwards to include more of the available
580    * buffer.  The caller is responsible for ensuring that there is sufficient
581    * tailroom for the new data.  The caller is also responsible for populating
582    * this section with valid data.
583    *
584    * This does not modify any actual data in the buffer.
585    */
586   void append(uint32_t amount) {
587     DCHECK_LE(amount, tailroom());
588     length_ += amount;
589   }
590
591   /**
592    * Adjust the data pointer forwards to include less valid data.
593    *
594    * This moves the data pointer forwards so that the first amount bytes are no
595    * longer considered valid data.  The caller is responsible for ensuring that
596    * amount is less than or equal to the actual data length.
597    *
598    * This does not modify any actual data in the buffer.
599    */
600   void trimStart(uint32_t amount) {
601     DCHECK_LE(amount, length_);
602     data_ += amount;
603     length_ -= amount;
604   }
605
606   /**
607    * Adjust the tail pointer backwards to include less valid data.
608    *
609    * This moves the tail pointer backwards so that the last amount bytes are no
610    * longer considered valid data.  The caller is responsible for ensuring that
611    * amount is less than or equal to the actual data length.
612    *
613    * This does not modify any actual data in the buffer.
614    */
615   void trimEnd(uint32_t amount) {
616     DCHECK_LE(amount, length_);
617     length_ -= amount;
618   }
619
620   /**
621    * Clear the buffer.
622    *
623    * Postcondition: headroom() == 0, length() == 0, tailroom() == capacity()
624    */
625   void clear() {
626     data_ = writableBuffer();
627     length_ = 0;
628   }
629
630   /**
631    * Ensure that this buffer has at least minHeadroom headroom bytes and at
632    * least minTailroom tailroom bytes.  The buffer must be writable
633    * (you must call unshare() before this, if necessary).
634    *
635    * Postcondition: headroom() >= minHeadroom, tailroom() >= minTailroom,
636    * the data (between data() and data() + length()) is preserved.
637    */
638   void reserve(uint32_t minHeadroom, uint32_t minTailroom) {
639     // Maybe we don't need to do anything.
640     if (headroom() >= minHeadroom && tailroom() >= minTailroom) {
641       return;
642     }
643     // If the buffer is empty but we have enough total room (head + tail),
644     // move the data_ pointer around.
645     if (length() == 0 &&
646         headroom() + tailroom() >= minHeadroom + minTailroom) {
647       data_ = writableBuffer() + minHeadroom;
648       return;
649     }
650     // Bah, we have to do actual work.
651     reserveSlow(minHeadroom, minTailroom);
652   }
653
654   /**
655    * Return true if this IOBuf is part of a chain of multiple IOBufs, or false
656    * if this is the only IOBuf in its chain.
657    */
658   bool isChained() const {
659     assert((next_ == this) == (prev_ == this));
660     return next_ != this;
661   }
662
663   /**
664    * Get the number of IOBufs in this chain.
665    *
666    * Beware that this method has to walk the entire chain.
667    * Use isChained() if you just want to check if this IOBuf is part of a chain
668    * or not.
669    */
670   uint32_t countChainElements() const;
671
672   /**
673    * Get the length of all the data in this IOBuf chain.
674    *
675    * Beware that this method has to walk the entire chain.
676    */
677   uint64_t computeChainDataLength() const;
678
679   /**
680    * Insert another IOBuf chain immediately before this IOBuf.
681    *
682    * For example, if there are two IOBuf chains (A, B, C) and (D, E, F),
683    * and B->prependChain(D) is called, the (D, E, F) chain will be subsumed
684    * and become part of the chain starting at A, which will now look like
685    * (A, D, E, F, B, C)
686    *
687    * Note that since IOBuf chains are circular, head->prependChain(other) can
688    * be used to append the other chain at the very end of the chain pointed to
689    * by head.  For example, if there are two IOBuf chains (A, B, C) and
690    * (D, E, F), and A->prependChain(D) is called, the chain starting at A will
691    * now consist of (A, B, C, D, E, F)
692    *
693    * The elements in the specified IOBuf chain will become part of this chain,
694    * and will be owned by the head of this chain.  When this chain is
695    * destroyed, all elements in the supplied chain will also be destroyed.
696    *
697    * For this reason, appendChain() only accepts an rvalue-reference to a
698    * unique_ptr(), to make it clear that it is taking ownership of the supplied
699    * chain.  If you have a raw pointer, you can pass in a new temporary
700    * unique_ptr around the raw pointer.  If you have an existing,
701    * non-temporary unique_ptr, you must call std::move(ptr) to make it clear
702    * that you are destroying the original pointer.
703    */
704   void prependChain(std::unique_ptr<IOBuf>&& iobuf);
705
706   /**
707    * Append another IOBuf chain immediately after this IOBuf.
708    *
709    * For example, if there are two IOBuf chains (A, B, C) and (D, E, F),
710    * and B->appendChain(D) is called, the (D, E, F) chain will be subsumed
711    * and become part of the chain starting at A, which will now look like
712    * (A, B, D, E, F, C)
713    *
714    * The elements in the specified IOBuf chain will become part of this chain,
715    * and will be owned by the head of this chain.  When this chain is
716    * destroyed, all elements in the supplied chain will also be destroyed.
717    *
718    * For this reason, appendChain() only accepts an rvalue-reference to a
719    * unique_ptr(), to make it clear that it is taking ownership of the supplied
720    * chain.  If you have a raw pointer, you can pass in a new temporary
721    * unique_ptr around the raw pointer.  If you have an existing,
722    * non-temporary unique_ptr, you must call std::move(ptr) to make it clear
723    * that you are destroying the original pointer.
724    */
725   void appendChain(std::unique_ptr<IOBuf>&& iobuf) {
726     // Just use prependChain() on the next element in our chain
727     next_->prependChain(std::move(iobuf));
728   }
729
730   /**
731    * Remove this IOBuf from its current chain.
732    *
733    * Since ownership of all elements an IOBuf chain is normally maintained by
734    * the head of the chain, unlink() transfers ownership of this IOBuf from the
735    * chain and gives it to the caller.  A new unique_ptr to the IOBuf is
736    * returned to the caller.  The caller must store the returned unique_ptr (or
737    * call release() on it) to take ownership, otherwise the IOBuf will be
738    * immediately destroyed.
739    *
740    * Since unlink transfers ownership of the IOBuf to the caller, be careful
741    * not to call unlink() on the head of a chain if you already maintain
742    * ownership on the head of the chain via other means.  The pop() method
743    * is a better choice for that situation.
744    */
745   std::unique_ptr<IOBuf> unlink() {
746     next_->prev_ = prev_;
747     prev_->next_ = next_;
748     prev_ = this;
749     next_ = this;
750     return std::unique_ptr<IOBuf>(this);
751   }
752
753   /**
754    * Remove this IOBuf from its current chain and return a unique_ptr to
755    * the IOBuf that formerly followed it in the chain.
756    */
757   std::unique_ptr<IOBuf> pop() {
758     IOBuf *next = next_;
759     next_->prev_ = prev_;
760     prev_->next_ = next_;
761     prev_ = this;
762     next_ = this;
763     return std::unique_ptr<IOBuf>((next == this) ? NULL : next);
764   }
765
766   /**
767    * Remove a subchain from this chain.
768    *
769    * Remove the subchain starting at head and ending at tail from this chain.
770    *
771    * Returns a unique_ptr pointing to head.  (In other words, ownership of the
772    * head of the subchain is transferred to the caller.)  If the caller ignores
773    * the return value and lets the unique_ptr be destroyed, the subchain will
774    * be immediately destroyed.
775    *
776    * The subchain referenced by the specified head and tail must be part of the
777    * same chain as the current IOBuf, but must not contain the current IOBuf.
778    * However, the specified head and tail may be equal to each other (i.e.,
779    * they may be a subchain of length 1).
780    */
781   std::unique_ptr<IOBuf> separateChain(IOBuf* head, IOBuf* tail) {
782     assert(head != this);
783     assert(tail != this);
784
785     head->prev_->next_ = tail->next_;
786     tail->next_->prev_ = head->prev_;
787
788     head->prev_ = tail;
789     tail->next_ = head;
790
791     return std::unique_ptr<IOBuf>(head);
792   }
793
794   /**
795    * Return true if at least one of the IOBufs in this chain are shared,
796    * or false if all of the IOBufs point to unique buffers.
797    *
798    * Use isSharedOne() to only check this IOBuf rather than the entire chain.
799    */
800   bool isShared() const {
801     const IOBuf* current = this;
802     while (true) {
803       if (current->isSharedOne()) {
804         return true;
805       }
806       current = current->next_;
807       if (current == this) {
808         return false;
809       }
810     }
811   }
812
813   /**
814    * Return true if other IOBufs are also pointing to the buffer used by this
815    * IOBuf, and false otherwise.
816    *
817    * If this IOBuf points at a buffer owned by another (non-IOBuf) part of the
818    * code (i.e., if the IOBuf was created using wrapBuffer(), or was cloned
819    * from such an IOBuf), it is always considered shared.
820    *
821    * This only checks the current IOBuf, and not other IOBufs in the chain.
822    */
823   bool isSharedOne() const {
824     if (LIKELY(flags_ & (kFlagUserOwned | kFlagMaybeShared)) == 0) {
825       return false;
826     }
827
828     // If this is a user-owned buffer, it is always considered shared
829     if (flags_ & kFlagUserOwned) {
830       return true;
831     }
832
833     // an internal buffer wouldn't have kFlagMaybeShared or kFlagUserOwned
834     // so we would have returned false already.  The only remaining case
835     // is an external buffer which may be shared, so we need to read
836     // the reference count.
837     assert((flags_ & (kFlagExt | kFlagMaybeShared)) ==
838            (kFlagExt | kFlagMaybeShared));
839
840     bool shared =
841       ext_.sharedInfo->refcount.load(std::memory_order_acquire) > 1;
842     if (!shared) {
843       // we're the last one left
844       flags_ &= ~kFlagMaybeShared;
845     }
846     return shared;
847   }
848
849   /**
850    * Ensure that this IOBuf has a unique buffer that is not shared by other
851    * IOBufs.
852    *
853    * unshare() operates on an entire chain of IOBuf objects.  If the chain is
854    * shared, it may also coalesce the chain when making it unique.  If the
855    * chain is coalesced, subsequent IOBuf objects in the current chain will be
856    * automatically deleted.
857    *
858    * Note that buffers owned by other (non-IOBuf) users are automatically
859    * considered shared.
860    *
861    * Throws std::bad_alloc on error.  On error the IOBuf chain will be
862    * unmodified.
863    *
864    * Currently unshare may also throw std::overflow_error if it tries to
865    * coalesce.  (TODO: In the future it would be nice if unshare() were smart
866    * enough not to coalesce the entire buffer if the data is too large.
867    * However, in practice this seems unlikely to become an issue.)
868    */
869   void unshare() {
870     if (isChained()) {
871       unshareChained();
872     } else {
873       unshareOne();
874     }
875   }
876
877   /**
878    * Ensure that this IOBuf has a unique buffer that is not shared by other
879    * IOBufs.
880    *
881    * unshareOne() operates on a single IOBuf object.  This IOBuf will have a
882    * unique buffer after unshareOne() returns, but other IOBufs in the chain
883    * may still be shared after unshareOne() returns.
884    *
885    * Throws std::bad_alloc on error.  On error the IOBuf will be unmodified.
886    */
887   void unshareOne() {
888     if (isSharedOne()) {
889       unshareOneSlow();
890     }
891   }
892
893   /**
894    * Coalesce this IOBuf chain into a single buffer.
895    *
896    * This method moves all of the data in this IOBuf chain into a single
897    * contiguous buffer, if it is not already in one buffer.  After coalesce()
898    * returns, this IOBuf will be a chain of length one.  Other IOBufs in the
899    * chain will be automatically deleted.
900    *
901    * After coalescing, the IOBuf will have at least as much headroom as the
902    * first IOBuf in the chain, and at least as much tailroom as the last IOBuf
903    * in the chain.
904    *
905    * Throws std::bad_alloc on error.  On error the IOBuf chain will be
906    * unmodified.  Throws std::overflow_error if the length of the entire chain
907    * larger than can be described by a uint32_t capacity.
908    *
909    * Returns ByteRange that points to the data IOBuf stores.
910    */
911   ByteRange coalesce() {
912     if (isChained()) {
913       coalesceSlow();
914     }
915     return ByteRange(data_, length_);
916   }
917
918   /**
919    * Ensure that this chain has at least maxLength bytes available as a
920    * contiguous memory range.
921    *
922    * This method coalesces whole buffers in the chain into this buffer as
923    * necessary until this buffer's length() is at least maxLength.
924    *
925    * After coalescing, the IOBuf will have at least as much headroom as the
926    * first IOBuf in the chain, and at least as much tailroom as the last IOBuf
927    * that was coalesced.
928    *
929    * Throws std::bad_alloc on error.  On error the IOBuf chain will be
930    * unmodified.  Throws std::overflow_error if the length of the coalesced
931    * portion of the chain is larger than can be described by a uint32_t
932    * capacity.  (Although maxLength is uint32_t, gather() doesn't split
933    * buffers, so coalescing whole buffers may result in a capacity that can't
934    * be described in uint32_t.
935    *
936    * Upon return, either enough of the chain was coalesced into a contiguous
937    * region, or the entire chain was coalesced.  That is,
938    * length() >= maxLength || !isChained() is true.
939    */
940   void gather(uint32_t maxLength) {
941     if (!isChained() || length_ >= maxLength) {
942       return;
943     }
944     coalesceSlow(maxLength);
945   }
946
947   /**
948    * Return a new IOBuf chain sharing the same data as this chain.
949    *
950    * The new IOBuf chain will normally point to the same underlying data
951    * buffers as the original chain.  (The one exception to this is if some of
952    * the IOBufs in this chain contain small internal data buffers which cannot
953    * be shared.)
954    */
955   std::unique_ptr<IOBuf> clone() const;
956
957   /**
958    * Return a new IOBuf with the same data as this IOBuf.
959    *
960    * The new IOBuf returned will not be part of a chain (even if this IOBuf is
961    * part of a larger chain).
962    */
963   std::unique_ptr<IOBuf> cloneOne() const;
964
965   /**
966    * Return an iovector suitable for e.g. writev()
967    *
968    *   auto iov = buf->getIov();
969    *   auto xfer = writev(fd, iov.data(), iov.size());
970    *
971    * Naturally, the returned iovector is invalid if you modify the buffer
972    * chain.
973    */
974   folly::fbvector<struct iovec> getIov() const;
975
976   // Overridden operator new and delete.
977   // These directly use malloc() and free() to allocate the space for IOBuf
978   // objects.  This is needed since IOBuf::create() manually uses malloc when
979   // allocating IOBuf objects with an internal buffer.
980   void* operator new(size_t size);
981   void* operator new(size_t size, void* ptr);
982   void operator delete(void* ptr);
983
984   /**
985    * Destructively convert this IOBuf to a fbstring efficiently.
986    * We rely on fbstring's AcquireMallocatedString constructor to
987    * transfer memory.
988    */
989   fbstring moveToFbString();
990
991   /**
992    * Iteration support: a chain of IOBufs may be iterated through using
993    * STL-style iterators over const ByteRanges.  Iterators are only invalidated
994    * if the IOBuf that they currently point to is removed.
995    */
996   Iterator cbegin() const;
997   Iterator cend() const;
998   Iterator begin() const;
999   Iterator end() const;
1000
1001  private:
1002   enum FlagsEnum : uint32_t {
1003     kFlagExt = 0x1,
1004     kFlagUserOwned = 0x2,
1005     kFlagFreeSharedInfo = 0x4,
1006     kFlagMaybeShared = 0x8,
1007   };
1008
1009   // Values for the ExternalBuf type field.
1010   // We currently don't really use this for anything, other than to have it
1011   // around for debugging purposes.  We store it at the moment just because we
1012   // have the 4 extra bytes in the ExternalBuf struct that would just be
1013   // padding otherwise.
1014   enum ExtBufTypeEnum {
1015     kExtAllocated = 0,
1016     kExtUserSupplied = 1,
1017     kExtUserOwned = 2,
1018   };
1019
1020   struct SharedInfo {
1021     SharedInfo();
1022     SharedInfo(FreeFunction fn, void* arg);
1023
1024     // A pointer to a function to call to free the buffer when the refcount
1025     // hits 0.  If this is NULL, free() will be used instead.
1026     FreeFunction freeFn;
1027     void* userData;
1028     std::atomic<uint32_t> refcount;
1029   };
1030   struct ExternalBuf {
1031     uint32_t capacity;
1032     uint32_t type;
1033     uint8_t* buf;
1034     // SharedInfo may be NULL if kFlagUserOwned is set.  It is non-NULL
1035     // in all other cases.
1036     SharedInfo* sharedInfo;
1037   };
1038   struct InternalBuf {
1039     uint8_t buf[] __attribute__((aligned));
1040   };
1041
1042   // The maximum size for an IOBuf object, including any internal data buffer
1043   static const uint32_t kMaxIOBufSize = 256;
1044   static const uint32_t kMaxInternalDataSize;
1045
1046   // Forbidden copy constructor and assignment opererator
1047   IOBuf(IOBuf const &);
1048   IOBuf& operator=(IOBuf const &);
1049
1050   /**
1051    * Create a new IOBuf with internal data.
1052    *
1053    * end is a pointer to the end of the IOBuf's internal data buffer.
1054    */
1055   explicit IOBuf(uint8_t* end);
1056
1057   /**
1058    * Create a new IOBuf pointing to an external buffer.
1059    *
1060    * The caller is responsible for holding a reference count for this new
1061    * IOBuf.  The IOBuf constructor does not automatically increment the
1062    * reference count.
1063    */
1064   IOBuf(ExtBufTypeEnum type, uint32_t flags,
1065         uint8_t* buf, uint32_t capacity,
1066         uint8_t* data, uint32_t length,
1067         SharedInfo* sharedInfo);
1068
1069   void unshareOneSlow();
1070   void unshareChained();
1071   void coalesceSlow(size_t maxLength=std::numeric_limits<size_t>::max());
1072   // newLength must be the entire length of the buffers between this and
1073   // end (no truncation)
1074   void coalesceAndReallocate(
1075       size_t newHeadroom,
1076       size_t newLength,
1077       IOBuf* end,
1078       size_t newTailroom);
1079   void decrementRefcount();
1080   void reserveSlow(uint32_t minHeadroom, uint32_t minTailroom);
1081   void freeExtBuffer();
1082
1083   static size_t goodExtBufferSize(uint32_t minCapacity);
1084   static void initExtBuffer(uint8_t* buf, size_t mallocSize,
1085                             SharedInfo** infoReturn,
1086                             uint32_t* capacityReturn);
1087   static void allocExtBuffer(uint32_t minCapacity,
1088                              uint8_t** bufReturn,
1089                              SharedInfo** infoReturn,
1090                              uint32_t* capacityReturn);
1091
1092   /*
1093    * Member variables
1094    */
1095
1096   /*
1097    * Links to the next and the previous IOBuf in this chain.
1098    *
1099    * The chain is circularly linked (the last element in the chain points back
1100    * at the head), and next_ and prev_ can never be NULL.  If this IOBuf is the
1101    * only element in the chain, next_ and prev_ will both point to this.
1102    */
1103   IOBuf* next_;
1104   IOBuf* prev_;
1105
1106   /*
1107    * A pointer to the start of the data referenced by this IOBuf, and the
1108    * length of the data.
1109    *
1110    * This may refer to any subsection of the actual buffer capacity.
1111    */
1112   uint8_t* data_;
1113   uint32_t length_;
1114   mutable uint32_t flags_;
1115
1116   union {
1117     ExternalBuf ext_;
1118     InternalBuf int_;
1119   };
1120
1121   struct DeleterBase {
1122     virtual ~DeleterBase() { }
1123     virtual void dispose(void* p) = 0;
1124   };
1125
1126   template <class UniquePtr>
1127   struct UniquePtrDeleter : public DeleterBase {
1128     typedef typename UniquePtr::pointer Pointer;
1129     typedef typename UniquePtr::deleter_type Deleter;
1130
1131     explicit UniquePtrDeleter(Deleter deleter) : deleter_(std::move(deleter)){ }
1132     void dispose(void* p) {
1133       try {
1134         deleter_(static_cast<Pointer>(p));
1135         delete this;
1136       } catch (...) {
1137         abort();
1138       }
1139     }
1140
1141    private:
1142     Deleter deleter_;
1143   };
1144
1145   static void freeUniquePtrBuffer(void* ptr, void* userData) {
1146     static_cast<DeleterBase*>(userData)->dispose(ptr);
1147   }
1148 };
1149
1150 template <class UniquePtr>
1151 typename std::enable_if<detail::IsUniquePtrToSL<UniquePtr>::value,
1152                         std::unique_ptr<IOBuf>>::type
1153 IOBuf::takeOwnership(UniquePtr&& buf, size_t count) {
1154   size_t size = count * sizeof(typename UniquePtr::element_type);
1155   DCHECK_LT(size, size_t(std::numeric_limits<uint32_t>::max()));
1156   auto deleter = new UniquePtrDeleter<UniquePtr>(buf.get_deleter());
1157   return takeOwnership(buf.release(),
1158                        size,
1159                        &IOBuf::freeUniquePtrBuffer,
1160                        deleter);
1161 }
1162
1163 inline std::unique_ptr<IOBuf> IOBuf::copyBuffer(
1164     const void* data, uint32_t size, uint32_t headroom,
1165     uint32_t minTailroom) {
1166   uint32_t capacity = headroom + size + minTailroom;
1167   std::unique_ptr<IOBuf> buf = create(capacity);
1168   buf->advance(headroom);
1169   memcpy(buf->writableData(), data, size);
1170   buf->append(size);
1171   return buf;
1172 }
1173
1174 inline std::unique_ptr<IOBuf> IOBuf::copyBuffer(const std::string& buf,
1175                                                 uint32_t headroom,
1176                                                 uint32_t minTailroom) {
1177   return copyBuffer(buf.data(), buf.size(), headroom, minTailroom);
1178 }
1179
1180 inline std::unique_ptr<IOBuf> IOBuf::maybeCopyBuffer(const std::string& buf,
1181                                                      uint32_t headroom,
1182                                                      uint32_t minTailroom) {
1183   if (buf.empty()) {
1184     return nullptr;
1185   }
1186   return copyBuffer(buf.data(), buf.size(), headroom, minTailroom);
1187 }
1188
1189 class IOBuf::Iterator : public boost::iterator_facade<
1190     IOBuf::Iterator,  // Derived
1191     const ByteRange,  // Value
1192     boost::forward_traversal_tag  // Category or traversal
1193   > {
1194   friend class boost::iterator_core_access;
1195  public:
1196   // Note that IOBufs are stored as a circular list without a guard node,
1197   // so pos == end is ambiguous (it may mean "begin" or "end").  To solve
1198   // the ambiguity (at the cost of one extra comparison in the "increment"
1199   // code path), we define end iterators as having pos_ == end_ == nullptr
1200   // and we only allow forward iteration.
1201   explicit Iterator(const IOBuf* pos, const IOBuf* end)
1202     : pos_(pos),
1203       end_(end) {
1204     // Sadly, we must return by const reference, not by value.
1205     if (pos_) {
1206       setVal();
1207     }
1208   }
1209
1210  private:
1211   void setVal() {
1212     val_ = ByteRange(pos_->data(), pos_->tail());
1213   }
1214
1215   void adjustForEnd() {
1216     if (pos_ == end_) {
1217       pos_ = end_ = nullptr;
1218       val_ = ByteRange();
1219     } else {
1220       setVal();
1221     }
1222   }
1223
1224   const ByteRange& dereference() const {
1225     return val_;
1226   }
1227
1228   bool equal(const Iterator& other) const {
1229     // We must compare end_ in addition to pos_, because forward traversal
1230     // requires that if two iterators are equal (a == b) and dereferenceable,
1231     // then ++a == ++b.
1232     return pos_ == other.pos_ && end_ == other.end_;
1233   }
1234
1235   void increment() {
1236     pos_ = pos_->next();
1237     adjustForEnd();
1238   }
1239
1240   const IOBuf* pos_;
1241   const IOBuf* end_;
1242   ByteRange val_;
1243 };
1244
1245 inline IOBuf::Iterator IOBuf::begin() const { return cbegin(); }
1246 inline IOBuf::Iterator IOBuf::end() const { return cend(); }
1247
1248 } // folly
1249
1250 #pragma GCC diagnostic pop
1251
1252 #endif // FOLLY_IO_IOBUF_H_