603e75f745cb1d1dbf806a90f34d1caa47849a7d
[folly.git] / folly / io / IOBuf.cpp
1 /*
2  * Copyright 2016 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef __STDC_LIMIT_MACROS
18 #define __STDC_LIMIT_MACROS
19 #endif
20
21 #include <folly/io/IOBuf.h>
22
23 #include <folly/Conv.h>
24 #include <folly/Likely.h>
25 #include <folly/Malloc.h>
26 #include <folly/Memory.h>
27 #include <folly/ScopeGuard.h>
28 #include <folly/SpookyHashV2.h>
29 #include <folly/io/Cursor.h>
30
31 #include <stdexcept>
32 #include <assert.h>
33 #include <stdint.h>
34 #include <stdlib.h>
35
36 using std::unique_ptr;
37
38 namespace {
39
40 enum : uint16_t {
41   kHeapMagic = 0xa5a5,
42   // This memory segment contains an IOBuf that is still in use
43   kIOBufInUse = 0x01,
44   // This memory segment contains buffer data that is still in use
45   kDataInUse = 0x02,
46 };
47
48 enum : uint64_t {
49   // When create() is called for buffers less than kDefaultCombinedBufSize,
50   // we allocate a single combined memory segment for the IOBuf and the data
51   // together.  See the comments for createCombined()/createSeparate() for more
52   // details.
53   //
54   // (The size of 1k is largely just a guess here.  We could could probably do
55   // benchmarks of real applications to see if adjusting this number makes a
56   // difference.  Callers that know their exact use case can also explicitly
57   // call createCombined() or createSeparate().)
58   kDefaultCombinedBufSize = 1024
59 };
60
61 // Helper function for IOBuf::takeOwnership()
62 void takeOwnershipError(bool freeOnError, void* buf,
63                         folly::IOBuf::FreeFunction freeFn,
64                         void* userData) {
65   if (!freeOnError) {
66     return;
67   }
68   if (!freeFn) {
69     free(buf);
70     return;
71   }
72   try {
73     freeFn(buf, userData);
74   } catch (...) {
75     // The user's free function is not allowed to throw.
76     // (We are already in the middle of throwing an exception, so
77     // we cannot let this exception go unhandled.)
78     abort();
79   }
80 }
81
82 } // unnamed namespace
83
84 namespace folly {
85
86 struct IOBuf::HeapPrefix {
87   HeapPrefix(uint16_t flg)
88     : magic(kHeapMagic),
89       flags(flg) {}
90   ~HeapPrefix() {
91     // Reset magic to 0 on destruction.  This is solely for debugging purposes
92     // to help catch bugs where someone tries to use HeapStorage after it has
93     // been deleted.
94     magic = 0;
95   }
96
97   uint16_t magic;
98   std::atomic<uint16_t> flags;
99 };
100
101 struct IOBuf::HeapStorage {
102   HeapPrefix prefix;
103   // The IOBuf is last in the HeapStorage object.
104   // This way operator new will work even if allocating a subclass of IOBuf
105   // that requires more space.
106   folly::IOBuf buf;
107 };
108
109 struct IOBuf::HeapFullStorage {
110   // Make sure jemalloc allocates from the 64-byte class.  Putting this here
111   // because HeapStorage is private so it can't be at namespace level.
112   static_assert(sizeof(HeapStorage) <= 64,
113                 "IOBuf may not grow over 56 bytes!");
114
115   HeapStorage hs;
116   SharedInfo shared;
117   std::max_align_t align;
118 };
119
120 IOBuf::SharedInfo::SharedInfo()
121   : freeFn(nullptr),
122     userData(nullptr) {
123   // Use relaxed memory ordering here.  Since we are creating a new SharedInfo,
124   // no other threads should be referring to it yet.
125   refcount.store(1, std::memory_order_relaxed);
126 }
127
128 IOBuf::SharedInfo::SharedInfo(FreeFunction fn, void* arg)
129   : freeFn(fn),
130     userData(arg) {
131   // Use relaxed memory ordering here.  Since we are creating a new SharedInfo,
132   // no other threads should be referring to it yet.
133   refcount.store(1, std::memory_order_relaxed);
134 }
135
136 void* IOBuf::operator new(size_t size) {
137   size_t fullSize = offsetof(HeapStorage, buf) + size;
138   auto* storage = static_cast<HeapStorage*>(malloc(fullSize));
139   // operator new is not allowed to return NULL
140   if (UNLIKELY(storage == nullptr)) {
141     throw std::bad_alloc();
142   }
143
144   new (&storage->prefix) HeapPrefix(kIOBufInUse);
145   return &(storage->buf);
146 }
147
148 void* IOBuf::operator new(size_t /* size */, void* ptr) { return ptr; }
149
150 void IOBuf::operator delete(void* ptr) {
151   auto* storageAddr = static_cast<uint8_t*>(ptr) - offsetof(HeapStorage, buf);
152   auto* storage = reinterpret_cast<HeapStorage*>(storageAddr);
153   releaseStorage(storage, kIOBufInUse);
154 }
155
156 void IOBuf::releaseStorage(HeapStorage* storage, uint16_t freeFlags) {
157   CHECK_EQ(storage->prefix.magic, static_cast<uint16_t>(kHeapMagic));
158
159   // Use relaxed memory order here.  If we are unlucky and happen to get
160   // out-of-date data the compare_exchange_weak() call below will catch
161   // it and load new data with memory_order_acq_rel.
162   auto flags = storage->prefix.flags.load(std::memory_order_acquire);
163   DCHECK_EQ((flags & freeFlags), freeFlags);
164
165   while (true) {
166     uint16_t newFlags = (flags & ~freeFlags);
167     if (newFlags == 0) {
168       // The storage space is now unused.  Free it.
169       storage->prefix.HeapPrefix::~HeapPrefix();
170       free(storage);
171       return;
172     }
173
174     // This storage segment still contains portions that are in use.
175     // Just clear the flags specified in freeFlags for now.
176     auto ret = storage->prefix.flags.compare_exchange_weak(
177         flags, newFlags, std::memory_order_acq_rel);
178     if (ret) {
179       // We successfully updated the flags.
180       return;
181     }
182
183     // We failed to update the flags.  Some other thread probably updated them
184     // and cleared some of the other bits.  Continue around the loop to see if
185     // we are the last user now, or if we need to try updating the flags again.
186   }
187 }
188
189 void IOBuf::freeInternalBuf(void* /* buf */, void* userData) {
190   auto* storage = static_cast<HeapStorage*>(userData);
191   releaseStorage(storage, kDataInUse);
192 }
193
194 IOBuf::IOBuf(CreateOp, uint64_t capacity)
195   : next_(this),
196     prev_(this),
197     data_(nullptr),
198     length_(0),
199     flagsAndSharedInfo_(0) {
200   SharedInfo* info;
201   allocExtBuffer(capacity, &buf_, &info, &capacity_);
202   setSharedInfo(info);
203   data_ = buf_;
204 }
205
206 IOBuf::IOBuf(CopyBufferOp /* op */,
207              const void* buf,
208              uint64_t size,
209              uint64_t headroom,
210              uint64_t minTailroom)
211     : IOBuf(CREATE, headroom + size + minTailroom) {
212   advance(headroom);
213   memcpy(writableData(), buf, size);
214   append(size);
215 }
216
217 IOBuf::IOBuf(CopyBufferOp op, ByteRange br,
218              uint64_t headroom, uint64_t minTailroom)
219   : IOBuf(op, br.data(), br.size(), headroom, minTailroom) {
220 }
221
222 unique_ptr<IOBuf> IOBuf::create(uint64_t capacity) {
223   // For smaller-sized buffers, allocate the IOBuf, SharedInfo, and the buffer
224   // all with a single allocation.
225   //
226   // We don't do this for larger buffers since it can be wasteful if the user
227   // needs to reallocate the buffer but keeps using the same IOBuf object.
228   // In this case we can't free the data space until the IOBuf is also
229   // destroyed.  Callers can explicitly call createCombined() or
230   // createSeparate() if they know their use case better, and know if they are
231   // likely to reallocate the buffer later.
232   if (capacity <= kDefaultCombinedBufSize) {
233     return createCombined(capacity);
234   }
235   return createSeparate(capacity);
236 }
237
238 unique_ptr<IOBuf> IOBuf::createCombined(uint64_t capacity) {
239   // To save a memory allocation, allocate space for the IOBuf object, the
240   // SharedInfo struct, and the data itself all with a single call to malloc().
241   size_t requiredStorage = offsetof(HeapFullStorage, align) + capacity;
242   size_t mallocSize = goodMallocSize(requiredStorage);
243   auto* storage = static_cast<HeapFullStorage*>(malloc(mallocSize));
244
245   new (&storage->hs.prefix) HeapPrefix(kIOBufInUse | kDataInUse);
246   new (&storage->shared) SharedInfo(freeInternalBuf, storage);
247
248   uint8_t* bufAddr = reinterpret_cast<uint8_t*>(&storage->align);
249   uint8_t* storageEnd = reinterpret_cast<uint8_t*>(storage) + mallocSize;
250   size_t actualCapacity = storageEnd - bufAddr;
251   unique_ptr<IOBuf> ret(new (&storage->hs.buf) IOBuf(
252         InternalConstructor(), packFlagsAndSharedInfo(0, &storage->shared),
253         bufAddr, actualCapacity, bufAddr, 0));
254   return ret;
255 }
256
257 unique_ptr<IOBuf> IOBuf::createSeparate(uint64_t capacity) {
258   return make_unique<IOBuf>(CREATE, capacity);
259 }
260
261 unique_ptr<IOBuf> IOBuf::createChain(
262     size_t totalCapacity, uint64_t maxBufCapacity) {
263   unique_ptr<IOBuf> out = create(
264       std::min(totalCapacity, size_t(maxBufCapacity)));
265   size_t allocatedCapacity = out->capacity();
266
267   while (allocatedCapacity < totalCapacity) {
268     unique_ptr<IOBuf> newBuf = create(
269         std::min(totalCapacity - allocatedCapacity, size_t(maxBufCapacity)));
270     allocatedCapacity += newBuf->capacity();
271     out->prependChain(std::move(newBuf));
272   }
273
274   return out;
275 }
276
277 IOBuf::IOBuf(TakeOwnershipOp, void* buf, uint64_t capacity, uint64_t length,
278              FreeFunction freeFn, void* userData,
279              bool freeOnError)
280   : next_(this),
281     prev_(this),
282     data_(static_cast<uint8_t*>(buf)),
283     buf_(static_cast<uint8_t*>(buf)),
284     length_(length),
285     capacity_(capacity),
286     flagsAndSharedInfo_(packFlagsAndSharedInfo(kFlagFreeSharedInfo, nullptr)) {
287   try {
288     setSharedInfo(new SharedInfo(freeFn, userData));
289   } catch (...) {
290     takeOwnershipError(freeOnError, buf, freeFn, userData);
291     throw;
292   }
293 }
294
295 unique_ptr<IOBuf> IOBuf::takeOwnership(void* buf, uint64_t capacity,
296                                        uint64_t length,
297                                        FreeFunction freeFn,
298                                        void* userData,
299                                        bool freeOnError) {
300   try {
301     // TODO: We could allocate the IOBuf object and SharedInfo all in a single
302     // memory allocation.  We could use the existing HeapStorage class, and
303     // define a new kSharedInfoInUse flag.  We could change our code to call
304     // releaseStorage(kFlagFreeSharedInfo) when this kFlagFreeSharedInfo,
305     // rather than directly calling delete.
306     //
307     // Note that we always pass freeOnError as false to the constructor.
308     // If the constructor throws we'll handle it below.  (We have to handle
309     // allocation failures from make_unique too.)
310     return make_unique<IOBuf>(TAKE_OWNERSHIP, buf, capacity, length,
311                               freeFn, userData, false);
312   } catch (...) {
313     takeOwnershipError(freeOnError, buf, freeFn, userData);
314     throw;
315   }
316 }
317
318 IOBuf::IOBuf(WrapBufferOp, const void* buf, uint64_t capacity)
319   : IOBuf(InternalConstructor(), 0,
320           // We cast away the const-ness of the buffer here.
321           // This is okay since IOBuf users must use unshare() to create a copy
322           // of this buffer before writing to the buffer.
323           static_cast<uint8_t*>(const_cast<void*>(buf)), capacity,
324           static_cast<uint8_t*>(const_cast<void*>(buf)), capacity) {
325 }
326
327 IOBuf::IOBuf(WrapBufferOp op, ByteRange br)
328   : IOBuf(op, br.data(), br.size()) {
329 }
330
331 unique_ptr<IOBuf> IOBuf::wrapBuffer(const void* buf, uint64_t capacity) {
332   return make_unique<IOBuf>(WRAP_BUFFER, buf, capacity);
333 }
334
335 IOBuf IOBuf::wrapBufferAsValue(const void* buf, uint64_t capacity) {
336   return IOBuf(WrapBufferOp::WRAP_BUFFER, buf, capacity);
337 }
338
339 IOBuf::IOBuf() noexcept {
340 }
341
342 IOBuf::IOBuf(IOBuf&& other) noexcept
343     : data_(other.data_),
344       buf_(other.buf_),
345       length_(other.length_),
346       capacity_(other.capacity_),
347       flagsAndSharedInfo_(other.flagsAndSharedInfo_) {
348   // Reset other so it is a clean state to be destroyed.
349   other.data_ = nullptr;
350   other.buf_ = nullptr;
351   other.length_ = 0;
352   other.capacity_ = 0;
353   other.flagsAndSharedInfo_ = 0;
354
355   // If other was part of the chain, assume ownership of the rest of its chain.
356   // (It's only valid to perform move assignment on the head of a chain.)
357   if (other.next_ != &other) {
358     next_ = other.next_;
359     next_->prev_ = this;
360     other.next_ = &other;
361
362     prev_ = other.prev_;
363     prev_->next_ = this;
364     other.prev_ = &other;
365   }
366
367   // Sanity check to make sure that other is in a valid state to be destroyed.
368   DCHECK_EQ(other.prev_, &other);
369   DCHECK_EQ(other.next_, &other);
370 }
371
372 IOBuf::IOBuf(const IOBuf& other) {
373   *this = other.cloneAsValue();
374 }
375
376 IOBuf::IOBuf(InternalConstructor,
377              uintptr_t flagsAndSharedInfo,
378              uint8_t* buf,
379              uint64_t capacity,
380              uint8_t* data,
381              uint64_t length)
382   : next_(this),
383     prev_(this),
384     data_(data),
385     buf_(buf),
386     length_(length),
387     capacity_(capacity),
388     flagsAndSharedInfo_(flagsAndSharedInfo) {
389   assert(data >= buf);
390   assert(data + length <= buf + capacity);
391 }
392
393 IOBuf::~IOBuf() {
394   // Destroying an IOBuf destroys the entire chain.
395   // Users of IOBuf should only explicitly delete the head of any chain.
396   // The other elements in the chain will be automatically destroyed.
397   while (next_ != this) {
398     // Since unlink() returns unique_ptr() and we don't store it,
399     // it will automatically delete the unlinked element.
400     (void)next_->unlink();
401   }
402
403   decrementRefcount();
404 }
405
406 IOBuf& IOBuf::operator=(IOBuf&& other) noexcept {
407   if (this == &other) {
408     return *this;
409   }
410
411   // If we are part of a chain, delete the rest of the chain.
412   while (next_ != this) {
413     // Since unlink() returns unique_ptr() and we don't store it,
414     // it will automatically delete the unlinked element.
415     (void)next_->unlink();
416   }
417
418   // Decrement our refcount on the current buffer
419   decrementRefcount();
420
421   // Take ownership of the other buffer's data
422   data_ = other.data_;
423   buf_ = other.buf_;
424   length_ = other.length_;
425   capacity_ = other.capacity_;
426   flagsAndSharedInfo_ = other.flagsAndSharedInfo_;
427   // Reset other so it is a clean state to be destroyed.
428   other.data_ = nullptr;
429   other.buf_ = nullptr;
430   other.length_ = 0;
431   other.capacity_ = 0;
432   other.flagsAndSharedInfo_ = 0;
433
434   // If other was part of the chain, assume ownership of the rest of its chain.
435   // (It's only valid to perform move assignment on the head of a chain.)
436   if (other.next_ != &other) {
437     next_ = other.next_;
438     next_->prev_ = this;
439     other.next_ = &other;
440
441     prev_ = other.prev_;
442     prev_->next_ = this;
443     other.prev_ = &other;
444   }
445
446   // Sanity check to make sure that other is in a valid state to be destroyed.
447   DCHECK_EQ(other.prev_, &other);
448   DCHECK_EQ(other.next_, &other);
449
450   return *this;
451 }
452
453 IOBuf& IOBuf::operator=(const IOBuf& other) {
454   if (this != &other) {
455     *this = IOBuf(other);
456   }
457   return *this;
458 }
459
460 bool IOBuf::empty() const {
461   const IOBuf* current = this;
462   do {
463     if (current->length() != 0) {
464       return false;
465     }
466     current = current->next_;
467   } while (current != this);
468   return true;
469 }
470
471 size_t IOBuf::countChainElements() const {
472   size_t numElements = 1;
473   for (IOBuf* current = next_; current != this; current = current->next_) {
474     ++numElements;
475   }
476   return numElements;
477 }
478
479 uint64_t IOBuf::computeChainDataLength() const {
480   uint64_t fullLength = length_;
481   for (IOBuf* current = next_; current != this; current = current->next_) {
482     fullLength += current->length_;
483   }
484   return fullLength;
485 }
486
487 void IOBuf::prependChain(unique_ptr<IOBuf>&& iobuf) {
488   // Take ownership of the specified IOBuf
489   IOBuf* other = iobuf.release();
490
491   // Remember the pointer to the tail of the other chain
492   IOBuf* otherTail = other->prev_;
493
494   // Hook up prev_->next_ to point at the start of the other chain,
495   // and other->prev_ to point at prev_
496   prev_->next_ = other;
497   other->prev_ = prev_;
498
499   // Hook up otherTail->next_ to point at us,
500   // and prev_ to point back at otherTail,
501   otherTail->next_ = this;
502   prev_ = otherTail;
503 }
504
505 unique_ptr<IOBuf> IOBuf::clone() const {
506   return make_unique<IOBuf>(cloneAsValue());
507 }
508
509 unique_ptr<IOBuf> IOBuf::cloneOne() const {
510   return make_unique<IOBuf>(cloneOneAsValue());
511 }
512
513 IOBuf IOBuf::cloneAsValue() const {
514   auto tmp = cloneOneAsValue();
515
516   for (IOBuf* current = next_; current != this; current = current->next_) {
517     tmp.prependChain(current->cloneOne());
518   }
519
520   return tmp;
521 }
522
523 IOBuf IOBuf::cloneOneAsValue() const {
524   if (SharedInfo* info = sharedInfo()) {
525     setFlags(kFlagMaybeShared);
526     info->refcount.fetch_add(1, std::memory_order_acq_rel);
527   }
528   return IOBuf(
529       InternalConstructor(),
530       flagsAndSharedInfo_,
531       buf_,
532       capacity_,
533       data_,
534       length_);
535 }
536
537 void IOBuf::unshareOneSlow() {
538   // Allocate a new buffer for the data
539   uint8_t* buf;
540   SharedInfo* sharedInfo;
541   uint64_t actualCapacity;
542   allocExtBuffer(capacity_, &buf, &sharedInfo, &actualCapacity);
543
544   // Copy the data
545   // Maintain the same amount of headroom.  Since we maintained the same
546   // minimum capacity we also maintain at least the same amount of tailroom.
547   uint64_t headlen = headroom();
548   memcpy(buf + headlen, data_, length_);
549
550   // Release our reference on the old buffer
551   decrementRefcount();
552   // Make sure kFlagMaybeShared and kFlagFreeSharedInfo are all cleared.
553   setFlagsAndSharedInfo(0, sharedInfo);
554
555   // Update the buffer pointers to point to the new buffer
556   data_ = buf + headlen;
557   buf_ = buf;
558 }
559
560 void IOBuf::unshareChained() {
561   // unshareChained() should only be called if we are part of a chain of
562   // multiple IOBufs.  The caller should have already verified this.
563   assert(isChained());
564
565   IOBuf* current = this;
566   while (true) {
567     if (current->isSharedOne()) {
568       // we have to unshare
569       break;
570     }
571
572     current = current->next_;
573     if (current == this) {
574       // None of the IOBufs in the chain are shared,
575       // so return without doing anything
576       return;
577     }
578   }
579
580   // We have to unshare.  Let coalesceSlow() do the work.
581   coalesceSlow();
582 }
583
584 void IOBuf::makeManagedChained() {
585   assert(isChained());
586
587   IOBuf* current = this;
588   while (true) {
589     current->makeManagedOne();
590     current = current->next_;
591     if (current == this) {
592       break;
593     }
594   }
595 }
596
597 void IOBuf::coalesceSlow() {
598   // coalesceSlow() should only be called if we are part of a chain of multiple
599   // IOBufs.  The caller should have already verified this.
600   DCHECK(isChained());
601
602   // Compute the length of the entire chain
603   uint64_t newLength = 0;
604   IOBuf* end = this;
605   do {
606     newLength += end->length_;
607     end = end->next_;
608   } while (end != this);
609
610   coalesceAndReallocate(newLength, end);
611   // We should be only element left in the chain now
612   DCHECK(!isChained());
613 }
614
615 void IOBuf::coalesceSlow(size_t maxLength) {
616   // coalesceSlow() should only be called if we are part of a chain of multiple
617   // IOBufs.  The caller should have already verified this.
618   DCHECK(isChained());
619   DCHECK_LT(length_, maxLength);
620
621   // Compute the length of the entire chain
622   uint64_t newLength = 0;
623   IOBuf* end = this;
624   while (true) {
625     newLength += end->length_;
626     end = end->next_;
627     if (newLength >= maxLength) {
628       break;
629     }
630     if (end == this) {
631       throw std::overflow_error("attempted to coalesce more data than "
632                                 "available");
633     }
634   }
635
636   coalesceAndReallocate(newLength, end);
637   // We should have the requested length now
638   DCHECK_GE(length_, maxLength);
639 }
640
641 void IOBuf::coalesceAndReallocate(size_t newHeadroom,
642                                   size_t newLength,
643                                   IOBuf* end,
644                                   size_t newTailroom) {
645   uint64_t newCapacity = newLength + newHeadroom + newTailroom;
646
647   // Allocate space for the coalesced buffer.
648   // We always convert to an external buffer, even if we happened to be an
649   // internal buffer before.
650   uint8_t* newBuf;
651   SharedInfo* newInfo;
652   uint64_t actualCapacity;
653   allocExtBuffer(newCapacity, &newBuf, &newInfo, &actualCapacity);
654
655   // Copy the data into the new buffer
656   uint8_t* newData = newBuf + newHeadroom;
657   uint8_t* p = newData;
658   IOBuf* current = this;
659   size_t remaining = newLength;
660   do {
661     assert(current->length_ <= remaining);
662     remaining -= current->length_;
663     memcpy(p, current->data_, current->length_);
664     p += current->length_;
665     current = current->next_;
666   } while (current != end);
667   assert(remaining == 0);
668
669   // Point at the new buffer
670   decrementRefcount();
671
672   // Make sure kFlagMaybeShared and kFlagFreeSharedInfo are all cleared.
673   setFlagsAndSharedInfo(0, newInfo);
674
675   capacity_ = actualCapacity;
676   buf_ = newBuf;
677   data_ = newData;
678   length_ = newLength;
679
680   // Separate from the rest of our chain.
681   // Since we don't store the unique_ptr returned by separateChain(),
682   // this will immediately delete the returned subchain.
683   if (isChained()) {
684     (void)separateChain(next_, current->prev_);
685   }
686 }
687
688 void IOBuf::decrementRefcount() {
689   // Externally owned buffers don't have a SharedInfo object and aren't managed
690   // by the reference count
691   SharedInfo* info = sharedInfo();
692   if (!info) {
693     return;
694   }
695
696   // Decrement the refcount
697   uint32_t newcnt = info->refcount.fetch_sub(
698       1, std::memory_order_acq_rel);
699   // Note that fetch_sub() returns the value before we decremented.
700   // If it is 1, we were the only remaining user; if it is greater there are
701   // still other users.
702   if (newcnt > 1) {
703     return;
704   }
705
706   // We were the last user.  Free the buffer
707   freeExtBuffer();
708
709   // Free the SharedInfo if it was allocated separately.
710   //
711   // This is only used by takeOwnership().
712   //
713   // To avoid this special case handling in decrementRefcount(), we could have
714   // takeOwnership() set a custom freeFn() that calls the user's free function
715   // then frees the SharedInfo object.  (This would require that
716   // takeOwnership() store the user's free function with its allocated
717   // SharedInfo object.)  However, handling this specially with a flag seems
718   // like it shouldn't be problematic.
719   if (flags() & kFlagFreeSharedInfo) {
720     delete sharedInfo();
721   }
722 }
723
724 void IOBuf::reserveSlow(uint64_t minHeadroom, uint64_t minTailroom) {
725   size_t newCapacity = (size_t)length_ + minHeadroom + minTailroom;
726   DCHECK_LT(newCapacity, UINT32_MAX);
727
728   // reserveSlow() is dangerous if anyone else is sharing the buffer, as we may
729   // reallocate and free the original buffer.  It should only ever be called if
730   // we are the only user of the buffer.
731   DCHECK(!isSharedOne());
732
733   // We'll need to reallocate the buffer.
734   // There are a few options.
735   // - If we have enough total room, move the data around in the buffer
736   //   and adjust the data_ pointer.
737   // - If we're using an internal buffer, we'll switch to an external
738   //   buffer with enough headroom and tailroom.
739   // - If we have enough headroom (headroom() >= minHeadroom) but not too much
740   //   (so we don't waste memory), we can try one of two things, depending on
741   //   whether we use jemalloc or not:
742   //   - If using jemalloc, we can try to expand in place, avoiding a memcpy()
743   //   - If not using jemalloc and we don't have too much to copy,
744   //     we'll use realloc() (note that realloc might have to copy
745   //     headroom + data + tailroom, see smartRealloc in folly/Malloc.h)
746   // - Otherwise, bite the bullet and reallocate.
747   if (headroom() + tailroom() >= minHeadroom + minTailroom) {
748     uint8_t* newData = writableBuffer() + minHeadroom;
749     memmove(newData, data_, length_);
750     data_ = newData;
751     return;
752   }
753
754   size_t newAllocatedCapacity = 0;
755   uint8_t* newBuffer = nullptr;
756   uint64_t newHeadroom = 0;
757   uint64_t oldHeadroom = headroom();
758
759   // If we have a buffer allocated with malloc and we just need more tailroom,
760   // try to use realloc()/xallocx() to grow the buffer in place.
761   SharedInfo* info = sharedInfo();
762   if (info && (info->freeFn == nullptr) && length_ != 0 &&
763       oldHeadroom >= minHeadroom) {
764     size_t headSlack = oldHeadroom - minHeadroom;
765     newAllocatedCapacity = goodExtBufferSize(newCapacity + headSlack);
766     if (usingJEMalloc()) {
767       // We assume that tailroom is more useful and more important than
768       // headroom (not least because realloc / xallocx allow us to grow the
769       // buffer at the tail, but not at the head)  So, if we have more headroom
770       // than we need, we consider that "wasted".  We arbitrarily define "too
771       // much" headroom to be 25% of the capacity.
772       if (headSlack * 4 <= newCapacity) {
773         size_t allocatedCapacity = capacity() + sizeof(SharedInfo);
774         void* p = buf_;
775         if (allocatedCapacity >= jemallocMinInPlaceExpandable) {
776           if (xallocx(p, newAllocatedCapacity, 0, 0) == newAllocatedCapacity) {
777             newBuffer = static_cast<uint8_t*>(p);
778             newHeadroom = oldHeadroom;
779           }
780           // if xallocx failed, do nothing, fall back to malloc/memcpy/free
781         }
782       }
783     } else {  // Not using jemalloc
784       size_t copySlack = capacity() - length_;
785       if (copySlack * 2 <= length_) {
786         void* p = realloc(buf_, newAllocatedCapacity);
787         if (UNLIKELY(p == nullptr)) {
788           throw std::bad_alloc();
789         }
790         newBuffer = static_cast<uint8_t*>(p);
791         newHeadroom = oldHeadroom;
792       }
793     }
794   }
795
796   // None of the previous reallocation strategies worked (or we're using
797   // an internal buffer).  malloc/copy/free.
798   if (newBuffer == nullptr) {
799     newAllocatedCapacity = goodExtBufferSize(newCapacity);
800     void* p = malloc(newAllocatedCapacity);
801     if (UNLIKELY(p == nullptr)) {
802       throw std::bad_alloc();
803     }
804     newBuffer = static_cast<uint8_t*>(p);
805     memcpy(newBuffer + minHeadroom, data_, length_);
806     if (sharedInfo()) {
807       freeExtBuffer();
808     }
809     newHeadroom = minHeadroom;
810   }
811
812   uint64_t cap;
813   initExtBuffer(newBuffer, newAllocatedCapacity, &info, &cap);
814
815   if (flags() & kFlagFreeSharedInfo) {
816     delete sharedInfo();
817   }
818
819   setFlagsAndSharedInfo(0, info);
820   capacity_ = cap;
821   buf_ = newBuffer;
822   data_ = newBuffer + newHeadroom;
823   // length_ is unchanged
824 }
825
826 void IOBuf::freeExtBuffer() {
827   SharedInfo* info = sharedInfo();
828   DCHECK(info);
829
830   if (info->freeFn) {
831     try {
832       info->freeFn(buf_, info->userData);
833     } catch (...) {
834       // The user's free function should never throw.  Otherwise we might
835       // throw from the IOBuf destructor.  Other code paths like coalesce()
836       // also assume that decrementRefcount() cannot throw.
837       abort();
838     }
839   } else {
840     free(buf_);
841   }
842 }
843
844 void IOBuf::allocExtBuffer(uint64_t minCapacity,
845                            uint8_t** bufReturn,
846                            SharedInfo** infoReturn,
847                            uint64_t* capacityReturn) {
848   size_t mallocSize = goodExtBufferSize(minCapacity);
849   uint8_t* buf = static_cast<uint8_t*>(malloc(mallocSize));
850   if (UNLIKELY(buf == nullptr)) {
851     throw std::bad_alloc();
852   }
853   initExtBuffer(buf, mallocSize, infoReturn, capacityReturn);
854   *bufReturn = buf;
855 }
856
857 size_t IOBuf::goodExtBufferSize(uint64_t minCapacity) {
858   // Determine how much space we should allocate.  We'll store the SharedInfo
859   // for the external buffer just after the buffer itself.  (We store it just
860   // after the buffer rather than just before so that the code can still just
861   // use free(buf_) to free the buffer.)
862   size_t minSize = static_cast<size_t>(minCapacity) + sizeof(SharedInfo);
863   // Add room for padding so that the SharedInfo will be aligned on an 8-byte
864   // boundary.
865   minSize = (minSize + 7) & ~7;
866
867   // Use goodMallocSize() to bump up the capacity to a decent size to request
868   // from malloc, so we can use all of the space that malloc will probably give
869   // us anyway.
870   return goodMallocSize(minSize);
871 }
872
873 void IOBuf::initExtBuffer(uint8_t* buf, size_t mallocSize,
874                           SharedInfo** infoReturn,
875                           uint64_t* capacityReturn) {
876   // Find the SharedInfo storage at the end of the buffer
877   // and construct the SharedInfo.
878   uint8_t* infoStart = (buf + mallocSize) - sizeof(SharedInfo);
879   SharedInfo* sharedInfo = new(infoStart) SharedInfo;
880
881   *capacityReturn = infoStart - buf;
882   *infoReturn = sharedInfo;
883 }
884
885 fbstring IOBuf::moveToFbString() {
886   // malloc-allocated buffers are just fine, everything else needs
887   // to be turned into one.
888   if (!sharedInfo() ||         // user owned, not ours to give up
889       sharedInfo()->freeFn ||  // not malloc()-ed
890       headroom() != 0 ||       // malloc()-ed block doesn't start at beginning
891       tailroom() == 0 ||       // no room for NUL terminator
892       isShared() ||            // shared
893       isChained()) {           // chained
894     // We might as well get rid of all head and tailroom if we're going
895     // to reallocate; we need 1 byte for NUL terminator.
896     coalesceAndReallocate(0, computeChainDataLength(), this, 1);
897   }
898
899   // Ensure NUL terminated
900   *writableTail() = 0;
901   fbstring str(reinterpret_cast<char*>(writableData()),
902                length(),  capacity(),
903                AcquireMallocatedString());
904
905   if (flags() & kFlagFreeSharedInfo) {
906     delete sharedInfo();
907   }
908
909   // Reset to a state where we can be deleted cleanly
910   flagsAndSharedInfo_ = 0;
911   buf_ = nullptr;
912   clear();
913   return str;
914 }
915
916 IOBuf::Iterator IOBuf::cbegin() const {
917   return Iterator(this, this);
918 }
919
920 IOBuf::Iterator IOBuf::cend() const {
921   return Iterator(nullptr, nullptr);
922 }
923
924 folly::fbvector<struct iovec> IOBuf::getIov() const {
925   folly::fbvector<struct iovec> iov;
926   iov.reserve(countChainElements());
927   appendToIov(&iov);
928   return iov;
929 }
930
931 void IOBuf::appendToIov(folly::fbvector<struct iovec>* iov) const {
932   IOBuf const* p = this;
933   do {
934     // some code can get confused by empty iovs, so skip them
935     if (p->length() > 0) {
936       iov->push_back({(void*)p->data(), folly::to<size_t>(p->length())});
937     }
938     p = p->next();
939   } while (p != this);
940 }
941
942 size_t IOBuf::fillIov(struct iovec* iov, size_t len) const {
943   IOBuf const* p = this;
944   size_t i = 0;
945   while (i < len) {
946     // some code can get confused by empty iovs, so skip them
947     if (p->length() > 0) {
948       iov[i].iov_base = const_cast<uint8_t*>(p->data());
949       iov[i].iov_len = p->length();
950       i++;
951     }
952     p = p->next();
953     if (p == this) {
954       return i;
955     }
956   }
957   return 0;
958 }
959
960 size_t IOBufHash::operator()(const IOBuf& buf) const {
961   folly::hash::SpookyHashV2 hasher;
962   hasher.Init(0, 0);
963   io::Cursor cursor(&buf);
964   for (;;) {
965     auto p = cursor.peek();
966     if (p.second == 0) {
967       break;
968     }
969     hasher.Update(p.first, p.second);
970     cursor.skip(p.second);
971   }
972   uint64_t h1;
973   uint64_t h2;
974   hasher.Final(&h1, &h2);
975   return h1;
976 }
977
978 bool IOBufEqual::operator()(const IOBuf& a, const IOBuf& b) const {
979   io::Cursor ca(&a);
980   io::Cursor cb(&b);
981   for (;;) {
982     auto pa = ca.peek();
983     auto pb = cb.peek();
984     if (pa.second == 0 && pb.second == 0) {
985       return true;
986     } else if (pa.second == 0 || pb.second == 0) {
987       return false;
988     }
989     size_t n = std::min(pa.second, pb.second);
990     DCHECK_GT(n, 0);
991     if (memcmp(pa.first, pb.first, n)) {
992       return false;
993     }
994     ca.skip(n);
995     cb.skip(n);
996   }
997 }
998
999 } // folly