Add declaration for allocm
[folly.git] / folly / Malloc.h
1 /*
2  * Copyright 2013 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 // Functions to provide smarter use of jemalloc, if jemalloc is being used.
18 // http://www.canonware.com/download/jemalloc/jemalloc-latest/doc/jemalloc.html
19
20 #ifndef FOLLY_MALLOC_H_
21 #define FOLLY_MALLOC_H_
22
23 // If using fbstring from libstdc++, then just define stub code
24 // here to typedef the fbstring type into the folly namespace.
25 // This provides backwards compatibility for code that explicitly
26 // includes and uses fbstring.
27 #if defined(_GLIBCXX_USE_FB) && !defined(_LIBSTDCXX_FBSTRING)
28
29 #include <string>
30 namespace folly {
31   using std::goodMallocSize;
32   using std::jemallocMinInPlaceExpandable;
33   using std::usingJEMalloc;
34   using std::smartRealloc;
35   using std::checkedMalloc;
36   using std::checkedCalloc;
37   using std::checkedRealloc;
38 }
39
40 #else // !defined(_GLIBCXX_USE_FB) || defined(_LIBSTDCXX_FBSTRING)
41
42 #ifdef _LIBSTDCXX_FBSTRING
43 #pragma GCC system_header
44 #define FOLLY_HAVE_MALLOC_H 1
45 #else
46 #include "folly/Portability.h"
47 #endif
48
49 // for malloc_usable_size
50 // NOTE: FreeBSD 9 doesn't have malloc.h.  It's defitions
51 // are found in stdlib.h.
52 #ifdef FOLLY_HAVE_MALLOC_H
53 #include <malloc.h>
54 #else
55 #include <stdlib.h>
56 #endif
57
58 #include <cassert>
59 #include <cstddef>
60 #include <cstdlib>
61 #include <cstring>
62
63 #include <new>
64
65 #include <bits/functexcept.h>
66
67 /**
68  * Define various ALLOCM_* macros normally provided by jemalloc.  We define
69  * them so that we don't have to include jemalloc.h, in case the program is
70  * built without jemalloc support.
71  */
72 #ifndef ALLOCM_SUCCESS
73
74 #define ALLOCM_SUCCESS 0
75 #define ALLOCM_ERR_OOM 1
76 #define ALLOCM_ERR_NOT_MOVED 2
77
78 #define ALLOCM_ZERO    64
79 #define ALLOCM_NO_MOVE 128
80
81 #define ALLOCM_LG_ALIGN(la) (la)
82
83 #if defined(JEMALLOC_MANGLE) && defined(JEMALLOC_EXPERIMENTAL)
84 #define rallocm je_rallocm
85 #define allocm je_allocm
86 #endif
87
88 #endif /* ALLOCM_SUCCESS */
89
90 /**
91  * Declare rallocm() and malloc_usable_size() as weak symbols.  It
92  * will be provided by jemalloc if we are using jemalloc, or it will
93  * be NULL if we are using another malloc implementation.
94  */
95 extern "C" int rallocm(void**, size_t*, size_t, size_t, int)
96 __attribute__((weak));
97 extern "C" int allocm(void**, size_t*, size_t, int)
98 __attribute__((weak));
99
100 #ifdef _LIBSTDCXX_FBSTRING
101 namespace std _GLIBCXX_VISIBILITY(default) {
102 _GLIBCXX_BEGIN_NAMESPACE_VERSION
103 #else
104 namespace folly {
105 #endif
106
107
108 /**
109  * Determine if we are using jemalloc or not.
110  */
111 inline bool usingJEMalloc() {
112   return rallocm != NULL;
113 }
114
115 /**
116  * For jemalloc's size classes, see
117  * http://www.canonware.com/download/jemalloc/jemalloc-latest/doc/jemalloc.html
118  */
119 inline size_t goodMallocSize(size_t minSize) {
120   if (!usingJEMalloc()) {
121     // Not using jemalloc - no smarts
122     return minSize;
123   }
124   if (minSize <= 64) {
125     // Choose smallest allocation to be 64 bytes - no tripping over
126     // cache line boundaries, and small string optimization takes care
127     // of short strings anyway.
128     return 64;
129   }
130   if (minSize <= 512) {
131     // Round up to the next multiple of 64; we don't want to trip over
132     // cache line boundaries.
133     return (minSize + 63) & ~size_t(63);
134   }
135   if (minSize <= 3840) {
136     // Round up to the next multiple of 256
137     return (minSize + 255) & ~size_t(255);
138   }
139   if (minSize <= 4072 * 1024) {
140     // Round up to the next multiple of 4KB
141     return (minSize + 4095) & ~size_t(4095);
142   }
143   // Holy Moly
144   // Round up to the next multiple of 4MB
145   return (minSize + 4194303) & ~size_t(4194303);
146 }
147
148 // We always request "good" sizes for allocation, so jemalloc can
149 // never grow in place small blocks; they're already occupied to the
150 // brim.  Blocks larger than or equal to 4096 bytes can in fact be
151 // expanded in place, and this constant reflects that.
152 static const size_t jemallocMinInPlaceExpandable = 4096;
153
154 /**
155  * Trivial wrappers around malloc, calloc, realloc that check for allocation
156  * failure and throw std::bad_alloc in that case.
157  */
158 inline void* checkedMalloc(size_t size) {
159   void* p = malloc(size);
160   if (!p) std::__throw_bad_alloc();
161   return p;
162 }
163
164 inline void* checkedCalloc(size_t n, size_t size) {
165   void* p = calloc(n, size);
166   if (!p) std::__throw_bad_alloc();
167   return p;
168 }
169
170 inline void* checkedRealloc(void* ptr, size_t size) {
171   void* p = realloc(ptr, size);
172   if (!p) std::__throw_bad_alloc();
173   return p;
174 }
175
176 /**
177  * This function tries to reallocate a buffer of which only the first
178  * currentSize bytes are used. The problem with using realloc is that
179  * if currentSize is relatively small _and_ if realloc decides it
180  * needs to move the memory chunk to a new buffer, then realloc ends
181  * up copying data that is not used. It's impossible to hook into
182  * GNU's malloc to figure whether expansion will occur in-place or as
183  * a malloc-copy-free troika. (If an expand_in_place primitive would
184  * be available, smartRealloc would use it.) As things stand, this
185  * routine just tries to call realloc() (thus benefitting of potential
186  * copy-free coalescing) unless there's too much slack memory.
187  */
188 inline void* smartRealloc(void* p,
189                           const size_t currentSize,
190                           const size_t currentCapacity,
191                           const size_t newCapacity) {
192   assert(p);
193   assert(currentSize <= currentCapacity &&
194          currentCapacity < newCapacity);
195
196   if (usingJEMalloc()) {
197     // using jemalloc's API. Don't forget that jemalloc can never grow
198     // in place blocks smaller than 4096 bytes.
199     if (currentCapacity >= jemallocMinInPlaceExpandable &&
200         rallocm(&p, NULL, newCapacity, 0, ALLOCM_NO_MOVE) == ALLOCM_SUCCESS) {
201       // Managed to expand in place
202       return p;
203     }
204     // Cannot expand; must move
205     auto const result = checkedMalloc(newCapacity);
206     std::memcpy(result, p, currentSize);
207     free(p);
208     return result;
209   }
210
211   // No jemalloc no honey
212   auto const slack = currentCapacity - currentSize;
213   if (slack * 2 > currentSize) {
214     // Too much slack, malloc-copy-free cycle:
215     auto const result = checkedMalloc(newCapacity);
216     std::memcpy(result, p, currentSize);
217     free(p);
218     return result;
219   }
220   // If there's not too much slack, we realloc in hope of coalescing
221   return checkedRealloc(p, newCapacity);
222 }
223
224 #ifdef _LIBSTDCXX_FBSTRING
225 _GLIBCXX_END_NAMESPACE_VERSION
226 #endif
227
228 } // folly
229
230 #endif // !defined(_GLIBCXX_USE_FB) || defined(_LIBSTDCXX_FBSTRING)
231
232 #endif // FOLLY_MALLOC_H_