Add missing uint32 type to folly::ProgramOptions::gFlagAdders
[folly.git] / folly / AtomicHashMap.h
1 /*
2  * Copyright 2017 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 /*
18  * AtomicHashMap --
19  *
20  * A high-performance concurrent hash map with int32 or int64 keys. Supports
21  * insert, find(key), findAt(index), erase(key), size, and more.  Memory cannot
22  * be freed or reclaimed by erase.  Can grow to a maximum of about 18 times the
23  * initial capacity, but performance degrades linearly with growth. Can also be
24  * used as an object store with unique 32-bit references directly into the
25  * internal storage (retrieved with iterator::getIndex()).
26  *
27  * Advantages:
28  *    - High-performance (~2-4x tbb::concurrent_hash_map in heavily
29  *      multi-threaded environments).
30  *    - Efficient memory usage if initial capacity is not over estimated
31  *      (especially for small keys and values).
32  *    - Good fragmentation properties (only allocates in large slabs which can
33  *      be reused with clear() and never move).
34  *    - Can generate unique, long-lived 32-bit references for efficient lookup
35  *      (see findAt()).
36  *
37  * Disadvantages:
38  *    - Keys must be native int32 or int64, or explicitly converted.
39  *    - Must be able to specify unique empty, locked, and erased keys
40  *    - Performance degrades linearly as size grows beyond initialization
41  *      capacity.
42  *    - Max size limit of ~18x initial size (dependent on max load factor).
43  *    - Memory is not freed or reclaimed by erase.
44  *
45  * Usage and Operation Details:
46  *   Simple performance/memory tradeoff with maxLoadFactor.  Higher load factors
47  *   give better memory utilization but probe lengths increase, reducing
48  *   performance.
49  *
50  * Implementation and Performance Details:
51  *   AHArray is a fixed size contiguous block of value_type cells.  When
52  *   writing a cell, the key is locked while the rest of the record is
53  *   written.  Once done, the cell is unlocked by setting the key.  find()
54  *   is completely wait-free and doesn't require any non-relaxed atomic
55  *   operations.  AHA cannot grow beyond initialization capacity, but is
56  *   faster because of reduced data indirection.
57  *
58  *   AHMap is a wrapper around AHArray sub-maps that allows growth and provides
59  *   an interface closer to the STL UnorderedAssociativeContainer concept. These
60  *   sub-maps are allocated on the fly and are processed in series, so the more
61  *   there are (from growing past initial capacity), the worse the performance.
62  *
63  *   Insert returns false if there is a key collision and throws if the max size
64  *   of the map is exceeded.
65  *
66  *   Benchmark performance with 8 simultaneous threads processing 1 million
67  *   unique <int64, int64> entries on a 4-core, 2.5 GHz machine:
68  *
69  *     Load Factor   Mem Efficiency   usec/Insert   usec/Find
70  *         50%             50%           0.19         0.05
71  *         85%             85%           0.20         0.06
72  *         90%             90%           0.23         0.08
73  *         95%             95%           0.27         0.10
74  *
75  *   See folly/tests/AtomicHashMapTest.cpp for more benchmarks.
76  *
77  * @author Spencer Ahrens <sahrens@fb.com>
78  * @author Jordan DeLong <delong.j@fb.com>
79  *
80  */
81
82 #pragma once
83 #define FOLLY_ATOMICHASHMAP_H_
84
85 #include <boost/iterator/iterator_facade.hpp>
86 #include <boost/noncopyable.hpp>
87 #include <boost/type_traits/is_convertible.hpp>
88
89 #include <stdexcept>
90 #include <functional>
91 #include <atomic>
92
93 #include <folly/AtomicHashArray.h>
94 #include <folly/Foreach.h>
95 #include <folly/Hash.h>
96 #include <folly/Likely.h>
97 #include <folly/ThreadCachedInt.h>
98
99 namespace folly {
100
101 /*
102  * AtomicHashMap provides an interface somewhat similar to the
103  * UnorderedAssociativeContainer concept in C++.  This does not
104  * exactly match this concept (or even the basic Container concept),
105  * because of some restrictions imposed by our datastructure.
106  *
107  * Specific differences (there are quite a few):
108  *
109  * - Efficiently thread safe for inserts (main point of this stuff),
110  *   wait-free for lookups.
111  *
112  * - You can erase from this container, but the cell containing the key will
113  *   not be free or reclaimed.
114  *
115  * - You can erase everything by calling clear() (and you must guarantee only
116  *   one thread can be using the container to do that).
117  *
118  * - We aren't DefaultConstructible, CopyConstructible, Assignable, or
119  *   EqualityComparable.  (Most of these are probably not something
120  *   you actually want to do with this anyway.)
121  *
122  * - We don't support the various bucket functions, rehash(),
123  *   reserve(), or equal_range().  Also no constructors taking
124  *   iterators, although this could change.
125  *
126  * - Several insertion functions, notably operator[], are not
127  *   implemented.  It is a little too easy to misuse these functions
128  *   with this container, where part of the point is that when an
129  *   insertion happens for a new key, it will atomically have the
130  *   desired value.
131  *
132  * - The map has no templated insert() taking an iterator range, but
133  *   we do provide an insert(key, value).  The latter seems more
134  *   frequently useful for this container (to avoid sprinkling
135  *   make_pair everywhere), and providing both can lead to some gross
136  *   template error messages.
137  *
138  * - The Allocator must not be stateful (a new instance will be spun up for
139  *   each allocation), and its allocate() method must take a raw number of
140  *   bytes.
141  *
142  * - KeyT must be a 32 bit or 64 bit atomic integer type, and you must
143  *   define special 'locked' and 'empty' key values in the ctor
144  *
145  * - We don't take the Hash function object as an instance in the
146  *   constructor.
147  *
148  */
149
150 // Thrown when insertion fails due to running out of space for
151 // submaps.
152 struct AtomicHashMapFullError : std::runtime_error {
153   explicit AtomicHashMapFullError()
154     : std::runtime_error("AtomicHashMap is full")
155   {}
156 };
157
158 template<class KeyT, class ValueT, class HashFcn, class EqualFcn,
159          class Allocator, class ProbeFcn, class KeyConvertFcn>
160 class AtomicHashMap : boost::noncopyable {
161 typedef AtomicHashArray<KeyT, ValueT, HashFcn, EqualFcn,
162                         Allocator, ProbeFcn, KeyConvertFcn>
163     SubMap;
164
165  public:
166   typedef KeyT                key_type;
167   typedef ValueT              mapped_type;
168   typedef std::pair<const KeyT, ValueT> value_type;
169   typedef HashFcn             hasher;
170   typedef EqualFcn            key_equal;
171   typedef KeyConvertFcn       key_convert;
172   typedef value_type*         pointer;
173   typedef value_type&         reference;
174   typedef const value_type&   const_reference;
175   typedef std::ptrdiff_t      difference_type;
176   typedef std::size_t         size_type;
177   typedef typename SubMap::Config Config;
178
179   template<class ContT, class IterVal, class SubIt>
180   struct ahm_iterator;
181
182   typedef ahm_iterator<const AtomicHashMap,
183                        const value_type,
184                        typename SubMap::const_iterator>
185     const_iterator;
186   typedef ahm_iterator<AtomicHashMap,
187                        value_type,
188                        typename SubMap::iterator>
189     iterator;
190
191  public:
192   const float kGrowthFrac_;  // How much to grow when we run out of capacity.
193
194   // The constructor takes a finalSizeEst which is the optimal
195   // number of elements to maximize space utilization and performance,
196   // and a Config object to specify more advanced options.
197   explicit AtomicHashMap(size_t finalSizeEst, const Config& c = Config());
198
199   ~AtomicHashMap() {
200     const unsigned int numMaps =
201         numMapsAllocated_.load(std::memory_order_relaxed);
202     FOR_EACH_RANGE (i, 0, numMaps) {
203       SubMap* thisMap = subMaps_[i].load(std::memory_order_relaxed);
204       DCHECK(thisMap);
205       SubMap::destroy(thisMap);
206     }
207   }
208
209   key_equal key_eq() const { return key_equal(); }
210   hasher hash_function() const { return hasher(); }
211
212   /*
213    * insert --
214    *
215    *   Returns a pair with iterator to the element at r.first and
216    *   success.  Retrieve the index with ret.first.getIndex().
217    *
218    *   Does not overwrite on key collision, but returns an iterator to
219    *   the existing element (since this could due to a race with
220    *   another thread, it is often important to check this return
221    *   value).
222    *
223    *   Allocates new sub maps as the existing ones become full.  If
224    *   all sub maps are full, no element is inserted, and
225    *   AtomicHashMapFullError is thrown.
226    */
227   std::pair<iterator,bool> insert(const value_type& r) {
228     return emplace(r.first, r.second);
229   }
230   std::pair<iterator,bool> insert(key_type k, const mapped_type& v) {
231     return emplace(k, v);
232   }
233   std::pair<iterator,bool> insert(value_type&& r) {
234     return emplace(r.first, std::move(r.second));
235   }
236   std::pair<iterator,bool> insert(key_type k, mapped_type&& v) {
237     return emplace(k, std::move(v));
238   }
239
240   /*
241    * emplace --
242    *
243    *   Same contract as insert(), but performs in-place construction
244    *   of the value type using the specified arguments.
245    *
246    *   Also, like find(), this method optionally allows 'key_in' to have a type
247    *   different from that stored in the table; see find(). If and only if no
248    *   equal key is already present, this method converts 'key_in' to a key of
249    *   type KeyT using the provided LookupKeyToKeyFcn.
250    */
251   template <typename LookupKeyT = key_type,
252             typename LookupHashFcn = hasher,
253             typename LookupEqualFcn = key_equal,
254             typename LookupKeyToKeyFcn = key_convert,
255             typename... ArgTs>
256   std::pair<iterator,bool> emplace(LookupKeyT k, ArgTs&&... vCtorArg);
257
258   /*
259    * find --
260    *
261    *   Returns the iterator to the element if found, otherwise end().
262    *
263    *   As an optional feature, the type of the key to look up (LookupKeyT) is
264    *   allowed to be different from the type of keys actually stored (KeyT).
265    *
266    *   This enables use cases where materializing the key is costly and usually
267    *   redudant, e.g., canonicalizing/interning a set of strings and being able
268    *   to look up by StringPiece. To use this feature, LookupHashFcn must take
269    *   a LookupKeyT, and LookupEqualFcn must take KeyT and LookupKeyT as first
270    *   and second parameter, respectively.
271    *
272    *   See folly/test/ArrayHashMapTest.cpp for sample usage.
273    */
274   template <typename LookupKeyT = key_type,
275             typename LookupHashFcn = hasher,
276             typename LookupEqualFcn = key_equal>
277   iterator find(LookupKeyT k);
278
279   template <typename LookupKeyT = key_type,
280             typename LookupHashFcn = hasher,
281             typename LookupEqualFcn = key_equal>
282   const_iterator find(LookupKeyT k) const;
283
284   /*
285    * erase --
286    *
287    *   Erases key k from the map
288    *
289    *   Returns 1 iff the key is found and erased, and 0 otherwise.
290    */
291   size_type erase(key_type k);
292
293   /*
294    * clear --
295    *
296    *   Wipes all keys and values from primary map and destroys all secondary
297    *   maps.  Primary map remains allocated and thus the memory can be reused
298    *   in place.  Not thread safe.
299    *
300    */
301   void clear();
302
303   /*
304    * size --
305    *
306    *  Returns the exact size of the map.  Note this is not as cheap as typical
307    *  size() implementations because, for each AtomicHashArray in this AHM, we
308    *  need to grab a lock and accumulate the values from all the thread local
309    *  counters.  See folly/ThreadCachedInt.h for more details.
310    */
311   size_t size() const;
312
313   bool empty() const { return size() == 0; }
314
315   size_type count(key_type k) const {
316     return find(k) == end() ? 0 : 1;
317   }
318
319
320   /*
321    * findAt --
322    *
323    *   Returns an iterator into the map.
324    *
325    *   idx should only be an unmodified value returned by calling getIndex() on
326    *   a valid iterator returned by find() or insert(). If idx is invalid you
327    *   have a bug and the process aborts.
328    */
329   iterator findAt(uint32_t idx) {
330     SimpleRetT ret = findAtInternal(idx);
331     DCHECK_LT(ret.i, numSubMaps());
332     return iterator(this, ret.i,
333       subMaps_[ret.i].load(std::memory_order_relaxed)->makeIter(ret.j));
334   }
335   const_iterator findAt(uint32_t idx) const {
336     return const_cast<AtomicHashMap*>(this)->findAt(idx);
337   }
338
339   // Total capacity - summation of capacities of all submaps.
340   size_t capacity() const;
341
342   // Number of new insertions until current submaps are all at max load factor.
343   size_t spaceRemaining() const;
344
345   void setEntryCountThreadCacheSize(int32_t newSize) {
346     const int numMaps = numMapsAllocated_.load(std::memory_order_acquire);
347     for (int i = 0; i < numMaps; ++i) {
348       SubMap* map = subMaps_[i].load(std::memory_order_relaxed);
349       map->setEntryCountThreadCacheSize(newSize);
350     }
351   }
352
353   // Number of sub maps allocated so far to implement this map.  The more there
354   // are, the worse the performance.
355   int numSubMaps() const {
356     return numMapsAllocated_.load(std::memory_order_acquire);
357   }
358
359   iterator begin() {
360     iterator it(this, 0,
361       subMaps_[0].load(std::memory_order_relaxed)->begin());
362     it.checkAdvanceToNextSubmap();
363     return it;
364   }
365
366   const_iterator begin() const {
367     const_iterator it(this, 0,
368       subMaps_[0].load(std::memory_order_relaxed)->begin());
369     it.checkAdvanceToNextSubmap();
370     return it;
371   }
372
373   iterator end() {
374     return iterator();
375   }
376
377   const_iterator end() const {
378     return const_iterator();
379   }
380
381   /* Advanced functions for direct access: */
382
383   inline uint32_t recToIdx(const value_type& r, bool mayInsert = true) {
384     SimpleRetT ret = mayInsert ?
385       insertInternal(r.first, r.second) : findInternal(r.first);
386     return encodeIndex(ret.i, ret.j);
387   }
388
389   inline uint32_t recToIdx(value_type&& r, bool mayInsert = true) {
390     SimpleRetT ret = mayInsert ?
391       insertInternal(r.first, std::move(r.second)) : findInternal(r.first);
392     return encodeIndex(ret.i, ret.j);
393   }
394
395   inline uint32_t recToIdx(key_type k, const mapped_type& v,
396     bool mayInsert = true) {
397     SimpleRetT ret = mayInsert ? insertInternal(k, v) : findInternal(k);
398     return encodeIndex(ret.i, ret.j);
399   }
400
401   inline uint32_t recToIdx(key_type k, mapped_type&& v, bool mayInsert = true) {
402     SimpleRetT ret = mayInsert ?
403       insertInternal(k, std::move(v)) : findInternal(k);
404     return encodeIndex(ret.i, ret.j);
405   }
406
407   inline uint32_t keyToIdx(const KeyT k, bool mayInsert = false) {
408     return recToIdx(value_type(k), mayInsert);
409   }
410
411   inline const value_type& idxToRec(uint32_t idx) const {
412     SimpleRetT ret = findAtInternal(idx);
413     return subMaps_[ret.i].load(std::memory_order_relaxed)->idxToRec(ret.j);
414   }
415
416   /* Private data and helper functions... */
417
418  private:
419   // This limits primary submap size to 2^31 ~= 2 billion, secondary submap
420   // size to 2^(32 - kNumSubMapBits_ - 1) = 2^27 ~= 130 million, and num subMaps
421   // to 2^kNumSubMapBits_ = 16.
422   static const uint32_t  kNumSubMapBits_     = 4;
423   static const uint32_t  kSecondaryMapBit_   = 1u << 31; // Highest bit
424   static const uint32_t  kSubMapIndexShift_  = 32 - kNumSubMapBits_ - 1;
425   static const uint32_t  kSubMapIndexMask_   = (1 << kSubMapIndexShift_) - 1;
426   static const uint32_t  kNumSubMaps_        = 1 << kNumSubMapBits_;
427   static const uintptr_t kLockedPtr_         = 0x88ULL << 48; // invalid pointer
428
429   struct SimpleRetT { uint32_t i; size_t j; bool success;
430     SimpleRetT(uint32_t ii, size_t jj, bool s) : i(ii), j(jj), success(s) {}
431     SimpleRetT() = default;
432   };
433
434   template <typename LookupKeyT = key_type,
435             typename LookupHashFcn = hasher,
436             typename LookupEqualFcn = key_equal,
437             typename LookupKeyToKeyFcn = key_convert,
438             typename... ArgTs>
439   SimpleRetT insertInternal(LookupKeyT key, ArgTs&&... value);
440
441   template <typename LookupKeyT = key_type,
442             typename LookupHashFcn = hasher,
443             typename LookupEqualFcn = key_equal>
444   SimpleRetT findInternal(const LookupKeyT k) const;
445
446   SimpleRetT findAtInternal(uint32_t idx) const;
447
448   std::atomic<SubMap*> subMaps_[kNumSubMaps_];
449   std::atomic<uint32_t> numMapsAllocated_;
450
451   inline bool tryLockMap(unsigned int idx) {
452     SubMap* val = nullptr;
453     return subMaps_[idx].compare_exchange_strong(val, (SubMap*)kLockedPtr_,
454       std::memory_order_acquire);
455   }
456
457   static inline uint32_t encodeIndex(uint32_t subMap, uint32_t subMapIdx);
458
459 }; // AtomicHashMap
460
461 template <class KeyT,
462           class ValueT,
463           class HashFcn = std::hash<KeyT>,
464           class EqualFcn = std::equal_to<KeyT>,
465           class Allocator = std::allocator<char>>
466 using QuadraticProbingAtomicHashMap =
467     AtomicHashMap<KeyT,
468                   ValueT,
469                   HashFcn,
470                   EqualFcn,
471                   Allocator,
472                   AtomicHashArrayQuadraticProbeFcn>;
473 } // namespace folly
474
475 #include <folly/AtomicHashMap-inl.h>