Remove trailing spaces
[libcds.git] / cds / intrusive / michael_set_rcu.h
1 //$$CDS-header$$
2
3 #ifndef __CDS_INTRUSIVE_MICHAEL_SET_RCU_H
4 #define __CDS_INTRUSIVE_MICHAEL_SET_RCU_H
5
6 #include <cds/intrusive/details/michael_set_base.h>
7 #include <cds/details/allocator.h>
8
9 namespace cds { namespace intrusive {
10
11     /// Michael's hash set, \ref cds_urcu_desc "RCU" specialization
12     /** @ingroup cds_intrusive_map
13         \anchor cds_intrusive_MichaelHashSet_rcu
14
15         Source:
16             - [2002] Maged Michael "High performance dynamic lock-free hash tables and list-based sets"
17
18         Michael's hash table algorithm is based on lock-free ordered list and it is very simple.
19         The main structure is an array \p T of size \p M. Each element in \p T is basically a pointer
20         to a hash bucket, implemented as a singly linked list. The array of buckets cannot be dynamically expanded.
21         However, each bucket may contain unbounded number of items.
22
23         Template parameters are:
24         - \p RCU - one of \ref cds_urcu_gc "RCU type"
25         - \p OrderedList - ordered list implementation used as bucket for hash set, for example, MichaelList, LazyList.
26             The intrusive ordered list implementation specifies the type \p T stored in the hash-set, the reclamation
27             schema \p GC used by hash-set, the comparison functor for the type \p T and other features specific for
28             the ordered list.
29         - \p Traits - type traits, default is \p michael_set::traits.
30             Instead of defining \p Traits struct you can use option-based syntax with \p michael_set::make_traits metafunction.
31
32         \par Usage
33             Before including <tt><cds/intrusive/michael_set_rcu.h></tt> you should include appropriate RCU header file,
34             see \ref cds_urcu_gc "RCU type" for list of existing RCU class and corresponding header files.
35             For example, for \ref cds_urcu_general_buffered_gc "general-purpose buffered RCU" you should include:
36             \code
37             #include <cds/urcu/general_buffered.h>
38             #include <cds/intrusive/michael_list_rcu.h>
39             #include <cds/intrusive/michael_set_rcu.h>
40
41             struct Foo { ... };
42             // Hash functor for struct Foo
43             struct foo_hash {
44                 size_t operator()( Foo const& foo ) const { return ... }
45             };
46
47             // Now, you can declare Michael's list for type Foo and default traits:
48             typedef cds::intrusive::MichaelList<cds::urcu::gc< general_buffered<> >, Foo > rcu_michael_list;
49
50             // Declare Michael's set with MichaelList as bucket type
51             typedef cds::intrusive::MichaelSet<
52                 cds::urcu::gc< general_buffered<> >,
53                 rcu_michael_list,
54                 cds::intrusive::michael_set::make_traits<
55                     cds::opt::::hash< foo_hash >
56                 >::type
57             > rcu_michael_set;
58
59             // Declares hash set for 1000000 items with load factor 2
60             rcu_michael_set theSet( 1000000, 2 );
61
62             // Now you can use theSet object in many threads without any synchronization.
63             \endcode
64     */
65     template <
66         class RCU,
67         class OrderedList,
68 #ifdef CDS_DOXYGEN_INVOKED
69         class Traits = michael_set::traits
70 #else
71         class Traits
72 #endif
73     >
74     class MichaelHashSet< cds::urcu::gc< RCU >, OrderedList, Traits >
75     {
76     public:
77         typedef cds::urcu::gc< RCU > gc;   ///< RCU schema
78         typedef OrderedList bucket_type;   ///< type of ordered list used as a bucket implementation
79         typedef Traits traits;             ///< Set traits
80
81         typedef typename bucket_type::value_type        value_type      ;   ///< type of value stored in the list
82         typedef typename bucket_type::key_comparator    key_comparator  ;   ///< key comparing functor
83         typedef typename bucket_type::disposer          disposer        ;   ///< Node disposer functor
84
85         /// Hash functor for \ref value_type and all its derivatives that you use
86         typedef typename cds::opt::v::hash_selector< typename traits::hash >::type hash;
87         typedef typename traits::item_counter item_counter;   ///< Item counter type
88
89         /// Bucket table allocator
90         typedef cds::details::Allocator< bucket_type, typename traits::allocator >  bucket_table_allocator;
91
92         typedef typename bucket_type::rcu_lock         rcu_lock;   ///< RCU scoped lock
93         typedef typename bucket_type::exempt_ptr       exempt_ptr; ///< pointer to extracted node
94         /// Group of \p extract_xxx functions require external locking if underlying ordered list requires that
95         static CDS_CONSTEXPR const bool c_bExtractLockExternal = bucket_type::c_bExtractLockExternal;
96
97     protected:
98         item_counter    m_ItemCounter;   ///< Item counter
99         hash            m_HashFunctor;   ///< Hash functor
100         bucket_type *   m_Buckets;       ///< bucket table
101
102     private:
103         //@cond
104         const size_t m_nHashBitmask;
105         //@endcond
106
107     protected:
108         //@cond
109         /// Calculates hash value of \p key
110         template <typename Q>
111         size_t hash_value( Q const& key ) const
112         {
113             return m_HashFunctor( key ) & m_nHashBitmask;
114         }
115
116         /// Returns the bucket (ordered list) for \p key
117         template <typename Q>
118         bucket_type& bucket( Q const& key )
119         {
120             return m_Buckets[ hash_value( key ) ];
121         }
122         template <typename Q>
123         bucket_type const& bucket( Q const& key ) const
124         {
125             return m_Buckets[ hash_value( key ) ];
126         }
127         //@endcond
128
129     public:
130         /// Forward iterator
131         /**
132             The forward iterator for Michael's set is based on \p OrderedList forward iterator and has some features:
133             - it has no post-increment operator
134             - it iterates items in unordered fashion
135         */
136         typedef michael_set::details::iterator< bucket_type, false >    iterator;
137
138         /// Const forward iterator
139         /**
140             For iterator's features and requirements see \ref iterator
141         */
142         typedef michael_set::details::iterator< bucket_type, true >     const_iterator;
143
144         /// Returns a forward iterator addressing the first element in a set
145         /**
146             For empty set \code begin() == end() \endcode
147         */
148         iterator begin()
149         {
150             return iterator( m_Buckets[0].begin(), m_Buckets, m_Buckets + bucket_count() );
151         }
152
153         /// Returns an iterator that addresses the location succeeding the last element in a set
154         /**
155             Do not use the value returned by <tt>end</tt> function to access any item.
156             The returned value can be used only to control reaching the end of the set.
157             For empty set \code begin() == end() \endcode
158         */
159         iterator end()
160         {
161             return iterator( m_Buckets[bucket_count() - 1].end(), m_Buckets + bucket_count() - 1, m_Buckets + bucket_count() );
162         }
163
164         /// Returns a forward const iterator addressing the first element in a set
165         //@{
166         const_iterator begin() const
167         {
168             return cbegin();
169         }
170         const_iterator cbegin() const
171         {
172             return const_iterator( m_Buckets[0].cbegin(), m_Buckets, m_Buckets + bucket_count() );
173         }
174         //@}
175
176         /// Returns an const iterator that addresses the location succeeding the last element in a set
177         //@{
178         const_iterator end() const
179         {
180             return cend();
181         }
182         const_iterator cend() const
183         {
184             return const_iterator( m_Buckets[bucket_count() - 1].cend(), m_Buckets + bucket_count() - 1, m_Buckets + bucket_count() );
185         }
186         //@}
187
188     public:
189         /// Initialize hash set
190         /**
191             The Michael's hash set is an unbounded container, but its hash table is non-expandable.
192             At construction time you should pass estimated maximum item count and a load factor.
193             The load factor is average size of one bucket - a small number between 1 and 10.
194             The bucket is an ordered single-linked list, the complexity of searching in the bucket is linear <tt>O(nLoadFactor)</tt>.
195             The constructor defines hash table size as rounding <tt>nMaxItemCount / nLoadFactor</tt> up to nearest power of two.
196         */
197         MichaelHashSet(
198             size_t nMaxItemCount,   ///< estimation of max item count in the hash set
199             size_t nLoadFactor      ///< load factor: average size of the bucket
200         ) : m_nHashBitmask( michael_set::details::init_hash_bitmask( nMaxItemCount, nLoadFactor ))
201         {
202             // GC and OrderedList::gc must be the same
203             static_assert( std::is_same<gc, typename bucket_type::gc>::value, "GC and OrderedList::gc must be the same");
204
205             // atomicity::empty_item_counter is not allowed as a item counter
206             static_assert( !std::is_same<item_counter, atomicity::empty_item_counter>::value,
207                 "atomicity::empty_item_counter is not allowed as a item counter");
208
209             m_Buckets = bucket_table_allocator().NewArray( bucket_count() );
210         }
211
212         /// Clear hash set and destroy it
213         ~MichaelHashSet()
214         {
215             clear();
216             bucket_table_allocator().Delete( m_Buckets, bucket_count() );
217         }
218
219         /// Inserts new node
220         /**
221             The function inserts \p val in the set if it does not contain
222             an item with key equal to \p val.
223
224             Returns \p true if \p val is placed into the set, \p false otherwise.
225         */
226         bool insert( value_type& val )
227         {
228             bool bRet = bucket( val ).insert( val );
229             if ( bRet )
230                 ++m_ItemCounter;
231             return bRet;
232         }
233
234         /// Inserts new node
235         /**
236             This function is intended for derived non-intrusive containers.
237
238             The function allows to split creating of new item into two part:
239             - create item with key only
240             - insert new item into the set
241             - if inserting is success, calls  \p f functor to initialize value-field of \p val.
242
243             The functor signature is:
244             \code
245                 void func( value_type& val );
246             \endcode
247             where \p val is the item inserted.
248             The user-defined functor is called only if the inserting is success.
249
250             @warning For \ref cds_intrusive_MichaelList_rcu "MichaelList" as the bucket see \ref cds_intrusive_item_creating "insert item troubleshooting".
251             \ref cds_intrusive_LazyList_rcu "LazyList" provides exclusive access to inserted item and does not require any node-level
252             synchronization.
253         */
254         template <typename Func>
255         bool insert( value_type& val, Func f )
256         {
257             bool bRet = bucket( val ).insert( val, f );
258             if ( bRet )
259                 ++m_ItemCounter;
260             return bRet;
261         }
262
263         /// Ensures that the \p item exists in the set
264         /**
265             The operation performs inserting or changing data with lock-free manner.
266
267             If the item \p val not found in the set, then \p val is inserted into the set.
268             Otherwise, the functor \p func is called with item found.
269             The functor signature is:
270             \code
271                 void func( bool bNew, value_type& item, value_type& val );
272             \endcode
273             with arguments:
274             - \p bNew - \p true if the item has been inserted, \p false otherwise
275             - \p item - item of the set
276             - \p val - argument \p val passed into the \p ensure function
277             If new item has been inserted (i.e. \p bNew is \p true) then \p item and \p val arguments
278             refers to the same thing.
279
280             The functor can change non-key fields of the \p item.
281
282             Returns std::pair<bool, bool> where \p first is \p true if operation is successfull,
283             \p second is \p true if new item has been added or \p false if the item with \p key
284             already is in the set.
285
286             @warning For \ref cds_intrusive_MichaelList_rcu "MichaelList" as the bucket see \ref cds_intrusive_item_creating "insert item troubleshooting".
287             \ref cds_intrusive_LazyList_rcu "LazyList" provides exclusive access to inserted item and does not require any node-level
288             synchronization.
289             */
290         template <typename Func>
291         std::pair<bool, bool> ensure( value_type& val, Func func )
292         {
293             std::pair<bool, bool> bRet = bucket( val ).ensure( val, func );
294             if ( bRet.first && bRet.second )
295                 ++m_ItemCounter;
296             return bRet;
297         }
298
299         /// Unlinks the item \p val from the set
300         /**
301             The function searches the item \p val in the set and unlink it from the set
302             if it is found and is equal to \p val.
303
304             The function returns \p true if success and \p false otherwise.
305         */
306         bool unlink( value_type& val )
307         {
308             bool bRet = bucket( val ).unlink( val );
309             if ( bRet )
310                 --m_ItemCounter;
311             return bRet;
312         }
313
314         /// Deletes the item from the set
315         /** \anchor cds_intrusive_MichaelHashSet_rcu_erase
316             The function searches an item with key equal to \p key in the set,
317             unlinks it from the set, and returns \p true.
318             If the item with key equal to \p key is not found the function return \p false.
319
320             Note the hash functor should accept a parameter of type \p Q that may be not the same as \p value_type.
321         */
322         template <typename Q>
323         bool erase( Q const& key )
324         {
325             if ( bucket( key ).erase( key )) {
326                 --m_ItemCounter;
327                 return true;
328             }
329             return false;
330         }
331
332         /// Deletes the item from the set using \p pred predicate for searching
333         /**
334             The function is an analog of \ref cds_intrusive_MichaelHashSet_rcu_erase "erase(Q const&)"
335             but \p pred is used for key comparing.
336             \p Less functor has the interface like \p std::less.
337             \p pred must imply the same element order as the comparator used for building the set.
338         */
339         template <typename Q, typename Less>
340         bool erase_with( Q const& key, Less pred )
341         {
342             if ( bucket( key ).erase_with( key, pred )) {
343                 --m_ItemCounter;
344                 return true;
345             }
346             return false;
347         }
348
349         /// Deletes the item from the set
350         /** \anchor cds_intrusive_MichaelHashSet_rcu_erase_func
351             The function searches an item with key equal to \p key in the set,
352             call \p f functor with item found, and unlinks it from the set.
353             The \ref disposer specified in \p OrderedList class template parameter is called
354             by garbage collector \p GC asynchronously.
355
356             The \p Func interface is
357             \code
358             struct functor {
359                 void operator()( value_type const& item );
360             };
361             \endcode
362             The functor may be passed by reference with <tt>boost:ref</tt>
363
364             If the item with key equal to \p key is not found the function return \p false.
365
366             Note the hash functor should accept a parameter of type \p Q that can be not the same as \p value_type.
367         */
368         template <typename Q, typename Func>
369         bool erase( const Q& key, Func f )
370         {
371             if ( bucket( key ).erase( key, f )) {
372                 --m_ItemCounter;
373                 return true;
374             }
375             return false;
376         }
377
378         /// Deletes the item from the set using \p pred predicate for searching
379         /**
380             The function is an analog of \ref cds_intrusive_MichaelHashSet_rcu_erase_func "erase(Q const&)"
381             but \p pred is used for key comparing.
382             \p Less functor has the interface like \p std::less.
383             \p pred must imply the same element order as the comparator used for building the set.
384         */
385         template <typename Q, typename Less, typename Func>
386         bool erase_with( const Q& key, Less pred, Func f )
387         {
388             if ( bucket( key ).erase_with( key, pred, f )) {
389                 --m_ItemCounter;
390                 return true;
391             }
392             return false;
393         }
394
395         /// Extracts an item from the set
396         /** \anchor cds_intrusive_MichaelHashSet_rcu_extract
397             The function searches an item with key equal to \p key in the set,
398             unlinks it from the set, places item pointer into \p dest argument, and returns \p true.
399             If the item with the key equal to \p key is not found the function return \p false.
400
401             @note The function does NOT call RCU read-side lock or synchronization,
402             and does NOT dispose the item found. It just excludes the item from the set
403             and returns a pointer to item found.
404             You should lock RCU before calling of the function, and you should synchronize RCU
405             outside the RCU lock before reusing returned pointer.
406
407             \code
408             #include <cds/urcu/general_buffered.h>
409             #include <cds/intrusive/michael_list_rcu.h>
410             #include <cds/intrusive/michael_set_rcu.h>
411
412             typedef cds::urcu::gc< general_buffered<> > rcu;
413             typedef cds::intrusive::MichaelList< rcu, Foo > rcu_michael_list;
414             typedef cds::intrusive::MichaelHashSet< rcu, rcu_michael_list, foo_traits > rcu_michael_set;
415
416             rcu_michael_set theSet;
417             // ...
418
419             rcu_michael_set::exempt_ptr p;
420             {
421                 // first, we should lock RCU
422                 rcu_michael_set::rcu_lock lock;
423
424                 // Now, you can apply extract function
425                 // Note that you must not delete the item found inside the RCU lock
426                 if ( theSet.extract( p, 10 )) {
427                     // do something with p
428                     ...
429                 }
430             }
431
432             // We may safely release p here
433             // release() passes the pointer to RCU reclamation cycle:
434             // it invokes RCU retire_ptr function with the disposer you provided for rcu_michael_list.
435             p.release();
436             \endcode
437         */
438         template <typename Q>
439         bool extract( exempt_ptr& dest, Q const& key )
440         {
441             if ( bucket( key ).extract( dest, key )) {
442                 --m_ItemCounter;
443                 return true;
444             }
445             return false;
446         }
447
448         /// Extracts an item from the set using \p pred predicate for searching
449         /**
450             The function is an analog of \ref cds_intrusive_MichaelHashSet_rcu_extract "extract(exempt_ptr&, Q const&)"
451             but \p pred is used for key comparing.
452             \p Less functor has the interface like \p std::less.
453             \p pred must imply the same element order as the comparator used for building the set.
454         */
455         template <typename Q, typename Less>
456         bool extract_with( exempt_ptr& dest, Q const& key, Less pred )
457         {
458             if ( bucket( key ).extract_with( dest, key, pred )) {
459                 --m_ItemCounter;
460                 return true;
461             }
462             return false;
463         }
464
465         /// Finds the key \p key
466         /** \anchor cds_intrusive_MichaelHashSet_rcu_find_val
467             The function searches the item with key equal to \p key
468             and returns \p true if \p key found or \p false otherwise.
469         */
470         template <typename Q>
471         bool find( Q const& key ) const
472         {
473             return bucket( key ).find( key );
474         }
475
476         /// Finds the key \p key using \p pred predicate for searching
477         /**
478             The function is an analog of \ref cds_intrusive_MichaelHashSet_rcu_find_val "find(Q const&)"
479             but \p pred is used for key comparing.
480             \p Less functor has the interface like \p std::less.
481             \p pred must imply the same element order as the comparator used for building the set.
482         */
483         template <typename Q, typename Less>
484         bool find_with( Q const& key, Less pred ) const
485         {
486             return bucket( key ).find_with( key, pred );
487         }
488
489         /// Find the key \p key
490         /** \anchor cds_intrusive_MichaelHashSet_rcu_find_func
491             The function searches the item with key equal to \p key and calls the functor \p f for item found.
492             The interface of \p Func functor is:
493             \code
494             struct functor {
495                 void operator()( value_type& item, Q& key );
496             };
497             \endcode
498             where \p item is the item found, \p key is the <tt>find</tt> function argument.
499
500             The functor can change non-key fields of \p item.
501             The functor does not serialize simultaneous access to the set \p item. If such access is
502             possible you must provide your own synchronization schema on item level to exclude unsafe item modifications.
503
504             The \p key argument is non-const since it can be used as \p f functor destination i.e., the functor
505             can modify both arguments.
506
507             Note the hash functor specified for class \p Traits template parameter
508             should accept a parameter of type \p Q that can be not the same as \p value_type.
509
510             The function returns \p true if \p key is found, \p false otherwise.
511         */
512         template <typename Q, typename Func>
513         bool find( Q& key, Func f ) const
514         {
515             return bucket( key ).find( key, f );
516         }
517
518         /// Finds the key \p key using \p pred predicate for searching
519         /**
520             The function is an analog of \ref cds_intrusive_MichaelHashSet_rcu_find_func "find(Q&, Func)"
521             but \p pred is used for key comparing.
522             \p Less functor has the interface like \p std::less.
523             \p pred must imply the same element order as the comparator used for building the set.
524         */
525         template <typename Q, typename Less, typename Func>
526         bool find_with( Q& key, Less pred, Func f ) const
527         {
528             return bucket( key ).find_with( key, pred, f );
529         }
530
531         /// Finds the key \p key and return the item found
532         /** \anchor cds_intrusive_MichaelHashSet_rcu_get
533             The function searches the item with key equal to \p key and returns the pointer to item found.
534             If \p key is not found it returns \p nullptr.
535
536             Note the compare functor should accept a parameter of type \p Q that can be not the same as \p value_type.
537
538             RCU should be locked before call of this function.
539             Returned item is valid only while RCU is locked:
540             \code
541             typedef cds::intrusive::MichaelHashSet< your_template_parameters > hash_set;
542             hash_set theSet;
543             // ...
544             {
545                 // Lock RCU
546                 hash_set::rcu_lock lock;
547
548                 foo * pVal = theSet.get( 5 );
549                 if ( pVal ) {
550                     // Deal with pVal
551                     //...
552                 }
553                 // Unlock RCU by rcu_lock destructor
554                 // pVal can be retired by disposer at any time after RCU has been unlocked
555             }
556             \endcode
557         */
558         template <typename Q>
559         value_type * get( Q const& key ) const
560         {
561             return bucket( key ).get( key );
562         }
563
564         /// Finds the key \p key and return the item found
565         /**
566             The function is an analog of \ref cds_intrusive_MichaelHashSet_rcu_get "get(Q const&)"
567             but \p pred is used for comparing the keys.
568
569             \p Less functor has the semantics like \p std::less but should take arguments of type \ref value_type and \p Q
570             in any order.
571             \p pred must imply the same element order as the comparator used for building the set.
572         */
573         template <typename Q, typename Less>
574         value_type * get_with( Q const& key, Less pred ) const
575         {
576             return bucket( key ).get_with( key, pred );
577         }
578
579         /// Clears the set (non-atomic)
580         /**
581             The function unlink all items from the set.
582             The function is not atomic. It cleans up each bucket and then resets the item counter to zero.
583             If there are a thread that performs insertion while \p clear is working the result is undefined in general case:
584             <tt> empty() </tt> may return \p true but the set may contain item(s).
585             Therefore, \p clear may be used only for debugging purposes.
586
587             For each item the \p disposer is called after unlinking.
588         */
589         void clear()
590         {
591             for ( size_t i = 0; i < bucket_count(); ++i )
592                 m_Buckets[i].clear();
593             m_ItemCounter.reset();
594         }
595
596
597         /// Checks if the set is empty
598         /**
599             Emptiness is checked by item counting: if item count is zero then the set is empty.
600             Thus, the correct item counting feature is an important part of Michael's set implementation.
601         */
602         bool empty() const
603         {
604             return size() == 0;
605         }
606
607         /// Returns item count in the set
608         size_t size() const
609         {
610             return m_ItemCounter;
611         }
612
613         /// Returns the size of hash table
614         /**
615             Since %MichaelHashSet cannot dynamically extend the hash table size,
616             the value returned is an constant depending on object initialization parameters;
617             see \ref cds_intrusive_MichaelHashSet_hp "MichaelHashSet" for explanation.
618         */
619         size_t bucket_count() const
620         {
621             return m_nHashBitmask + 1;
622         }
623
624     };
625
626 }} // namespace cds::intrusive
627
628 #endif // #ifndef __CDS_INTRUSIVE_MICHAEL_SET_NOGC_H
629