cdcd525777a34cef04883be9747d657ce5362935
[folly.git] / folly / experimental / Instructions.h
1 /*
2  * Copyright 2015 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef FOLLY_EXPERIMENTAL_INSTRUCTIONS_H
18 #define FOLLY_EXPERIMENTAL_INSTRUCTIONS_H
19
20 #include <folly/CpuId.h>
21
22 namespace folly { namespace compression { namespace instructions {
23
24 // NOTE: It's recommended to compile EF coding with -msse4.2, starting
25 // with Nehalem, Intel CPUs support POPCNT instruction and gcc will emit
26 // it for __builtin_popcountll intrinsic.
27 // But we provide an alternative way for the client code: it can switch to
28 // the appropriate version of EliasFanoReader<> in realtime (client should
29 // implement this switching logic itself) by specifying instruction set to
30 // use explicitly.
31
32 struct Default {
33   static bool supported(const folly::CpuId& cpuId = {}) {
34     return true;
35   }
36   static inline uint64_t popcount(uint64_t value) {
37     return __builtin_popcountll(value);
38   }
39   static inline int ctz(uint64_t value) {
40     DCHECK_GT(value, 0);
41     return __builtin_ctzll(value);
42   }
43   static inline int clz(uint64_t value) {
44     DCHECK_GT(value, 0);
45     return __builtin_clzll(value);
46   }
47   static inline uint64_t blsr(uint64_t value) {
48     return value & (value - 1);
49   }
50 };
51
52 struct Nehalem : public Default {
53   static bool supported(const folly::CpuId& cpuId = {}) {
54     return cpuId.popcnt();
55   }
56   static inline uint64_t popcount(uint64_t value) {
57     // POPCNT is supported starting with Intel Nehalem, AMD K10.
58     uint64_t result;
59     asm ("popcntq %1, %0" : "=r" (result) : "r" (value));
60     return result;
61   }
62 };
63
64 struct Haswell : public Nehalem {
65   static bool supported(const folly::CpuId& cpuId = {}) {
66     return Nehalem::supported(cpuId) && cpuId.bmi1();
67   }
68   static inline uint64_t blsr(uint64_t value) {
69     // BMI1 is supported starting with Intel Haswell, AMD Piledriver.
70     // BLSR combines two instuctions into one and reduces register pressure.
71     uint64_t result;
72     asm ("blsrq %1, %0" : "=r" (result) : "r" (value));
73     return result;
74   }
75 };
76
77 }}}  // namespaces
78
79 #endif  // FOLLY_EXPERIMENTAL_INSTRUCTIONS_H