LowerBitSets: Use byte arrays instead of bit sets to represent in-memory bit sets.
authorPeter Collingbourne <peter@pcc.me.uk>
Tue, 3 Mar 2015 00:49:28 +0000 (00:49 +0000)
committerPeter Collingbourne <peter@pcc.me.uk>
Tue, 3 Mar 2015 00:49:28 +0000 (00:49 +0000)
commit27821d7200beedd84a46c989e653a509ac1f7f7b
treecbe5d7e7a317389373f244644317fa72762e6602
parentf89c6af16b1ba1d0a0b8290e90f08c8fcd5ad1eb
LowerBitSets: Use byte arrays instead of bit sets to represent in-memory bit sets.

By loading from indexed offsets into a byte array and applying a mask, a
program can test bits from the bit set with a relatively short instruction
sequence. For example, suppose we have 15 bit sets to lay out:

A (16 bits), B (15 bits), C (14 bits), D (13 bits), E (12 bits),
F (11 bits), G (10 bits), H (9 bits), I (7 bits), J (6 bits), K (5 bits),
L (4 bits), M (3 bits), N (2 bits), O (1 bit)

These bits can be laid out in a 16-byte array like this:

      Byte Offset
    0123456789ABCDEF
Bit
  7 HHHHHHHHHIIIIIII
  6 GGGGGGGGGGJJJJJJ
  5 FFFFFFFFFFFKKKKK
  4 EEEEEEEEEEEELLLL
  3 DDDDDDDDDDDDDMMM
  2 CCCCCCCCCCCCCCNN
  1 BBBBBBBBBBBBBBBO
  0 AAAAAAAAAAAAAAAA

For example, to test bit X of A, we evaluate ((bits[X] & 1) != 0), or to
test bit X of I, we evaluate ((bits[9 + X] & 0x80) != 0). This can be done
in 1-2 machine instructions on x86, or 4-6 instructions on ARM.

This uses the LPT multiprocessor scheduling algorithm to lay out the bits
efficiently.

Saves ~450KB of instructions in a recent build of Chromium.

Differential Revision: http://reviews.llvm.org/D7954

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@231043 91177308-0d34-0410-b5e6-96231b3b80d8
include/llvm/Transforms/IPO/LowerBitSets.h
lib/Transforms/IPO/LowerBitSets.cpp
test/Transforms/LowerBitSets/simple.ll
unittests/Transforms/IPO/LowerBitSets.cpp