block: improve rq_affinity placement
authorShaohua Li <shaohua.li@intel.com>
Thu, 11 Aug 2011 08:39:04 +0000 (10:39 +0200)
committerJens Axboe <jaxboe@fusionio.com>
Thu, 11 Aug 2011 08:39:04 +0000 (10:39 +0200)
commitbcf30e75b773b60379338768677a1301ef602ff9
tree2e3e657fe4c5bbf65ffb16198e4a416429c8c173
parentc09c47caedc9854d59378d6e34c989e51cfdd2b4
block: improve rq_affinity placement

This patch reverts commit 35ae66e0a09ab70ed(block: Make rq_affinity = 1
work as expected). The purpose is to avoid an unnecessary IPI.
Let's take an example. My test box has cpu 0-7, one socket. Say request is
added from CPU 1, blk_complete_request() occurs at CPU 7. Without the reverted
patch, softirq will be done at CPU 7. With it, an IPI will be directed to CPU
0, and softirq will be done at CPU 0. In this case, doing softirq at CPU 0 and
CPU 7 have no difference from cache sharing point view and we can avoid an
ipi if doing it in CPU 7.
An immediate concern is this is just like QUEUE_FLAG_SAME_FORCE, but actually
not. blk_complete_request() is running in interrupt handler, and currently
I/O controller doesn't support multiple interrupts (I checked several LSI
cards and AHCI), so only one CPU can run blk_complete_request(). This is
still quite different as QUEUE_FLAG_SAME_FORCE.
Since only one CPU runs softirq, the only difference with below patch is
softirq not always runs at the first CPU of a group.

Signed-off-by: Shaohua Li <shaohua.li@intel.com>
Signed-off-by: Jens Axboe <jaxboe@fusionio.com>
block/blk-softirq.c