Use target-dependent emitLeading/TrailingFence instead of the target-independent...
authorRobin Morisset <morisset@google.com>
Wed, 3 Sep 2014 21:01:03 +0000 (21:01 +0000)
committerRobin Morisset <morisset@google.com>
Wed, 3 Sep 2014 21:01:03 +0000 (21:01 +0000)
commit4b2698cf19c9bb0f8079bbd5f66317cf4ff69856
tree8a3eeb92e26891330ed6e2faf80dc058358aaa49
parentecadea992afb933085a388edfa5d9d1a8832b969
Use target-dependent emitLeading/TrailingFence instead of the target-independent insertLeading/TrailingFence (in AtomicExpandPass)

Fixes two latent bugs:
- There was no fence inserted before expanded seq_cst load (unsound on Power)
- There was only a fence release before seq_cst stores (again unsound, in particular on Power)
    It is not even clear if this is correct on ARM swift processors (where release fences are
    DMB ishst instead of DMB ish). This behaviour is currently preserved on ARM Swift
    as it is not clear whether it is incorrect. I would love to get documentation stating
    whether it is correct or not.
These two bugs were not triggered because Power is not (yet) using this pass, and these
behaviours happen to be (mostly?) working on ARM
(although they completely butchered the semantics of the llvm IR).

See:
http://lists.cs.uiuc.edu/pipermail/llvmdev/2014-August/075821.html
for an example of the problems that can be caused by the second of these bugs.

I couldn't see a way of fixing these in a completely target-independent way without
adding lots of unnecessary fences on ARM, hence the target-dependent parts of this
patch.

This patch implements the new target-dependent parts only for ARM (the default
of not doing anything is enough for AArch64), other architectures will use this
infrastructure in later patches.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@217076 91177308-0d34-0410-b5e6-96231b3b80d8
lib/CodeGen/AtomicExpandPass.cpp
lib/Target/ARM/ARMISelLowering.cpp
lib/Target/ARM/ARMISelLowering.h
test/Transforms/AtomicExpand/ARM/atomic-expansion-v7.ll
test/Transforms/AtomicExpand/ARM/cmpxchg-weak.ll