6 years ago[Function] Clean up {prefix,prologue} data routines (NFC)
[Function] Clean up {prefix,prologue} data routines (NFC)

Factor out some common code used to get+set function prefix/prologue
data. This may come in handy if we ever decide to store personality
functions in the same way we store prefix/prologue data.

6 years ago[WinEH] Implement state numbering for CoreCLR
[WinEH] Implement state numbering for CoreCLR

Assign one state number per handler/funclet, tracking parent state,
handler type, and catch type token.
State numbers are arranged such that ancestors have lower state numbers
than their descendants.

6 years ago[WinEH] Recognize CoreCLR personality function
[WinEH] Recognize CoreCLR personality function

 - Add CoreCLR to if/else ladders and switches as appropriate.
 - Rename isMSVCEHPersonality to isFuncletEHPersonality to better
   reflect what it captures.

6 years ago[ARM] Minor refactoring to improve readability. NFC.
[ARM] Minor refactoring to improve readability. NFC.

6 years agoExtend known bits to understand @llvm.bswap
Extend known bits to understand @llvm.bswap

This is a cleaned up patch from the one written by John Regehr based on the findings of the Souper superoptimizer.

When writing tests, I was surprised to find that instsimplify apparently doesn't know how to collapse bit test sequences based purely on known bits. This required me to split my tests across both instsimplify and instcombine.

6 years agoFix pr25040 - Handle vectors of i1s in recently added implication code
Fix pr25040 - Handle vectors of i1s in recently added implication code

As mentioned in the bug, I'd missed the presence of a getScalarType in the caller of the new implies method. As a result, when we ended up with a implication over two vectors, we'd trip an assert and crash.

6 years agoIR: Use typedefs for getSublistAccess(), NFC
IR: Use typedefs for getSublistAccess(), NFC

6 years ago[Hexagon] Remove ZeroOrMore from option flags
[Hexagon] Remove ZeroOrMore from option flags

6 years ago[ARM] Simplify tests and make checks more rigid. NFC.
[ARM] Simplify tests and make checks more rigid. NFC.

6 years agoThis patch builds on top of D13378 to handle constant condition.
This patch builds on top of D13378 to handle constant condition.

With this patch, clang -O3 optimizes correctly providing > 1000x speedup on this artificial benchmark):

for (a=0; a<n; a++)
    for (b=0; b<n; b++)
        for (c=0; c<n; c++)
            for (d=0; d<n; d++)
                for (e=0; e<n; e++)
                    for (f=0; f<n; f++)
From test-suite/SingleSource/Benchmarks/Shootout/nestedloop.c

6 years agoAMDGPU/SI: Add 64-bit versions of v_nop and v_clrexcp
AMDGPU/SI: Add 64-bit versions of v_nop and v_clrexcp

The assembly printing of these is still missing the encoding size
suffix, but this will be fixed in a later commit.

6 years ago[Hexagon] Add an early if-conversion pass
[Hexagon] Add an early if-conversion pass

6 years ago[mips][microMIPS] Fix an issue with selecting sqrt instruction in LLVM backend
[mips][microMIPS] Fix an issue with selecting sqrt instruction in LLVM backend

This fixes 7 tests during fast LLVM test-suite run:
* MultiSource/Benchmarks/McCat/18-imp/imp
* MultiSource/Applications/oggenc/oggenc
* MultiSource/Benchmarks/MallocBench/gs/gs
* MultiSource/Benchmarks/MiBench/automotive-susan/automotive-susan
* MultiSource/Benchmarks/VersaBench/beamformer/beamformer
* MultiSource/Benchmarks/MiBench/consumer-lame/consumer-lame
* MultiSource/Benchmarks/Bullet/bullet

Error message was in the form of:
fatal error: error in backend: Cannot select: 0x95c3288: f32 = fsqrt 0x95c0190 [ORD=9] [ID=18]
  0x95c0190: f32 = fadd 0x95bef30, 0x95c4d00 [ORD=8] [ID=17]
    0x95bef30: f32 = fmul 0x95c4988, 0x95c4988 [ORD=5] [ID=16]

There was problem with selecting sqrt instruction in LLVM backend.

To fix the issue changes are made in TableGen definition for sqrt instruction in MipsInstrFPU.td and new test file sqrt.ll is added to LLVM regression tests.

6 years agoRevert r249123 - [mips][microMIPS] Fix an issue with selecting sqrt instruction in LLVM backend
Revert r249123 - [mips][microMIPS] Fix an issue with selecting sqrt instruction in LLVM backend

The author was not credited and most of the commit message is missing. Will re-commit with this fixed.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@249415 91177308-0d34-0410-b5e6-96231b3b80d8

6 years ago[EarlyCSE] Constify ParseMemoryInst methods (NFC).
[EarlyCSE] Constify ParseMemoryInst methods (NFC).

6 years agoMake sure the CastInst is valid before trying to create it
Make sure the CastInst is valid before trying to create it

Bug found with afl-fuzz.

6 years ago[InstCombine] Teach SimplifyDemandedVectorElts how to handle ConstantVector select masks with ConstantExpr elements (PR24922)
[InstCombine] Teach SimplifyDemandedVectorElts how to handle ConstantVector select masks with ConstantExpr elements (PR24922)

If the mask of a select instruction is a ConstantVector, method
SimplifyDemandedVectorElts iterates over the mask elements to identify which
values are selected from the select inputs.

Before this patch, method SimplifyDemandedVectorElts always used method
Constant::isNullValue() to check if a value in the mask was zero. Unfortunately
that method always returns false when called on a ConstantExpr.

This patch fixes the problem in SimplifyDemandedVectorElts by adding an explicit
check for ConstantExpr values. Now, if a value in the mask is a ConstantExpr, we
avoid calling isNullValue() on it.

Fixes PR24922.

6 years ago[mips][disassembler] Changed CHECK-EB directives to CHECK so div/divu are tested.
[mips][disassembler] Changed CHECK-EB directives to CHECK so div/divu are tested.

6 years ago[mips][disassembler] Merged disassembler tests into the corresponding ISA/ASE subdirectories.
[mips][disassembler] Merged disassembler tests into the corresponding ISA/ASE subdirectories.

6 years ago[mips][disassembler] Moved DSP tests into proper place and corrected formatting.
[mips][disassembler] Moved DSP tests into proper place and corrected formatting.

6 years ago[TwoAddressInstructionPass] When looking for a 3 addr conversion after commuting...
[TwoAddressInstructionPass] When looking for a 3 addr conversion after commuting, make sure regB has been updated to take into account the commute.

6 years ago[bpf] Avoid extra pointer arithmetic for stack access
[bpf] Avoid extra pointer arithmetic for stack access

For the program like below
struct key_t {
  int pid;
  char name[16];
extern void test1(char *);
int test() {
  struct key_t key = {};
  return 0;
For key.name, the llc/bpf may generate the below code:
  R1 = R10  // R10 is the frame pointer
  R1 += -24 // framepointer adjustment
  R1 |= 4   // R1 is then used as the first parameter of test1
OR operation is not recognized by in-kernel verifier.

This patch introduces an intermediate FI_ri instruction and
generates the following code that can be properly verified:
  R1 = R10
  R1 += -20

6 years ago[X86] Teach constant hoisting that ANDs with 64-bit immediates in the range 0x8000000...
[X86] Teach constant hoisting that ANDs with 64-bit immediates in the range 0x80000000-0xffffffff can be handled cheaply and don't need to be hoisted.

Most importantly, this keeps constant hoisting from preventing instruction selections ability to turn an AND with 0xffffffff into a move into a 32-bit subregister.

6 years ago[X86] Remove unnecessary AddComplexity directive. The instruction is already wrapped in the equivalent earlier. NFC
[X86] Remove unnecessary AddComplexity directive. The instruction is already wrapped in the equivalent earlier. NFC

7 years ago[WebAssembly] Switch to a more traditional assembly syntax
[WebAssembly] Switch to a more traditional assembly syntax

This new syntax is built around putting each instruction on its own line
in a "mnemonic op, op, op" like syntax. It also uses conventional data
section directives like ".byte" and so on rather than requiring everything
to be in hierarchical S-expression format. This is a more natural syntax
for a ".s" file format from the perspective of LLVM MC and related tools,
while remaining easy to translate into other forms as needed.

7 years agodsymutil: Don't prune forward declarations inside of an imported TAG_module
dsymutil: Don't prune forward declarations inside of an imported TAG_module
if there exists not definition for the type.
For this to work, we need to clone the imported modules before building
the decl context chains of the DIEs in the non-skeleton CUs.

7 years agoMove helper classes into an anonymous namespace. NFC.
Move helper classes into an anonymous namespace. NFC.

7 years agoRemove AutoFDO profile handling for GCC's LIPO. NFC.
Remove AutoFDO profile handling for GCC's LIPO. NFC.

Given the work we are doing on ThinLTO, we will never need to support
module groups and working sets in GCC's implementation of LIPO. These
are currently dead code, and will continue to be so.

7 years ago[WinEH] Update CATCHRET's operand to match its successor
[WinEH] Update CATCHRET's operand to match its successor

The CATCHRET operand did not match the MachineFunction's CFG.  This
mismatch happened because FrameLowering created a new MachineBasicBlock
and updated the CFG but forgot to update the CATCHRET operand.

Let's make sure this doesn't happen again by strengthing the funclet
membership analysis: it can now reason about the membership of all basic
blocks, not just those inside of funclets.

7 years agoSimplify code. No functionality change.
Simplify code. No functionality change.

7 years agoReleaseNotes: note the new Windows version requirement
ReleaseNotes: note the new Windows version requirement

7 years ago[msan] Correct a typo in poison stack pattern command line description.
[msan] Correct a typo in poison stack pattern command line description.

Patch by Jon Eyolfson.

7 years agoAMDGPU/SI: Add a helper for creating aliases for the _e32 instructions
AMDGPU/SI: Add a helper for creating aliases for the _e32 instructions

We are currently only using these aliases for VOPC instructions,
but this helper will make it easier to use them everywhere.

These aliases allow for the automatic matching of instructions
with forced 32-bit encoding.  Eventually, we should be able to remove
the custom C++ logic we have for this in the assembler.

7 years agoMergeFunctions: Clear GlobalNumbers ValueMap
MergeFunctions: Clear GlobalNumbers ValueMap

Otherwise, the map will observe changes as long as MergeFunctions is alive. This
is bad because follow-up passes could replace-all-uses-with on the key of an
entry in the map. The value handle callback of ValueMap however asserts that the
key type matches.


7 years ago[ARM] Modify codegen for memcpy intrinsic to prefer LDM/STM.
[ARM] Modify codegen for memcpy intrinsic to prefer LDM/STM.

We were previously codegen'ing memcpy as regular load/store operations and
hoping that the register allocator would allocate registers in ascending order
so that we could apply an LDM/STM combine after register allocation. According
to the commit that first introduced this code (r37179), we planned to teach the
register allocator to allocate the registers in ascending order. This never got
implemented, and up to now we've been stuck with very poor codegen.

A much simpler approach for achieving better codegen is to create MEMCPY pseudo
instructions, attach scratch virtual registers to them and then, post register
allocation, expand the MEMCPYs into LDM/STM pairs using the scratch registers.
The register allocator will have picked arbitrary registers which we sort when
expanding the MEMCPY. This approach also avoids the need to repeatedly calculate
offsets which ultimately ought to be eliminated pre-RA in order to decrease
register pressure.

Fixes PR9199 and PR23768.

[This is based on Peter Collingbourne's r238473 which was reverted.]

7 years agoMake test resilient against windows path separators.
Make test resilient against windows path separators.

7 years ago[mips][microMIPS] Implement JALRC16, JRCADDIUSP and JRC16 instructions
[mips][microMIPS] Implement JALRC16, JRCADDIUSP and JRC16 instructions
7 years ago[MC layer][AArch64] llvm-mc accepts 4-bit immediate values for
[MC layer][AArch64] llvm-mc accepts 4-bit immediate values for
"msr pan, #imm", while only 1-bit immediate values should be valid.
Changed encoding and decoding for msr pstate instructions.

7 years ago[mips] Changed the way symbols are handled in dla and la instructions to allow simple expressions.
[mips] Changed the way symbols are handled in dla and la instructions to allow simple expressions.

An instruction like "(d)la $5, symbol+8" previously would have crashed the
assembler as it contains an expression. This is now fixed.
A few tests cases have also been changed to reflect these changes, however
these should only be syntax changes. Some new test cases have also been

7 years ago[Support] Add a version of fs::make_absolute with a custom CWD.
[Support] Add a version of fs::make_absolute with a custom CWD.

This will be used soon from clang.

7 years agoAdded missing test for [ARM] AttributeParser. Check that build attribute
Added missing test for [ARM] AttributeParser. Check that build attribute
Tag_Advanced_SIMD_arch is set correctly when targeting v8.1-a NEON.

7 years agoFix pr24486.
Fix pr24486.

This extends the work done in r233995 so that now getFragment (in addition to
getSection) also works for variable symbols.

With that the existing logic to decide if a-b can be computed works even if
a or b are variables. Given that, the expression evaluation can avoid expanding
variables as aggressively and that in turn lets the relocation code see the
original variable.

In order for this to work with the asm streamer, there is now a dummy fragment
per section. It is used to assign a section to a symbol when no other fragment

7 years agoReformat partially.
Reformat partially.

7 years agoReformat 3 files in llvm/include/llvm/CodeGen/.
Reformat 3 files in llvm/include/llvm/CodeGen/.

7 years agoTrailing whitespaces.
Trailing whitespaces.

7 years agoPrune trailing whitespaces in comment lines.
Prune trailing whitespaces in comment lines.

7 years agoReformat blank lines.
Reformat blank lines.

7 years ago[SelectionDAGBuilder] Remove dead code
[SelectionDAGBuilder] Remove dead code

We already check for LandingPadInst two lines above.

7 years agoRemove unused private field introduced by r249270.
Remove unused private field introduced by r249270.

7 years agoSupport for function summary index bitcode sections and files.
Support for function summary index bitcode sections and files.

The bitcode format is described in this document:
For more info on ThinLTO see:

The first customer is ThinLTO, however the data structures are designed
and named more generally based on prior feedback. There are a few
comments regarding how certain interfaces are used by ThinLTO, and the
options added here to gold currently have ThinLTO-specific names as the
behavior they provoke is currently ThinLTO-specific.

This patch includes support for generating per-module function indexes,
the combined index file via the gold plugin, and several tests
(more are included with the associated clang patch D11908).

7 years ago[X86][SSE4A] Added shuffle decode tests for 'special case' SSE4A EXTRQI/INSERTQI ops.
[X86][SSE4A] Added shuffle decode tests for 'special case' SSE4A EXTRQI/INSERTQI ops.

7 years ago[SPARCv9] Add support for the rdpr/wrpr instructions.
[SPARCv9] Add support for the rdpr/wrpr instructions.

7 years agoAVX512: Implemented encoding and intrinsics for VPERMILPS/PD instructions.
AVX512: Implemented encoding and intrinsics for VPERMILPS/PD instructions.
Added tests for intrinsics and encoding.

7 years ago[WinEH] Permit branch folding in the face of funclets
[WinEH] Permit branch folding in the face of funclets

Track which basic blocks belong to which funclets.  Permit branch
folding to fire but only if it can prove that doing so will not cause
code in one funclet to be reused in another.

7 years agoFix typo in README
Fix typo in README

7 years ago[DAGCombiner] Generalize FADD constant combines to work with vectors
[DAGCombiner] Generalize FADD constant combines to work with vectors

Updated the FADD combines to work with vectors as well as scalars.

7 years agoadd test cases that demonstrate bad behavior
add test cases that demonstrate bad behavior

These are based on PR25016 and likely caused by a bug in
MachineCombiner's definition of improvesCriticalPathLen().

7 years agoinclude equal sign in debug equations; NFC
include equal sign in debug equations; NFC

7 years ago[llvm-size] Attempt to fix a test failure on Windows.
[llvm-size] Attempt to fix a test failure on Windows.

7 years ago[llvm-size] Fix time to check if time of use bug.
[llvm-size] Fix time to check if time of use bug.

This was the last tool relying on this pattern.

7 years ago[X86] Lower SEXTLOAD using SIGN_EXTEND_VECTOR_INREG. NCI.
The custom lowering in LowerExtendedLoad is doing the equivalent shuffle, so make use of existing lowering code to reduce duplication.

7 years agoRemove unnecessary includes.
Remove unnecessary includes.

7 years agoMove registerSection out of line and reduce #includes. NFC.
Move registerSection out of line and reduce #includes. NFC.

7 years ago[X86][SSE] Add FADD combine tests.
[X86][SSE] Add FADD combine tests.

7 years ago[DAGCombiner] Merge SIGN_EXTEND_INREG vector constant folding methods. NCI.
[DAGCombiner] Merge SIGN_EXTEND_INREG vector constant folding methods. NCI.

visitSIGN_EXTEND_INREG calls SelectionDAG::getNode to constant fold scalar constants but handles vector constants itself, despite getNode being capable of dealing with them.

This required a minor change to the getNode implementation to actually deal with cases where the scalars of a BUILD_VECTOR were wider integers than the vector type - which was the only extra ability of the visitSIGN_EXTEND_INREG implementation.

No codegen intended and all existing tests remain the same.

7 years ago[libFuzzer] trying to fix at-exit hang
[libFuzzer] trying to fix at-exit hang

7 years ago[WebAssembly] Implement the remaining conversion operations.
[WebAssembly] Implement the remaining conversion operations.

This is a temporary assembly syntax that will likely evolve along with
broader upcoming syntax changes.

7 years agoUse early return. NFC.
Use early return. NFC.

7 years agoTry to appease MSVC, NFCI.
Try to appease MSVC, NFCI.

This time by lifting the lambda's in `createNodeFromSelectLikePHI` to
the file scope.  Looks like there are differences in capture rules
between clang and MSVC?

7 years agoAMDGPU/SI: Remove unused tablegen multiclass
AMDGPU/SI: Remove unused tablegen multiclass

7 years agoDisallow assigning symbol a null section.
Disallow assigning symbol a null section.

They are constructed without one and they can't go back, so this was
effectively dead code.

7 years agoTry to appease the MSVC bots, NFCI.
Try to appease the MSVC bots, NFCI.

7 years ago[WebAssembly] Rename setlocal to set_local to match the spec.
[WebAssembly] Rename setlocal to set_local to match the spec.

7 years ago[WebAssembly] Update this test for the new loop scheme.
[WebAssembly] Update this test for the new loop scheme.

7 years agoTry to appease the MSVC bots, NFC.
Try to appease the MSVC bots, NFC.

7 years ago[libFuzzer] make LLVMFuzzerTestOneInput (the fuzzer target function) return int inste...
[libFuzzer] make LLVMFuzzerTestOneInput (the fuzzer target function) return int instead of void. The actual return value is not *yet* used (and expected to be 0). This change is API breaking, so the fuzzers will need to be updated.

7 years agoFix comment ASCII art to unbreak the gcc 4.9.1 build
Fix comment ASCII art to unbreak the gcc 4.9.1 build

The trailing backslashes in some ASCII art added in r248527 cause a
"error: multi-line comment [-Werror=comment]" when building with gcc
4.9.1 -Wall.  Swallow (ASCII-)artistic integrity and use pipes instead.

7 years ago[SCEV] Recognize simple br-phi patterns
[SCEV] Recognize simple br-phi patterns

Teach SCEV to match patterns like

  br %cond, label %left, label %right
  br label %merge
  br label %merge
  V = phi [ %x, %left ], [ %y, %right ]

as "select %cond, %x, %y".  Before this SCEV would match PHI nodes
exclusively to add recurrences.

This addresses PR25005.

7 years ago[CMake] We need to explicitly add llvm-config before clang so that LLVM_BUILD_EXTERNAL_COMPILER_RT can depend on llvm-config.
[CMake] We need to explicitly add llvm-config before clang so that LLVM_BUILD_EXTERNAL_COMPILER_RT can depend on llvm-config.

This patch is a required stepping stone to fix PR14109.

7 years agoinariant.group handling in GVN
inariant.group handling in GVN

The most important part required to make clang
devirtualization works ( ͡°͜ʖ ͡°).
The code is able to find non local dependencies, but unfortunatelly
because the caller can only handle local dependencies, I had to add
some restrictions to look for dependencies only in the same BB.


7 years ago[libFuzzer] remove experimental flag and functionality
[libFuzzer] remove experimental flag and functionality

7 years ago[WebAssembly] Fix CFG stackification of nested loops.
[WebAssembly] Fix CFG stackification of nested loops.

7 years ago[WebAssembly] Support calls marked as "tail", fastcc, and coldcc.
[WebAssembly] Support calls marked as "tail", fastcc, and coldcc.

7 years agoCall the correct overload.
Call the correct overload.

Call the correct overload so a string literal does not get converted to a bool.
Also fix the test case to match the names given.

7 years ago[libFuzzer] add a flag -max_total_time
[libFuzzer] add a flag -max_total_time

7 years ago[WebAssembly] Add a resize_memory intrinsic.
[WebAssembly] Add a resize_memory intrinsic.

7 years ago[SCEV] Refactor out a createNodeForSelect
[SCEV] Refactor out a createNodeForSelect

We will shortly re-use this for select-like br-phi pairs.

Reviewers: atrick, joker-eph, joker.eph

Subscribers: sanjoy, llvm-commits

7 years ago[Tests] Add one more case to LoopUnroll/pr18861.ll for better coverage.
[Tests] Add one more case to LoopUnroll/pr18861.ll for better coverage.

7 years ago[Tests] Give meaningful names to blocks in LoopUnroll/pr18861.ll, add a description...
[Tests] Give meaningful names to blocks in LoopUnroll/pr18861.ll, add a description of what's going on.

7 years ago[Tests] Slightly reduce test LoopUnroll/pr18861.ll.
[Tests] Slightly reduce test LoopUnroll/pr18861.ll.

7 years ago[WebAssembly] Add a memory_size intrinsic.
[WebAssembly] Add a memory_size intrinsic.

7 years agoAMDGPU/SI: Add verifier check for exec reads
AMDGPU/SI: Add verifier check for exec reads

Make sure we aren't accidentally not setting
these in the instruction definitions.

7 years agoAdd way to test for generic TargetOpcodes
Add way to test for generic TargetOpcodes

The alternative would be to add a bit to the target's
InstrFlags but that seems like a waste of a bit.

7 years ago[SCEV] Try to prove predicates by splitting them
[SCEV] Try to prove predicates by splitting them

This change teaches SCEV that to prove `A u< B` it is sufficient to
prove each of these facts individually:

 - B >= 0
 - A s< B
 - A >= 0

In practice, SCEV sometimes finds it easier to prove these facts
individually than to prove `A u< B` as one atomic step.

Reviewers: reames, atrick, nlewycky, hfinkel

7 years agoActually switch the arch when we see .arch. PR21695
Actually switch the arch when we see .arch. PR21695

7 years agoARM: diagnose invalid local fixups on Thumb1
ARM: diagnose invalid local fixups on Thumb1

We previously stopped producing Thumb2 relaxations when they weren't supported,
but only diagnosed the case where an actual relocation was produced. We should
also tell people if local symbols aren't going to work rather than silently

7 years agoARM: correctly align constant pool value on Thumb1 targets.
ARM: correctly align constant pool value on Thumb1 targets.

Since we're using tLDRpci to access it, the constant pool's address must be 0
(mod 4).

7 years ago[lit] Raise the default soft process limit when possible
[lit] Raise the default soft process limit when possible

It is common to have a default soft process limit, at least on some families of
Linux distributions, of 1024. This is normally more than enough, but if you
have many cores, and you're running tests that create many threads, this can
become a problem. My POWER7 development machine has 48 cores, and when running
the lld regression tests, which often want to create up to 48 threads, I run
into problems. lit, by default, will want to run 48 tests in parallel, and
48*48 < 1024, and so many tests fail like this:

terminate called after throwing an instance of 'std::system_error'

what():  Resource temporarily unavailable
or lit fails like this when launching a test:

OSError: [Errno 11] Resource temporarily unavailable

lit can easily detect this situation and attempt to repair it before launching
tests (by raising the soft process limit to something that will allow ncpus^2
threads to be created), and should do so to prevent spurious test failures.

This is the follow-up to this thread:

7 years ago[ARM] Typo. NFC.
[ARM] Typo. NFC.

7 years agoReapply r249121 : "[FastISel][x86] Teach how to select SSE2/AVX bitcasts between...
Reapply r249121 : "[FastISel][x86] Teach how to select SSE2/AVX bitcasts between 128/256-bit vector types."

This patch teaches FastIsel the following two things:
1) On SSE2, no instructions are needed for bitcasts between 128-bit vector types;
2) On AVX, no instructions are needed for bitcasts between 256-bit vector types.


  %1 = bitcast <4 x i31> %V to <2 x i64>

Before (-fast-isel -fast-isel-abort=1):

  FastIsel miss: %1 = bitcast <4 x i31> %V to <2 x i64>

Now we don't fall back to SelectionDAG and we correctly fold that computation
propagating the register associated to %V.

Originally reviewed here: http://reviews.llvm.org/D13347

