7 years ago[DivergenceAnalysis] Separated definition of class into header.
[DivergenceAnalysis] Separated definition of class into header.

The definition of the DivergenceAnalysis pass was in a CPP
file and wasn't accessible to users of the analysis to get it
through "getAnalysis<>()".
This patch extracts the definition into a separate header that
can be used by users of the analysis to fetch the results.

Patch by Volkan Keles (vkeles@apple.com)

7 years agoSelectionDAG: Use InsertNode for EntryNode
SelectionDAG: Use InsertNode for EntryNode

This fixes problems where two nodes have persistent debug id 0 assigned.

7 years ago[FunctionAttrs] Extract a helper function for the core logic used to
[FunctionAttrs] Extract a helper function for the core logic used to
evaluate whether 'readonly' or 'readnone' apply to a given function.
This both reduces indentation and will make it easy to share the logic
with a new pass manager implementation.

7 years ago[SystemZ] Fix expansion of ISD::FPOW and ISD::FSINCOS
[SystemZ] Fix expansion of ISD::FPOW and ISD::FSINCOS

The ISD::FPOW and ISD::FSINCOS opcodes default to Legal, but there
is no legal instruction for those on SystemZ.  This could cause
LLVM internal errors.  Fixed by setting the operation action to
Expand for those opcodes.

Also added test cases for all other LLVM IR intrinsics that should
generate a library call.  (Those already work correctly since the
default operation action is fine.)

7 years agoRevert "[ARM] Handle +t2dsp feature as an ArchExtKind in ARMTargetParser.def"
Revert "[ARM] Handle +t2dsp feature as an ArchExtKind in ARMTargetParser.def"

This was committed without the code review (http://reviews.llvm.org/D12937) being approved.

This reverts commit r248152.

7 years agoAMDGPU: Move copy handling under switch like other instructions
AMDGPU: Move copy handling under switch like other instructions

7 years agoadd ShouldChangeType() variant that takes bitwidths
add ShouldChangeType() variant that takes bitwidths

This is more efficient for cases like D12965 where we already have widths.

7 years agoDAGCombiner: Replace store of FP constant after attemping store merges
DAGCombiner: Replace store of FP constant after attemping store merges

If storing multiple FP constants, some subset of the stores
would be replaced with integers due to visit order, so
MergeConsecutiveStores would only partially merge

7 years agoFactor replacement of stores of FP constants into new function
Factor replacement of stores of FP constants into new function

7 years agoFix missing C++ mode comment
Fix missing C++ mode comment

7 years agodon't repeat function names in comments; NFC
don't repeat function names in comments; NFC

7 years ago[Machine Combiner] Refactor machine reassociation code to be target-independent.
[Machine Combiner] Refactor machine reassociation code to be target-independent.

No functional change intended.
Patch by Haicheng Wu <haicheng@codeaurora.org>!


7 years ago[ARM] Handle +t2dsp feature as an ArchExtKind in ARMTargetParser.def
[ARM] Handle +t2dsp feature as an ArchExtKind in ARMTargetParser.def

Currently, the availability of DSP instructions (ACLE 6.4.7) is handled in a
hand-rolled tricky condition block in tools/clang/lib/Basic/Targets.cpp, with
a FIXME: attached.

This patch changes the handling of +t2dsp to be in line with other
architecture extensions.

Following review comments, also updating the description of FeatureDSPThumb2
in ARM.td.

Differential Revision: http://reviews.llvm.org/D12937

7 years ago[X86][AVX512] add masked version for RSQRT14 & RCP14 Scalar FP
[X86][AVX512] add masked version for RSQRT14 & RCP14 Scalar FP

Differential Revision: http://reviews.llvm.org/D12524

7 years ago[mips] Allow constant expressions in second argument of .cpsetup.
[mips] Allow constant expressions in second argument of .cpsetup.

Also tightened up the test and made a trivial fix to prevent double-newline
after emitting .cpsetup directives.

Reviewers: vkalintiris

Subscribers: seanbruno, emaste, llvm-commits

Differential Revision: http://reviews.llvm.org/D12956

7 years agoUse makeArrayRef or None to avoid unnecessarily mentioning the ArrayRef type extra...
Use makeArrayRef or None to avoid unnecessarily mentioning the ArrayRef type extra times. NFC

7 years agoDon't pass StringRefs around by const reference. Pass by value instead per coding...
Don't pass StringRefs around by const reference. Pass by value instead per coding standards. NFC

7 years agoCleanup places that passed SMLoc by const reference to pass it by value instead. NFC
Cleanup places that passed SMLoc by const reference to pass it by value instead. NFC

7 years ago[IndVars] Use C++11 style field initialization; NFCI.
[IndVars] Use C++11 style field initialization; NFCI.

7 years ago[IndVars] Don't add a level of indentation for namespace {. NFC.
[IndVars] Don't add a level of indentation for namespace {. NFC.

Whitespace-only change.

7 years agoadd test file ahead of any functional changes for PR22428
add test file ahead of any functional changes for PR22428

7 years ago[X86][SSE] Intrinsics builtins test refresh. NFCI
[X86][SSE] Intrinsics builtins test refresh. NFCI

7 years agoAVX512: Implemented encoding and intrinsics for vcmpss/sd.
AVX512: Implemented encoding and intrinsics for vcmpss/sd.
Added tests for intrinsics and encoding.

Differential Revision: http://reviews.llvm.org/D12593

7 years ago[X86][AVX512] extend support in Scalar conversion
[X86][AVX512] extend support in Scalar conversion
add scalar FP to Int conversion with truncation intrinsics
add scalar conversion FP32 from/to FP64 intrinsics
add rounding mode and SAE mode encoding for these intrinsics

Differential Revision: http://reviews.llvm.org/D12665

7 years agoAVX512: vsqrtss/sd encoding and intrinsics implementation.
AVX512: vsqrtss/sd encoding and intrinsics implementation.
Added tests for intrinsics and encoding.

Differential Revision: http://reviews.llvm.org/D12102

7 years ago[X86][AVX512DQ] Add fpclass instruction
[X86][AVX512DQ] Add fpclass instruction

Differential Revision: http://reviews.llvm.org/D12931

7 years ago[X86] Fix sitofp and uitofp instruction matching failures with long double and avx512
[X86] Fix sitofp and uitofp instruction matching failures with long double and avx512

The operation action for i32 and i64 cannot be set to legal, as long double
needs custom lowering.

Patch by: mitch.l.bodart@intel.com
Differential Revision: http://reviews.llvm.org/D12372

7 years agoAVX512: Implemented intrinsics for vshuff32x4, vshuff64x2, vshufi64x2, vshufi32x4
AVX512: Implemented intrinsics for vshuff32x4, vshuff64x2, vshufi64x2, vshufi32x4
Added tests for intrinsics.

Differential Revision: http://reviews.llvm.org/D12525

7 years ago[IndVars] Don't repeat function names in comment; NFC.
[IndVars] Don't repeat function names in comment; NFC.

Only changes comments.

7 years agoAVX512: Implement instructions encoding, lowering and intrinsics
AVX512: Implement instructions encoding, lowering and intrinsics
   vinserti64x4, vinserti64x2, vinserti32x8, vinserti32x4, vinsertf64x4, vinsertf64x2, vinsertf32x8, vinsertf32x4
Added tests for encoding, lowering and intrinsics.

Differential Revision: http://reviews.llvm.org/D11893

7 years agoARM: cleanup formatting
ARM: cleanup formatting

clang-format a line which was poorly formatted.  NFC.

7 years ago[IndVars] Fix a bug in r248045.
[IndVars] Fix a bug in r248045.

Because -indvars widens induction variables through arithmetic,
`NeverNegative` cannot be a property of the `WidenIV` (a `WidenIV`
manages information for all transitive uses of an IV being widened,
including uses of `-1 * IV`).  Instead it must live on `NarrowIVDefUse`
which manages information for a specific def-use edge in the transitive
use list of an induction variable.

This change also adds a test case that demonstrates the problem with

7 years agoFixup r248096, commit the *correct* test.
Fixup r248096, commit the *correct* test.

7 years ago[obj2yaml] Fix "time of check to time of use" bug. Add a test.
[obj2yaml] Fix "time of check to time of use" bug. Add a test.

7 years ago[X86][AVX2] Use general sext IR for vpmovsx stack folding tests
[X86][AVX2] Use general sext IR for vpmovsx stack folding tests

7 years ago[X86][SSE] Vectorize CTTZ + CTTZ_ZERO_UNDEF
Now that we have fast vector CTPOP implementations we can use this to speed up vector CTTZ using the pattern (cttz(x) = ctpop((x & -x) - 1))

Additionally, for AVX512CD that provides lzcnt instructions we can use the pattern (cttz_undef(x) = (width - 1) - ctlz(x & -x))

Differential Revision: http://reviews.llvm.org/D12663

7 years ago[InstCombine] Use SimplifyDemandedVectorEltsLow helper function. NFCI.
[InstCombine] Use SimplifyDemandedVectorEltsLow helper function. NFCI.

Use the SimplifyDemandedVectorEltsLow helper function introduced in D12680.

7 years ago[CMake] Update LLVM_TEST_DEPENDS not to use macho-dump. It has been unused since...
[CMake] Update LLVM_TEST_DEPENDS not to use macho-dump. It has been unused since r247235.

7 years agoAMDGPU: Remove dead code
AMDGPU: Remove dead code

getCFGStructurizerRegClass is not used for SI, so
move it into R600 specific stuff.

7 years agoNFC: Fix indentation and add braces to clarify nested of else-statement.
NFC: Fix indentation and add braces to clarify nested of else-statement.

7 years ago[PrologEpilogInserter] Minor refactoring.
[PrologEpilogInserter] Minor refactoring.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@248084 91177308-0d34-0410-b5e6-96231b3b80d8

7 years agoTest commit. Fix comment. NFC.
Test commit. Fix comment. NFC.

7 years ago[InstCombine] FoldICmpCstShrCst failed for ashr when comparing against -1
[InstCombine] FoldICmpCstShrCst failed for ashr when comparing against -1

(icmp eq (ashr C1, %V) -1) may have multiple answers if C1 is not a
power of two and has the sign bit set.

This fixes PR24873.

7 years ago[InstCombine] FoldICmpCstShrCst didn't handle icmps of -1 in the ashr case correctly
[InstCombine] FoldICmpCstShrCst didn't handle icmps of -1 in the ashr case correctly

7 years agoAMDGPU: Add failing testcase for live interval construction
AMDGPU: Add failing testcase for live interval construction

7 years ago[IndVars] Widen more comparisons for non-negative induction vars
[IndVars] Widen more comparisons for non-negative induction vars

If an induction variable is provably non-negative, its sign extension is
equal to its zero extension.  This means narrow uses like

  icmp slt iNarrow %indvar, %rhs

can be widened into

  icmp slt iWide zext(%indvar), sext(%rhs)

Reviewers: atrick, mcrosier, hfinkel

Subscribers: hfinkel, reames, llvm-commits

Differential Revision: http://reviews.llvm.org/D12745

7 years agoFix typo and test commit
Fix typo and test commit

7 years agoThis code never uses r_addend, so it can just use Elf_Rel.
This code never uses r_addend, so it can just use Elf_Rel.

7 years ago[CMake] Adding ALWAYS_GENERATE option to symlink utility functions.
[CMake] Adding ALWAYS_GENERATE option to symlink utility functions.

This implements the behavior required for clang symlinks which should be always generated.

7 years ago[Object/ELF] Change comment to reflect reality.
[Object/ELF] Change comment to reflect reality.

7 years agoUpdate edge weights properly when merging blocks in if-conversion.
Update edge weights properly when merging blocks in if-conversion.

In if-conversion, there is a utility function MergeBlocks() that is used to merge blocks. However, when new edges are built in this function the edge weight is either not provided or not updated properly, leading to a modified CFG with incorrect edge weights. This patch corrects this issue.

Differential Revision: http://reviews.llvm.org/D12513

7 years agoLimit the range of processors supported by ARM fast isel to v6 or
Limit the range of processors supported by ARM fast isel to v6 or
later as that's all that is tested right now.

Fixes PR24858.

7 years agoRemove couple of new Bitcode enum vals that snuck in via r247927 (NFC)
Remove couple of new Bitcode enum vals that snuck in via r247927 (NFC)

These are meant to be part of the follow on patch I am sending for
review shortly.

7 years agoClean up: Refactoring the hardcoded value of 6 for FindAvailableLoadedValue()'s param...
Clean up: Refactoring the hardcoded value of 6 for FindAvailableLoadedValue()'s parameter MaxInstsToScan. (Complete version of r247497. See D12886)

7 years agoMake MachineScheduler debug output less confusing.
Make MachineScheduler debug output less confusing.

At least...a little bit.

7 years agoScaling up values in ARMBaseInstrInfo::isProfitableToIfCvt() before they are scaled...
Scaling up values in ARMBaseInstrInfo::isProfitableToIfCvt() before they are scaled by a probability to avoid precision issue.

In ARMBaseInstrInfo::isProfitableToIfCvt(), there is a simple cost model in which the number of cycles is scaled by a probability to estimate the cost. However, when the number of cycles is small (which is usually the case), there is a precision issue after the computation. To avoid this issue, this patch scales those cycles by 1024 (chosen to make the multiplication a litter faster) before they are scaled by the probability. Other variables are also scaled up for the final comparison.

Differential Revision: http://reviews.llvm.org/D12742

7 years agoSelectionDAGDumper: Leave out the <multiple use> markers
SelectionDAGDumper: Leave out the <multiple use> markers

They mostly clutter the output while it is still possible to see which
node has multiple users without them.

Differential Revision: http://reviews.llvm.org/D12569

7 years agoSelectionDAGDumper: Avoid unnecessary newlines
SelectionDAGDumper: Avoid unnecessary newlines

  t0 = EntryToken:ch

    t0: <multiple use>
        t0: <multiple use>
      t1 = CopyFromReg:v4f32,ch t0, Register:v4f32  %vreg0

      t25 = IMPLICIT_DEF:v4f32

    t26 = HADDPSrr:v4f32 t1, t25

  t23 = CopyToReg:ch,glue t0, Register:v4f32  %XMM0, t26

    t23: <multiple use>
    t23: <multiple use>
  t24 = RETQ:ch Register:v4f32  %XMM0, t23, t23:1

    t0: <multiple use>
        t0: <multiple use>
      t1 = CopyFromReg:v4f32,ch t0, Register:v4f32  %vreg0
    t26 = X86ISD::FHADD:v4f32 t1, undef:v4f32
  t23 = CopyToReg:ch,glue t0, Register:v4f32  %XMM0, t26
    t23: <multiple use>
    t21 = TargetConstant:i16<0>
    t23: <multiple use>
  t24 = X86ISD::RET_FLAG:ch t23, t21, Register:v4f32  %XMM0, t23:1

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@248012 91177308-0d34-0410-b5e6-96231b3b80d8

Matthias Braun [Fri, 18 Sep 2015 17:57:28 +0000 (17:57 +0000)]
SelectionDAGDumper: Hide [ID=X], [ORD=X] and source locations by default.

You can show them with the new -dag-dump-verbose switch.

Differential Revision: http://reviews.llvm.org/D12566

7 years agoSelectionDAG: Introduce PersistentID to SDNode for assert builds.
SelectionDAG: Introduce PersistentID to SDNode for assert builds.

This gives us more human readable numbers to identify nodes in debug

  0x7fcbd9700160: ch = EntryToken

  0x7fcbd985c7c8: i64 = Register %RAX


      0x7fcbd9700160: <multiple use>
    0x7fcbd985c578: i64,ch = MOV64rm 0x7fcbd985c6a0, 0x7fcbd985cc68, 0x7fcbd985c200, 0x7fcbd985cd90, 0x7fcbd985ceb8, 0x7fcbd9700160<Mem:LD8[@foo]> [ORD=2]

  0x7fcbd985c8f0: ch,glue = CopyToReg 0x7fcbd9700160, 0x7fcbd985c7c8, 0x7fcbd985c578 [ORD=3]

    0x7fcbd985c7c8: <multiple use>
    0x7fcbd985c8f0: <multiple use>
    0x7fcbd985c8f0: <multiple use>
  0x7fcbd985ca18: ch = RETQ 0x7fcbd985c7c8, 0x7fcbd985c8f0, 0x7fcbd985c8f0:1 [ORD=3]

  t0: ch = EntryToken

  t5: i64 = Register %RAX


      t0: <multiple use>
    t3: i64,ch = MOV64rm t10, t12, t11, t13, t14, t0<Mem:LD8[@foo]> [ORD=2]

  t6: ch,glue = CopyToReg t0, t5, t3 [ORD=3]

    t5: <multiple use>
    t6: <multiple use>
    t6: <multiple use>
  t7: ch = RETQ t5, t6, t6:1 [ORD=3]

Differential Revision: http://reviews.llvm.org/D12564

7 years ago[CMake] More cleanup of installing symlinks.
[CMake] More cleanup of installing symlinks.

In order to support building clang out-of-tree the install_symlink script needs to be installed, and it needs to be found by searching the CMAKE_MODULE_PATH.

This change renames install_symlink -> LLVMInstallSymlink so it doesn't conflict with naming from other projects, and adds searching behavior in AddLLVM.cmake

7 years ago[AArch64] Improved bitfield instruction selection.
[AArch64] Improved bitfield instruction selection.

For bitfield insert OR matching, check both operands for larger pattern
first before checking for smaller pattern.

Add pattern for unsigned bitfield insert-in-zero done with SHL+AND.

Resolves PR21631.

Reviewers: jmolloy, t.p.northover

Subscribers: aemerson, rengolin, llvm-commits, mcrosier

Differential Revision: http://reviews.llvm.org/D12908

7 years agoRemove temporary file on signal.
Remove temporary file on signal.

Without this lld leaves temporary files behind when it crashes.

7 years agoSimplify SmallBitVector::applyMask by consolidating common code for 32- and 64-bit...
Simplify SmallBitVector::applyMask by consolidating common code for 32- and 64-bit builds
and assert when mask is too large to apply in the small case,
previously the extra words were silently ignored.
clang-format the entire function to match current code standards.

This is a rewrite of r247972 which was reverted in r247983 due to
warning and possible UB on 32-bits hosts.

7 years ago[mips][microMIPS] Fix an invalid read for lwm32 and reserved reglist values.
[mips][microMIPS] Fix an invalid read for lwm32 and reserved reglist values.

Some values of 'reglist' are reserved and cause the disassembler to read past
the end of the Regs array. Treat lwm32's containing reserved values as invalid

Reviewers: zoran.jovanovic

Subscribers: llvm-commits

Differential Revision: http://reviews.llvm.org/D12959

7 years ago[AArch64] Reorder cases to improve readability. NFC.
[AArch64] Reorder cases to improve readability. NFC.

7 years ago[AArch64] Remove some redundant cases. NFC.
[AArch64] Remove some redundant cases. NFC.

7 years agoSilencing a -Wsign-compare warning; NFC.
Silencing a -Wsign-compare warning; NFC.

7 years ago[LazyValueInfo] Report nonnull range for nonnull pointers
[LazyValueInfo] Report nonnull range for nonnull pointers

Currently LazyValueInfo will report only alloca's as having nonnull range.
For loads with !nonnull metadata it will bailout with no additional information.
Same is true for calls returning nonnull pointers.

This change extends LazyValueInfo to handle additional nonnull instructions.

Differential Revision: http://reviews.llvm.org/D12932

7 years agoSupport align attribute for return values
Support align attribute for return values

Reviewed By: reames

Differential Revision: http://reviews.llvm.org/D12844

7 years agoReverting r247972 (and subordinate commit r247972) as the 32-bit left-shift is undefi...
Reverting r247972 (and subordinate commit r247972) as the 32-bit left-shift is undefined behavior on implementations where uinptr_t is 32-bits. One such platform is Windows, MSVC, x86.

7 years agoNit cleanup in LangRef about dereferenceable metadata
Nit cleanup in LangRef about dereferenceable metadata

Reviewed By: vsk

Differential Revision: http://reviews.llvm.org/D12847

7 years ago[Support] Reapply r245289 "Always wait for GraphViz before opening the viewer"
[Support] Reapply r245289 "Always wait for GraphViz before opening the viewer"

The change was accidentally undone by r245290.

Original log message:
When calling DisplayGraph and a PS viewer is chosen, two programs are executed: The GraphViz generator and the PostScript viewer. Always wait for the generator to finish to ensure that the .ps file is written before opening the viewer for that file. DisplayGraph's wait parameter refers to whether to wait until the user closes the viewer.

This happened on Windows and if none of the options to open the .dot file directly applies, also on Linux.

Differential Revision: http://reviews.llvm.org/D11876

7 years ago[llvm-mc-fuzzer] Document llvm-mc-fuzzer in LibFuzzer.rst.
[llvm-mc-fuzzer] Document llvm-mc-fuzzer in LibFuzzer.rst.

7 years ago[WinEH] Moved funclet pads should be in relative order
[WinEH] Moved funclet pads should be in relative order

We shifted the MachineBasicBlocks to the end of the MachineFunction in
DFS order.  This will not ensure that MachineBasicBlocks which fell
through to one another will remain contiguous.  Instead, implement
a stable sort algorithm for iplist.

This partially reverts commit r214150.

7 years agoFix BitVectorTest on 32-bit hosts after r247972.
Fix BitVectorTest on 32-bit hosts after r247972.
We can't apply two words of 32-bit mask in the small case
where the internal storage is just one 32-bit word.

7 years agoSimplify SmallBitVector::applyMask by consolidating common code for 32-bit and 64...
Simplify SmallBitVector::applyMask by consolidating common code for 32-bit and 64-bit builds.
Extend mask value to 64 bits before taking its complement and assert when mask is
too large to apply in the small case (previously the extra words were silently ignored).


Patch by James Touton!

7 years agoRemove trailing whitespace from the old Orc Kaleidoscope examples.
Remove trailing whitespace from the old Orc Kaleidoscope examples.

7 years agoWhitespace. Indent with spaces instead of a tab.
Whitespace. Indent with spaces instead of a tab.

7 years ago[ShrinkWrap] Refactor the handling of infinite loop in the analysis.
[ShrinkWrap] Refactor the handling of infinite loop in the analysis.
- Strenghten the logic to be sure we hoist the restore point out of the current
  loop. (The fixes a bug with infinite loop, added as part of the patch.)
- Walk over the exit blocks of the current loop to conver to the desired restore
  point in one iteration of the update loop.

7 years ago[llvm-readobj] Fix another "time of check to time of use bug".
[llvm-readobj] Fix another "time of check to time of use bug".

It seems there's more copy-paste between tools than needed.

7 years ago[opaque pointer types] Add an explicit pointee type to alias records in the IR
[opaque pointer types] Add an explicit pointee type to alias records in the IR

Since aliases actually use and verify their explicit type already, no
further invalid testing is required here. The
invalid.test:ALIAS-TYPE-MISMATCH case catches errors due to emitting a
non-pointee type in the new format or a non-pointer type in the old

7 years ago[bpf] expand indirect branches
[bpf] expand indirect branches

BPF instruction set doesn't have indirect branches. Expand them.

Reported by John Fastabend.

7 years agoRevert "(HEAD -> master, origin/master, origin/HEAD) RegisterPressure: Move LiveInReg...
Revert "(HEAD -> master, origin/master, origin/HEAD) RegisterPressure: Move LiveInRegs/LiveOutRegs from RegisterPressure to PressureTracker"

This reverts commit r247943.

Accidental commit, code review was not finished yet.

7 years ago[WinEH] Fix tests broken by funclet-layout
[WinEH] Fix tests broken by funclet-layout

7 years agoRegisterPressure: Move LiveInRegs/LiveOutRegs from RegisterPressure to PressureTracker
RegisterPressure: Move LiveInRegs/LiveOutRegs from RegisterPressure to PressureTracker

Differential Revision: http://reviews.llvm.org/D12814

7 years agoMachineScheduler: Provide an option for node hiding cutoff and disable it by default
MachineScheduler: Provide an option for node hiding cutoff and disable it by default

7 years ago[SPARC] Add mulscc.
[SPARC] Add mulscc.

7 years agofix typo; NFC
fix typo; NFC

7 years ago[WinEH] Add a funclet layout pass
[WinEH] Add a funclet layout pass

Windows EH funclets need to be contiguous.  The FuncletLayout pass will
ensure that the funclets are together and begin with a funclet entry MBB.

Differential Revision: http://reviews.llvm.org/D12943

7 years ago[WinEH] Make funclet return instrs pseudo instrs
[WinEH] Make funclet return instrs pseudo instrs

This makes catchret look more like a branch, and less like a weird use
of BlockAddress. It also lets us get away from
llvm.x86.seh.restoreframe, which relies on the old parentfpoffset label

7 years agogvn small fix
gvn small fix


7 years ago[InstCombine] Added vector demanded bits support for SSE4A EXTRQ/INSERTQ instructions
[InstCombine] Added vector demanded bits support for SSE4A EXTRQ/INSERTQ instructions

The SSE4A instructions EXTRQ/INSERTQ only use the lower 64-bits (or less) for many of their input vector operands and all of them have undefined upper 64-bits results.

Differential Revision: http://reviews.llvm.org/D12680

7 years agoAdded MD_invariant_group to LLVMContext
Added MD_invariant_group to LLVMContext


7 years agoRestore "Function bitcode index in Value Symbol Table and lazy reading support"
Restore "Function bitcode index in Value Symbol Table and lazy reading support"

This reverts commit r247898 (which reverted r247894).

Patch fixed to address two issues exposed by buildbots:
- unused variable warning in NDEBUG mode
- std::initializer_list lifetime issue causing test failures

Original Summary:
Support for including the function bitcode indices in the Value Symbol
Table. This requires writing the VST after the function blocks, which in
turn requires a new VST forward declaration record encoding the offset of
the full VST (which is backpatched to contain the offset after the VST
is written).

This patch also enables the lazy function reader to use the new function
indices out of the VST. This support will be used by ThinLTO as well, which
will be in a follow on patch. Backwards compatibility with older bitcode
files is maintained.

A new test is also included.

The bitcode format (used for the lazy reader as well as the upcoming
ThinLTO patches) came out of discussions with Duncan and others and is
described here:

Reviewers: dexonsmith, davidxl, joker.eph

Subscribers: llvm-commits

Differential Revision: http://reviews.llvm.org/D12536

7 years agoTemporarily fix gcov failures in big-endian hosts.
Temporarily fix gcov failures in big-endian hosts.

This test uses a gcov file generated in a little-endian host. The gcov
reader does not allow different endianness, so the test fails on big
endian hosts.

XFAILing for now.

7 years ago[SCEV] Use auto instead of full iterator type; NFCI.
[SCEV] Use auto instead of full iterator type; NFCI.

7 years ago[SCEV] Don't repeat method/field names in comment in header; NFC.
[SCEV] Don't repeat method/field names in comment in header; NFC.

7 years agoFix the test case I just committed
Fix the test case I just committed

7 years ago[WinEH] Add and use hasEHPadSuccessor instead of getLandingPadSuccessor
[WinEH] Add and use hasEHPadSuccessor instead of getLandingPadSuccessor

getLandingPadSuccessor assumes that each invoke can have at most one EH
pad successor, but WinEH invokes can have more than one. Two out of
three callers of getLandingPadSuccessor don't use the returned
landingpad, so we can make them use this simple predicate instead.

Eventually we'll have to circle back and fix SplitKit.cpp so that
register allocation works. Baby steps.

