6 years ago[Orc] Remove extraneous semicolon that found its way into r250712.
[Orc] Remove extraneous semicolon that found its way into r250712.

6 years ago[Hexagon] Delay emission of CFI instructions
[Hexagon] Delay emission of CFI instructions

Emit the CFI instructions after all code transformation have been done.
This will avoid any interference between CFI instructions and packetization.

6 years agoRevert "RegisterPressure: allocatable physreg uses are always kills"
Revert "RegisterPressure: allocatable physreg uses are always kills"

This reverts commit r250596.

Reverted for now as the commit triggers assert in the AMDGPU target
pending investigation.

6 years ago[Orc] Add support for emitting indirect stubs directly into the JIT target's
[Orc] Add support for emitting indirect stubs directly into the JIT  target's
memory, rather than representing the stubs in IR. Update the CompileOnDemand
layer to use this functionality.

Directly emitting stubs is much cheaper than building them in IR and codegen'ing
them (see below). It also plays well with remote JITing - stubs can be emitted
directly in the target process, rather than having to send them over the wire.

The downsides are:

(1) Care must be taken when resolving symbols, as stub symbols are held in a
    separate symbol table. This is only a problem for layer writers and other
    people using this API directly. The CompileOnDemand layer hides this detail.

(2) Aliases of function stubs can't be symbolic any more (since there's no
    symbol definition in IR), but must be converted into a constant pointer
    expression. This means that modules containing aliases of stubs cannot be
    cached. In practice this is unlikely to be a problem: There's no benefit to
    caching such a module anyway.

On balance I think the extra performance is more than worth the trade-offs: In a
simple stress test with 10000 dummy functions requiring stubs and a single
executed "hello world" main function, directly emitting stubs reduced user time
for JITing / executing by over 90% (1.5s for IR stubs vs 0.1s for direct

6 years agoConvert gold-plugin unnecessary unique_ptr into local (NFC)
Convert gold-plugin unnecessary unique_ptr into local (NFC)

6 years agoFix required library for r250699 to BitWriter instead of BitReader.
Fix required library for r250699 to BitWriter instead of BitReader.

This should fix the mingw3 bot failure.

6 years agoFix windows bot failures from r250699 by removing "/" from expected path
Fix windows bot failures from r250699 by removing "/" from expected path
in test output.

6 years agollvm-lto support for generating combined function indexes
llvm-lto support for generating combined function indexes

This patch adds support to llvm-lto that mirrors the support added by
r249270 to the gold plugin. This enables better testing of combined
index generation for ThinLTO.

Added a new test, and this support will be used in the test in D13515.

Reviewers: joker.eph

Subscribers: llvm-commits

Differential Revision: http://reviews.llvm.org/D13847

6 years agoRemove CRLF newlines. NFC.
Remove CRLF newlines. NFC.

6 years agoFix mapping of @llvm.arm.ssat/usat intrinsics to ssat/usat instructions
Fix mapping of @llvm.arm.ssat/usat intrinsics to ssat/usat instructions

The mapping of these two intrinsics in ARMInstrInfo.td had a small
omission which lead to their operands not being validated/transformed
before being lowered into usat and ssat instructions. This can cause
incorrect instructions to be emitted.

I've also added tests for the remaining two saturating arithmatic
intrinsics @llvm.arm.qadd and @llvm.arm.qsub as they are missing
codegen tests.

6 years ago[GlobalsAA] Fix a really horrible iterator invalidation bug
[GlobalsAA] Fix a really horrible iterator invalidation bug

We were keeping a reference to an object in a DenseMap then mutating it. At the end of the function we were attempting to clone that reference into other keys in the DenseMap, but DenseMap may well decide to resize its hashtable which would invalidate the reference!

It took an extremely complex testcase to catch this - many thanks to Zhendong Su for catching it in PR25225.

This fixes PR25225.

6 years agoRemoved parameter "Consecutive" from isLegalMaskedLoad() / isLegalMaskedStore().
Removed parameter "Consecutive" from isLegalMaskedLoad() / isLegalMaskedStore().
Originally I planned to use the same interface for masked gather/scatter and set isConsecutive to "false" in this case.

Now I'm implementing masked gather/scatter and see that the interface is inconvenient. I want to add interfaces isLegalMaskedGather() / isLegalMaskedScatter() instead of using the "Consecutive" parameter in the existing interfaces.

Differential Revision: http://reviews.llvm.org/D13850

6 years ago[mips][microMIPS] Implement ADDQ.PH, ADDQ_S.W, ADDQH.PH, ADDQH.W, ADDSC, ADDU.PH...
[mips][microMIPS] Implement ADDQ.PH, ADDQ_S.W, ADDQH.PH, ADDQH.W, ADDSC, ADDU.PH, ADDU_S.QB, ADDWC and ADDUH.QB instructions
Differential Revision: http://reviews.llvm.org/D13130

6 years ago[mips][microMIPS] Implement ABSQ.QB, ABSQ_S.PH, ABSQ_S.W, ABSQ_S.QB, INSV, MADD,...
[mips][microMIPS] Implement ABSQ.QB, ABSQ_S.PH, ABSQ_S.W, ABSQ_S.QB, INSV, MADD, MADDU, MSUB, MSUBU, MULT and MULTU instructions
Differential Revision: http://reviews.llvm.org/D13721

6 years ago[PGO] Eliminate prof data register calls on FreeBSD platform
[PGO] Eliminate prof data register calls on FreeBSD platform

This is a follow up patch of r250199 after verifying the start/stop
section symbols work as spected on FreeBSD.

6 years agoPreserve CFG in MergedLoadStoreMotion. This fixes PR24426.
Preserve CFG in MergedLoadStoreMotion. This fixes PR24426.

6 years agoAdd hashing and DenseMapInfo for ArrayRef
Add hashing and DenseMapInfo for ArrayRef

Sometimes it is more natural to use a ArrayRef<uint8_t> than a StringRef to
represent a range of bytes that is not, semantically, a string.

This will be used in lld in a sec.

6 years ago[X86][SSE] Add vector bit rotation tests.
[X86][SSE] Add vector bit rotation tests.

6 years agoUse SDValue bool check. NFCI.
Use SDValue bool check. NFCI.

6 years agoMove one-use variable inside test. NFC.
Move one-use variable inside test. NFC.

6 years ago[X86][AVX512DQ] add scalar fpclass
[X86][AVX512DQ] add scalar fpclass

Differential Revision: http://reviews.llvm.org/D13769

6 years agoAVX512: Lowering i8/i16 vector CTLZ using the dword LZCNT vector instruction
AVX512: Lowering i8/i16 vector CTLZ using the dword LZCNT vector instruction

Differential Revision: http://reviews.llvm.org/D13632

6 years ago[Sparc] Use MCPhysReg instead of unsigned to size static arrays of registers. Should...
[Sparc] Use MCPhysReg instead of unsigned to size static arrays of registers. Should reduce the table size.

6 years agoUse array_lengthof. NFC
Use array_lengthof. NFC

6 years agoMake a bunch of static arrays const.
Craig Topper [Sun, 18 Oct 2015 05:15:34 +0000 (05:15 +0000)]
Make a bunch of static arrays const.

6 years ago[RuntimeDyld] Add support for absolute symbols.
[RuntimeDyld] Add support for absolute symbols.

6 years agoMinor Instr PGO code restructuring
Minor Instr PGO code restructuring

1. Key constant values (version, magic) and data structures related to raw and
   indexed profile format are moved into one centralized file: InstrProf.h.
2. Utility function such as MD5Hash computation is also moved to the common
   header to allow sharing with other components in the future.
3. A header data structure is introduced for Indexed format so that the reader
   and writer can always be in sync.
4. Added some comments to document different places where multiple definition
   of the data structure must be kept in sync (reader/writer, runtime, lowering
   etc).  No functional change is intended.

Differential Revision:  http://reviews.llvm.org/D13758

6 years ago[SCEV] Fix whitespace issues and remove extra braces; NFC
[SCEV] Fix whitespace issues and remove extra braces; NFC

6 years ago[SCEV] Use std::all_of and std::any_of; NFC
[SCEV] Use std::all_of and std::any_of; NFC

6 years ago[SCEV] Use auto where it helps remove line breaks; NFC
[SCEV] Use auto where it helps remove line breaks; NFC

6 years ago[SCEV] Use range for loops; NFC
[SCEV] Use range for loops; NFC

6 years agoUse std::find instead of manual loop.
Use std::find instead of manual loop.

6 years agoUse std::is_sorted to replace a custom version. Also replace a comparison predicate...
Use std::is_sorted to replace a custom version. Also replace a comparison predicate struct with a lambda.

6 years ago[X86][XOP] Add VPROT instruction opcodes
[X86][XOP] Add VPROT instruction opcodes

Added X86ISD opcodes for VPROT vector rotate by variable and by immediate.

6 years agoRemove unnecessary 'const' pointed out by David Blaikie.
Remove unnecessary 'const' pointed out by David Blaikie.

6 years ago[X86][XOP] Add VPROT rotate by immediate intrinsics tests
[X86][XOP] Add VPROT rotate by immediate intrinsics tests

6 years ago[DAG] Ensure vector constant folding uses correct scalar undef types
[DAG] Ensure vector constant folding uses correct scalar undef types

Minor fix to D13665 found during post-commit review.

6 years agoReplace a custom table sort check with std::is_sorted. Change a function to take...
Replace a custom table sort check with std::is_sorted. Change a function to take ArrayRef instead of pointer and length. NFC

6 years agoUse std::begin/end and std::is_sorted to simplify some code. NFC
Use std::begin/end and std::is_sorted to simplify some code. NFC

6 years agoUse binary search in isCPUStringValid since the array is sorted.
Use binary search in isCPUStringValid since the array is sorted.

6 years ago[CostModel] Fixed AVX integer shift costs
[CostModel] Fixed AVX integer shift costs

Targets with AVX but without AVX2 were incorrectly reporting costs of 256-bit integer shifts.

6 years ago[X86][FastISel] Teach how to select SSE4A nontemporal stores.
[X86][FastISel] Teach how to select SSE4A nontemporal stores.

Add FastISel support for SSE4A scalar float / double non-temporal stores

Follow up to D13698

Differential Revision: http://reviews.llvm.org/D13773

6 years ago[InstCombine] SSE4A constant folding and conversion to shuffles.
[InstCombine] SSE4A constant folding and conversion to shuffles.

This patch improves support for combining the SSE4A EXTRQ(I) and INSERTQ(I) intrinsics:

1 - Converts INSERTQ/EXTRQ calls to INSERTQI/EXTRQI if the 'bit index' and 'length' operands are constant
2 - Converts INSERTQI/EXTRQI calls to shufflevector if the bit index/length are both byte aligned (we can already lower shuffles to INSERTQI/EXTRQI if its useful)
3 - Constant folding support
4 - Add zeroinitializer handling

Differential Revision: http://reviews.llvm.org/D13348

6 years ago[JIT/Examples] Fix Fibonacci so that it runs again.
[JIT/Examples] Fix Fibonacci so that it runs again.

The old JIT is (long) gone.

6 years ago[libFuzzer] add -shuffle flag
[libFuzzer] add -shuffle flag

6 years ago[Hexagon] Reverting test file change.
[Hexagon] Reverting test file change.

6 years ago[Hexagon] Adding skeleton of HVX extension instructions.
[Hexagon] Adding skeleton of HVX extension instructions.

6 years agoRegisterPressure: Unify the sparse sets in LiveRegsSet; NFC
RegisterPressure: Unify the sparse sets in LiveRegsSet; NFC

Also do some cleanups comment improvements.

6 years agoRegisterPressure: allocatable physreg uses are always kills
RegisterPressure: allocatable physreg uses are always kills

This property was already used in the code path when no liveness
intervals are present. Unfortunately the code path that uses liveness
intervals tried to query a cached live interval for an allocatable
physreg, those are usually not computed so a conservative default was

This doesn't affect any of the lit testcases. This is a foreclosure to
upcoming changes which should be NFC but without this patch this tidbit
wouldn't be NFC.

6 years agoRegisterPressure: Remove 0 entries from PressureChange
RegisterPressure: Remove 0 entries from PressureChange

This should not change behaviour because as far as I can see all code
reading the pressure changes has no effect if the PressureInc is 0.
Removing these entries however does avoid unnecessary computation, and
results in a more stable debug output. I want the stable debug output to
check that some upcoming changes are indeed NFC and identical even at
the debug output level.

6 years agoWebAssembly: don't omit dead vregs from locals
WebAssembly: don't omit dead vregs from locals

This is a temporary hack until we get around to remapping the vreg
numbers to local numbers. Dead vregs cause bad numbering and make
consumers sad.

We could also just look at debug info an use named locals instead, but
vregs have to work properly anyways so there!

Reviewers: binji, sunfish

Subscribers: jfb, llvm-commits, dschuff

Differential Revision: http://reviews.llvm.org/D13839

6 years agoWebAssembly: fix the syntax for comparisons
WebAssembly: fix the syntax for comparisons

Summary: It has also slightly changed.

Reviewers: binji

Subscribers: jfb, dschuff, llvm-commits, sunfish

Differential Revision: http://reviews.llvm.org/D13837

6 years agoRegisterPressure: Hide non-const iterators of PressureDiff
RegisterPressure: Hide non-const iterators of PressureDiff

It is too easy to accidentally violate the ordering requirements when
modifying the PressureDiff entries through iterators.

6 years agoStreamWriter: List basic types instead of derived ones in HexNumber
StreamWriter: List basic types instead of derived ones in HexNumber

This avoids problems with different (u)intXX definition on different
platforms. Specifically this fixes a case on OS/X which had uint64_t
defined as unsigned long long.

6 years ago[WinEH] Fix eh.exceptionpointer intrinsic lowering
[WinEH] Fix eh.exceptionpointer intrinsic lowering

Some shared code for handling eh.exceptionpointer and eh.exceptioncode
needs to not share the part that truncates to 32 bits, which is intended
just for exception codes.

Reviewers: rnk

Subscribers: llvm-commits

Differential Revision: http://reviews.llvm.org/D13747

6 years agoDisable a test relying on symbol demangling on non-Windows platforms
Disable a test relying on symbol demangling on non-Windows platforms

6 years agoSpeculative fix for GCC build
Speculative fix for GCC build

6 years ago[WinEH] Fix stack alignment in funclets and ParentFrameOffset calculation
[WinEH] Fix stack alignment in funclets and ParentFrameOffset calculation

Our previous value of "16 + 8 + MaxCallFrameSize" for ParentFrameOffset
is incorrect when CSRs are involved. We were supposed to have a test
case to catch this, but it wasn't very rigorous.

The main effect here is that calling _CxxThrowException inside a
catchpad doesn't immediately crash on MOVAPS when you have an odd number
of CSRs.

6 years ago[llvm-symbolizer] Use the export table if no symbols are present
[llvm-symbolizer] Use the export table if no symbols are present

This lets us make guesses about symbols in third party DLLs without
debug info, like MSVCR120.dll or kernel32.dll. dbghelp does the same

6 years agoRegisterPressure: Use range based for, cleanup
RegisterPressure: Use range based for, cleanup

6 years ago[llvm-readobj] Teach ELFDumper about symbol versioning.
[llvm-readobj] Teach ELFDumper about symbol versioning.

Differential Revision:  http://reviews.llvm.org/D13824

6 years agoInstroduce a template file to define InstrPGO core data structures.
Instroduce a template file to define InstrPGO core data structures.

Changing PGO data format layout can be a pain. Many different places need
to be touched and kept in sync. Failing to do so usually results in errors
very time consuming to debug.

This file is intended to be the master file that defines the layout of the
core runtime data structures. Currently only two structure is covered: Per
function ProfData structure and the function record structure used in
coverage mapping.

No client code has been made yet, so this commit is NFC.

6 years ago[CMake] Cleaning up and generalizing the LLVMInstallSymlink script so that it can...
[CMake] Cleaning up and generalizing the LLVMInstallSymlink script so that it can be used for libraries too.

In order to resolve PR25059, we're going to need to be able to generate symlinks to libraries manually, so I need this code to be reusable.

6 years ago[libFuzzer] print a stack trace on timeout
[libFuzzer] print a stack trace on timeout

6 years agoRevert "This is a follow-up to the discussion in D12882."
Revert "This is a follow-up to the discussion in D12882."

Breaks clang selfhost, see PR25222. This reverts commits r250527 and r250528.

6 years ago[libFuzzer] reduce the size of artifacts printed on the screen
[libFuzzer] reduce the size of artifacts printed on the screen

6 years ago[libFuzzer] When -test_single_input crashes the test it is not necessary to write...
[libFuzzer] When -test_single_input crashes the test it is not necessary to write crash-file because input is already known to the user. Patch by Mike Aizatsky

6 years ago[x86] promote 'add nsw' to a wider type to allow more combines
[x86] promote 'add nsw' to a wider type to allow more combines

The motivation for this patch starts with PR20134:

void foo(int *a, int i) {
  a[i] = a[i+1] + a[i+2];

It seems better to produce this (14 bytes):

movslq %esi, %rsi
movl 0x4(%rdi,%rsi,4), %eax
addl 0x8(%rdi,%rsi,4), %eax
movl %eax, (%rdi,%rsi,4)

Rather than this (22 bytes):

leal 0x1(%rsi), %eax
leal 0x2(%rsi), %ecx
movslq %ecx, %rcx
movl (%rdi,%rcx,4), %ecx
addl (%rdi,%rax,4), %ecx
movslq %esi, %rax
movl %ecx, (%rdi,%rax,4)

The most basic problem (the first test case in the patch combines constants) should also be fixed in InstCombine,
but it gets more complicated after that because we need to consider architecture and micro-architecture. For
example, AArch64 may not see any benefit from the more general transform because the ISA solves the sexting in
hardware. Some x86 chips may not want to replace 2 ADD insts with 1 LEA, and there's an attribute for that:
FeatureSlowLEA. But I suspect that doesn't go far enough or maybe it's not getting used when it should; I'm
also not sure if FeatureSlowLEA should also mean "slow complex addressing mode".

I see no perf differences on test-suite with this change running on AMD Jaguar, but I see small code size
improvements when building clang and the LLVM tools with the patched compiler.

A more general solution to the sext(add nsw(x, C)) problem that works for multiple targets is available
in CodeGenPrepare, but it may take quite a bit more work to get that to fire on all of the test cases that
this patch takes care of.

Differential Revision: http://reviews.llvm.org/D13757

6 years agoMC: Don't crash after issuing a diagnostic.
MC: Don't crash after issuing a diagnostic.

Crashing is bad, m'kay? Fixing a 4 year old bug of my own creation.
Adding the testcase now which I should have added then which would have
long since caught this.

The problem is that printMessage() will display the diagnostic but not
set HadError to true, resulting in the assembler continuing on its way
and trying to create relocations for things that may not allow them or
otherwise get itself into trouble. Using the Error() helper function
here rather than calling printMessage() directly resolves this.


6 years ago[WinEH] Fix CatchRetSuccessorColorMap accounting
[WinEH] Fix CatchRetSuccessorColorMap accounting

We now use the block for the catchpad itself, rather than its normal
successor, as the funclet entry.
Putting the normal successor in the map leads downstream funclet
membership computations to erroneous results.

Reviewers: majnemer, rnk

Subscribers: rnk, llvm-commits

Differential Revision: http://reviews.llvm.org/D13798

6 years agoFix assertion failure with fp128 to unsigned i64 conversion
Fix assertion failure with fp128 to unsigned i64 conversion

Patch by Mitch Bodart

Differential Revision: http://reviews.llvm.org/D13780

6 years ago[Hexagon] Split double registers
[Hexagon] Split double registers

6 years ago[WinEH] Remove dead code/includes from WinEHPrepare
[WinEH] Remove dead code/includes from WinEHPrepare

No functionality change is intended.

6 years ago[Hexagon] Delete lib/Target/Hexagon/HexagonRemoveSZExtArgs.cpp
[Hexagon] Delete lib/Target/Hexagon/HexagonRemoveSZExtArgs.cpp

6 years ago[Hexagon] Merge adjacent stores
[Hexagon] Merge adjacent stores

6 years agoSample profiles - Re-arrange binary format to emit head samples only on top functions.
Sample profiles - Re-arrange binary format to emit head samples only on top functions.

The number of samples collected at the head of a function only make
sense for top-level functions (i.e., those actually called as opposed to
being inlined inside another).

Head samples essentially count the time spent inside the function's
prologue.  This clearly doesn't make sense for inlined functions, so we
were always emitting 0 in those.

6 years agoWebAssembly: fix load/store syntax
WebAssembly: fix load/store syntax

Summary: The syntax has changed a bit recently.

Reviewers: binji

Subscribers: llvm-commits, jfb, sunfish, dschuff

Differential Revision: http://reviews.llvm.org/D13821

6 years ago[WinEH] Fix endpad coloring/numbering
[WinEH] Fix endpad coloring/numbering

When a cleanup's cleanupendpad or cleanupret targets a catchendpad, stop
trying to propagate the cleanup's parent's color to the catchendpad, since
what's needed is the cleanup's grandparent's color and the catchendpad
will get that color from the catchpad linkage already.  We already had
this exclusion for invokes, but were missing it for

Also add a missing line that tags cleanupendpads' states in the
EHPadStateMap, without with lowering invokes that target cleanupendpads
which unwind to other handlers (and so don't have the -1 state) will fail.

This fixes the reduced IR repro in PR25163.

Reviewers: majnemer, andrew.w.kaylor, rnk

Subscribers: llvm-commits

Differential Revision: http://reviews.llvm.org/D13797

6 years agoFix typo, NFC.
Fix typo, NFC.

6 years agomove test case to x86 directory because it specifies an x86 target
move test case to x86 directory because it specifies an x86 target

6 years agoThis is a follow-up to the discussion in D12882.
This is a follow-up to the discussion in D12882.

Ideally, we would like SimplifyCFG to be able to form select instructions even when the operands
are expensive (as defined by the TTI cost model) because that may expose further optimizations.
However, we would then like a later pass like CodeGenPrepare to undo that transformation if the
target would likely benefit from not speculatively executing an expensive op (this patch).

Once we have this safety mechanism in place, we can adjust SimplifyCFG to restore its
select-formation behavior that changed with r248439.

Differential Revision: http://reviews.llvm.org/D13297

6 years agoWebAssembly: relooper analysis pass
WebAssembly: relooper analysis pass

Summary: Make the relooper an analysis pass, to convert CFG to AST.

Reviewers: sunfish

Subscribers: jfb, dschuff

Differential Revision: http://reviews.llvm.org/D12744

6 years ago[AArch64] Implement vector splitting on UADDV.
[AArch64] Implement vector splitting on UADDV.

Summary: Fixes PR25056.

Reviewers: mcrosier, junbuml, jmolloy

Subscribers: aemerson, rengolin, llvm-commits

Differential Revision: http://reviews.llvm.org/D13466

6 years agoSample Profiling - Remove useless asserts. NFC.
Sample Profiling - Remove useless asserts. NFC.

6 years agoCommited two test files which are forgotten during commit of patch for http://reviews...
Commited two test files which are forgotten during commit of patch for reviews.llvm.org/D13376

6 years ago[mips][microMIPS] Implement LB, LBE, LBU and LBUE instructions
[mips][microMIPS] Implement LB, LBE, LBU and LBUE instructions
Differential Revision: http://reviews.llvm.org/D11633

6 years agoFix path::home_directory() unit test.
Fix path::home_directory() unit test.

It turns out that constructing std::string from null pointer is not the very best idea.

6 years agoSupportTests::HomeDirectory: Don't try tests when $HOME is undefined.
SupportTests::HomeDirectory: Don't try tests when $HOME is undefined.

Lit sanitizes env vars. $HOME is not exported in Lit tests.

6 years agoReformat.
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@250504 91177308-0d34-0410-b5e6-96231b3b80d8

Use Windows Vista API to get the user's home directory

Summary: This patch replaces usage of deprecated SHGetFolderPathW with SHGetKnownFolderPath. The usage of SHGetKnownFolderPath is wrapped to allow queries for other "known" folders in the near future.

Reviewers: aaron.ballman, gbedwell

Subscribers: chapuni, llvm-commits

Differential Revision: http://reviews.llvm.org/D13753

6 years ago[X86] Add fxsr feature flag for fxsave/fxrestore instructions.
[X86] Add fxsr feature flag for fxsave/fxrestore instructions.

6 years agoInitial migration of AVR backend
Initial migration of AVR backend

This patch adds the underlying infrastructure for an AVR backend to be included into LLVM. It is the first of a series of patches aimed at moving the out-of-tree AVR backend into the tree.

It consists of adding a new`Triple` target 'avr'.

6 years ago[RS4GC] Dont' propagate call attrs related to patchable statepoints
[RS4GC] Dont' propagate call attrs related to patchable statepoints

The `"statepoint-id"` and `"statepoint-num-patch-bytes"` attributes are
used solely to determine properties of the `gc.statepoint` being
created.  Once the `gc.statepoint` is in place, these should be removed.

6 years ago[RS4GC] Bring legalizeCallAttributes up to LLVM coding style; NFC
[RS4GC] Bring legalizeCallAttributes up to LLVM coding style; NFC

6 years ago[RS4GC] Use "deopt" operand bundles
[RS4GC] Use "deopt" operand bundles

This is a step towards using operand bundles to carry deopt state till
RewriteStatepointsForGC.  The change adds a flag to
RewriteStatepointsForGC that teaches it to pick up deopt state from a
`"deopt"` operand bundle attached to the `call` or `invoke` it is

The command line flag added, `-rs4gc-use-deopt-bundles`, will only exist
for a short while.  Once we are able to pipe deopt bundle state through
the full optimization pipeline without problems, we will "constant fold"
`-rs4gc-use-deopt-bundles` to `true`.

Reviewers: swaroop.sridhar, reames

Subscribers: llvm-commits, sanjoy

Differential Revision: http://reviews.llvm.org/D13372

6 years ago[IndVars] Rename getExtend; NFC
[IndVars] Rename getExtend; NFC

Rename `IndVarSimplify::getExtend` to `IndVarSimplify::createExtendInst`
to make it obvious that it creates `llvm::Instruction` s.

6 years ago[IndVars] Have `cloneArithmeticIVUser` guess better
[IndVars] Have `cloneArithmeticIVUser` guess better

`cloneArithmeticIVUser` currently trips over expression like `add %iv,
-1` when `%iv` is being zero extended -- it tries to construct the
widened use as `add %iv.zext, zext(-1)` and (correctly) fails to prove
equivalence to `zext(add %iv, -1)` (here the SCEV for `%iv` is

This change teaches `IndVars` to try sign extending the non-IV operand
if that makes the newly constructed IV use equivalent to the widened
narrow IV use.

Reviewers: atrick, hfinkel, reames

Subscribers: sanjoy, llvm-commits

Differential Revision: http://reviews.llvm.org/D13717

6 years ago[IndVars] Extract out a few local variables; NFC
[IndVars] Extract out a few local variables; NFC

6 years ago[IndVars] Split `WidenIV::cloneIVUser`; NFC
[IndVars] Split `WidenIV::cloneIVUser`; NFC

This NFC splitting is intended to make a later diff easier to follow.
It just tail duplicates `cloneIVUser` into `cloneArithmeticIVUser` and

Reviewers: atrick, hfinkel, reames

Subscribers: llvm-commits

Differential Revision: http://reviews.llvm.org/D13716

6 years agoWebAssembly: update syntax
WebAssembly: update syntax

Follow the same syntax as for the spec repo. Both have evolved slightly
independently and need to converge again.

This, along with wasmate changes, allows me to do the following:

  echo "int add(int a, int b) { return a + b; }" > add.c
  ./out/bin/clang -O2 -S --target=wasm32-unknown-unknown add.c -o add.wack
  ./experimental/prototype-wasmate/wasmate.py add.wack > add.wast
  ./sexpr-wasm-prototype/out/sexpr-wasm add.wast -o add.wasm
  ./sexpr-wasm-prototype/third_party/v8-native-prototype/v8/v8/out/Release/d8 -e "print(WASM.instantiateModule(readbuffer('add.wasm'), {print:print}).add(42, 1337));"

As you'd expect, the d8 shell prints out the right value.

Reviewers: sunfish

Subscribers: jfb, llvm-commits, dschuff

Differential Revision: http://reviews.llvm.org/D13712

