8 years ago[OCaml] (PR16318) Add missing argument to Llvm.const_intcast
[OCaml] (PR16318) Add missing argument to Llvm.const_intcast

8 years ago[OCaml] (PR11717) Make declare_qualified_global respect address argument
[OCaml] (PR11717) Make declare_qualified_global respect address argument

Original patch by Jonathan Ragan-Kelley

8 years agoX86 Disassembler: remove unused bool typedef-name
X86 Disassembler: remove unused bool typedef-name

8 years agoSuppress OS crash dialog in llvm-rtdyld
Suppress OS crash dialog in llvm-rtdyld

All other tools have this -- it's needed to avoid hanging lit on Windows in
case of a crash.

8 years ago[OCaml] Properly tag the custom operations of Llvm.llbuilder
[OCaml] Properly tag the custom operations of Llvm.llbuilder

All other custom operations tags have LLVM prefix.

8 years ago[OCaml] Llvm_linker: do not use external in module interface
[OCaml] Llvm_linker: do not use external in module interface

Workaround for an OCaml bug:

8 years agoFix r194019 as requested by Eric Christopher.
Fix r194019 as requested by Eric Christopher.
Submit the basic port of the rest of ARM constant islands code to Mips.
Two test cases are added which reflect the next level of functionality:
constants getting moved to water areas that are out of range from the
initial placement at the end of the function and basic blocks being split to
create water when none exists that can be used. There is a bunch of this
code that is not complete and has been marked with IN_PROGRESS. I will
finish cleaning this all up during the next week or two and submit the
rest of the test cases. I have elminated some code for dealing with
inline assembly because to me it unecessarily complicates things and
some of the newer features of llvm like function attributies and builtin
assembler give me better tools to solve the alignment issues created
there. Also, for Mips16 I even have the option of not doing constant
islands in the present of inline assembler if I chose. When everything
has been completed I will summarize the port and notify people that
are knowledgable regarding the ARM Constant Islands code so they can
review it in it's entirety if they wish.

8 years agoFix symbol defines in config.h.cmake
Fix symbol defines in config.h.cmake

These were incorrectly pointing to HAVE_LOG despite being checked for
correctly in config-ix.cmake.

Patch by James Lyon!

8 years agoLift alignment restrictions on load folding for a significant portion of AVX instruct...
Lift alignment restrictions on load folding for a significant portion of AVX instructions.

8 years agoImplement AArch64 post-index vector load/store multiple N-element structure class...
Implement AArch64 post-index vector load/store multiple N-element structure class SIMD(lselem-post).
Including following 14 instructions:
4 ld1 insts: post-index load multiple 1-element structure to sequential 1/2/3/4 registers.
ld2/ld3/ld4: post-index load multiple N-element structure to sequential N registers (N=2,3,4).
4 st1 insts: post-index store multiple 1-element structure from sequential 1/2/3/4 registers.
st2/st3/st4: post-index store multiple N-element structure from sequential N registers (N = 2,3,4).

8 years agoImplemented aarch64 neon intrinsic vcopy_lane with float type.
Implemented aarch64 neon intrinsic vcopy_lane with float type.

8 years agoRevert "llvm-cov: Added command-line option to change dir."
Revert "llvm-cov: Added command-line option to change dir."

This reverts commit d8acf0078cf363252727acff00f85ae8074f95b3.

8 years agoRevert "Added basic unit test for llvm-cov."
Revert "Added basic unit test for llvm-cov."

This reverts commit 9cacd131c22b888303cb88e9a3235b2d7b2f19a1.

8 years agoAdded basic unit test for llvm-cov.
Added basic unit test for llvm-cov.

This test compares the output of llvm-cov against a coverage file
generated by gcov.

8 years agollvm-cov: Added command-line option to change dir.
llvm-cov: Added command-line option to change dir.

This will allow for much easier testing when the input files are in a
different folder from the test script.

8 years agoSupport for reading run counts in llvm-cov.
Support for reading run counts in llvm-cov.

This patch enables llvm-cov to correctly output the run count stored in
the GCDA file. GCOVProfiling currently does not generate this
information, so the GCDA run data had to be hacked on from a GCDA file
generated by gcc. This is corrected by a subsequent patch.

With the run and program data included, both llvm-cov and gcov produced
the same output.

8 years agoFix MSVC build by not putting an error_code directly in a union.
Fix MSVC build by not putting an error_code directly in a union.

8 years agoSimplify ErrorOr.
Rafael Espindola [Tue, 5 Nov 2013 00:28:01 +0000 (00:28 +0000)]
Simplify ErrorOr.

ErrorOr had quiet a bit of complexity and indirection to be able to hold a user
type with the error.

That feature is not used anymore. This patch removes it, it will live in svn
history if we ever need it again.

If we do need it again, IMHO there is one thing that should be done
differently: Holding extra info in the error is not a property a function also
returning a value or not. The ability to hold extra info should be in the error
type and ErrorOr templated over it so that we don't need the funny looking

8 years agoAdd a runtime unrolling parameter to the LoopUnroll pass constructor
Add a runtime unrolling parameter to the LoopUnroll pass constructor

As with the other loop unrolling parameters (the unrolling threshold, partial
unrolling, etc.) runtime unrolling can now also be controlled via the
constructor. This will be necessary for moving non-trivial unrolling late in
the pass manager (after loop vectorization).

No functionality change intended.

8 years agoRevert r194019 to r194021, "Submit the basic port of the rest of ARM constant islands...
Revert r194019 to r194021, "Submit the basic port of the rest of ARM constant islands code to Mips."

It broke -Asserts build.

8 years agoARM: remove unnecessary state-tracking during frame lowering.
ARM: remove unnecessary state-tracking during frame lowering.

ResolveFrameIndex had what appeared to be a very nasty hack for when the
frame-index referred to a callee-saved register. In this case it "adjusted" the
offset so that the address was correct if (and only if) the MachineInstr
immediately followed the respective push.

This "worked" for all forms of GPR & DPR but was only ever used to set the
frame pointer itself, and once this was put in a more sensible location the
entire state-tracking machinery it relied on became redundant. So I stripped

The only wrinkle is that "add r7, sp, #0" might theoretically be slower (need
an actual ALU slot) compared to "mov r7, sp" so I added a micro-optimisation
that also makes emitARMRegUpdate and emitT2RegUpdate also work when NumBytes ==

No test changes since there shouldn't be any functionality change.

8 years agoAArch64: use default asm operand printing when modifier inapplicable
AArch64: use default asm operand printing when modifier inapplicable

If an inline assembly operand has multiple constraints (e.g. "Ir" for immediate
or register) and an operand modifier (E.g. "w" for "print register as wN") then
we need to decide behaviour when the modifier doesn't apply to the constraint.

Previousely produced some combination of an assertion failure and a fatal
error. GCC's behaviour appears to be to ignore the modifier and print the
operand in the default way. This patch should implement that.

8 years agoMake sure we don't get a warning from this variable that is only used
Make sure we don't get a warning from this variable that is only used
when compiling with DEBUG.

8 years agoAdd the test case that goes with the previous submission for constant
Add the test case that goes with the previous submission for constant
islands. I forgot to add it to svn on that patch. Ooops.

8 years agoSubmit the basic port of the rest of ARM constant islands code to Mips.
Submit the basic port of the rest of ARM constant islands code to Mips.
Two test cases are added which reflect the next level of functionality:
constants getting moved to water areas that are out of range from the
initial placement at the end of the function and basic blocks being split to
create water when none exists that can be used. There is a bunch of this
code that is not complete and has been marked with IN_PROGRESS. I will
finish cleaning this all up during the next week or two and submit the
rest of the test cases. I have elminated some code for dealing with
inline assembly because to me it unecessarily complicates things and
some of the newer features of llvm like function attributies and builtin
assembler give me better tools to solve the alignment issues created
there. Also, for Mips16 I even have the option of not doing constant
islands in the present of inline assembler if I chose.

8 years agoRemove dead code
Remove dead code

8 years agoCheck for both styles of clobbers, those produced by dragonegg and
Check for both styles of clobbers, those produced by dragonegg and
those produced by clang for the inline asm bswap conversion.

Modified from a patch by Chris Smowton.

8 years agoSLPVectorizer: Use properlyDominates to satisfy the irreflexivity of a strict weak...
SLPVectorizer: Use properlyDominates to satisfy the irreflexivity of a strict weak ordering.

STL debug mode checks this.

8 years agoFix another constant folding address space place I missed.
Fix another constant folding address space place I missed.

This fixes an assertion failure with a different sized address space.

8 years agoScalarize select vector arguments when extracted.
Scalarize select vector arguments when extracted.

When the elements are extracted from a select on vectors
or a vector select, do the select on the extracted scalars
from the input if there is only one use.

8 years ago[docs] Add link to 32-bit ARM ELF supplement.
[docs] Add link to 32-bit ARM ELF supplement.

8 years agoUse startswith_lower() where possible.
Use startswith_lower() where possible.

8 years agoAdd support for AVX512 masked vector blend intrinsics.
Add support for AVX512 masked vector blend intrinsics.

8 years agoRename testing case to use - instead of _.
Rename testing case to use - instead of _.

8 years agoChange BitcodeReader to use error_code instead of bool + string.
Change BitcodeReader to use error_code instead of bool + string.

In order to create an ObjectFile implementation that uses bitcode files, we
need to propagate the bitcode errors to the ObjectFile interface, so we need
to convert it to use the same error handling as ObjectFile: error_code.

8 years agoSupport for microMIPS branch instructions.
Support for microMIPS branch instructions.

8 years agoAVX-512: fixed a typo in builtin name
AVX-512: fixed a typo in builtin name

8 years agoX86: Add a description for AMD bdver3 aka Steamroller.
X86: Add a description for AMD bdver3 aka Steamroller.

This is just bdver2 + FSGSBase.

8 years agoMake the pretty stack trace be an opt-in, rather than opt-out, facility. Enable pretty
Make the pretty stack trace be an opt-in, rather than opt-out, facility. Enable pretty
stack traces by default if you use PrettyStackTraceProgram, so that existing LLVM-based
tools will continue to get it without any changes.

8 years ago[OCaml] implement Llvm_passmgr_builder, bindings for PassManagerBuilder
[OCaml] implement Llvm_passmgr_builder, bindings for PassManagerBuilder

8 years ago[OCaml] Documentation
[OCaml] Documentation

8 years ago[OCaml] Implement missing LLVMCore APIs
[OCaml] Implement missing LLVMCore APIs

8 years ago[OCaml] Formatting
[OCaml] Formatting

8 years agoAVX-512: added VPCONFLICT instruction and intrinsics,
AVX-512: added VPCONFLICT instruction and intrinsics,
added EVEX_KZ to tablegen

8 years agoSLPVectorizer: Add a missing pair of parens. No functionality change.
SLPVectorizer: Add a missing pair of parens. No functionality change.

8 years ago[SparcV9] Handle i64 <-> float conversions in sparcv9 mode.
[SparcV9] Handle i64 <-> float conversions in sparcv9 mode.

8 years agoSLPVectorizer: When CSEing generated gathers only scan blocks containing them.
SLPVectorizer: When CSEing generated gathers only scan blocks containing them.

Instead of doing a RPO traversal of the whole function remember the blocks
containing gathers (typically <= 2) and scan them in dominator-first order.

The actual CSE is still quadratic, but I'm not confident that adding a
scoped hash table here is worth it as we're only looking at the generated
instructions and not arbitrary code.

8 years agoRevert "Inliner: Handle readonly attribute per argument when adding memcpy"
Revert "Inliner: Handle readonly attribute per argument when adding memcpy"

This reverts commit r193356, it caused PR17781.

A reduced test case covering this regression has been added to the test suite.

8 years agoSpell "Actual" correctly
Spell "Actual" correctly

8 years ago[OCaml] Implement Llvm.MemoryBuffer.{of_string,as_string}
[OCaml] Implement Llvm.MemoryBuffer.{of_string,as_string}

8 years ago[OCaml] Fix ABI incompatibility
[OCaml] Fix ABI incompatibility

OCaml's type unit is not compatible with C's type void.

8 years ago[OCaml] Implement Llvm_linker, bindings for the IR linker
[OCaml] Implement Llvm_linker, bindings for the IR linker

8 years ago[OCaml] Implement Llvm_vectorize bindings
[OCaml] Implement Llvm_vectorize bindings

8 years ago[OCaml] Refactor Llvm_target tests
[OCaml] Refactor Llvm_target tests

Llvm_target tests did not check for return values. This actually
caused them to miss a bug.

8 years ago[OCaml] Llvm_target: fix typo (Int_val instead of Int64_val)
[OCaml] Llvm_target: fix typo (Int_val instead of Int64_val)

8 years ago[Sparc] Expand FP_TO_UINT, UINT_TO_FP for fp128.
[Sparc] Expand FP_TO_UINT, UINT_TO_FP for fp128.

8 years ago[OCaml] Llvm_scalar_opts: add missing transforms
[OCaml] Llvm_scalar_opts: add missing transforms

8 years ago[OCaml] Llvm_ipo: add missing transforms
[OCaml] Llvm_ipo: add missing transforms

8 years agoConvert calls to __sinpi and __cospi into __sincospi_stret
Convert calls to __sinpi and __cospi into __sincospi_stret

This adds an SimplifyLibCalls case which converts the special __sinpi and
__cospi (float & double variants) into a __sincospi_stret where appropriate to
remove duplicated work.

Patch by Tim Northover

8 years agoEnable optimization of sin / cos pair into call to __sincos_stret for iOS7+.
Enable optimization of sin / cos pair into call to __sincos_stret for iOS7+.

Patch by Evan Cheng, with a fix for rdar://13209539 by Tilmann Scheller

8 years ago[SparcV9] Add ctpop instruction for i64. Also, expand ctlz, cttz and bswap.
[SparcV9] Add ctpop instruction for i64.  Also, expand ctlz, cttz and bswap.

8 years agoConfigure with --enable-terminfo=no for Apple's llvmCore builds.
Configure with --enable-terminfo=no for Apple's llvmCore builds.

Patch by Pete Cooper.

8 years agoAdd a comment to note that LLVMDisablePrettyStackTrace() is likely not a good long...
Add a comment to note that LLVMDisablePrettyStackTrace() is likely not a good long-term solution.

8 years agoWhen LLVM is embedded in a larger application, it's not OK for LLVM to intercept...
When LLVM is embedded in a larger application, it's not OK for LLVM to intercept crashes.  LLVM already has
the ability to disable this functionality.  This patch exposes it via the C API.

8 years agomove getSymbolNMTypeChar to the one program that needs it: nm.
move getSymbolNMTypeChar to the one program that needs it: nm.

8 years agoConvert another use of getSymbolNMTypeChar.
Convert another use of getSymbolNMTypeChar.

8 years agoAvoid some getSymbolNMTypeChar uses in COFFObjectFile.cpp itself.
Avoid some getSymbolNMTypeChar uses in COFFObjectFile.cpp itself.

This is a fixed version of 193928 which keeps these uses in sync.

8 years agoRevert "Don't use getSymbolNMTypeChar for implementing COFFObjectFile::getSymbolFileO...
Revert "Don't use getSymbolNMTypeChar for implementing COFFObjectFile::getSymbolFileOffset."

Investigating a bot failure.

This reverts commit r193928.

8 years agoDon't use getSymbolNMTypeChar for implementing COFFObjectFile::getSymbolFileOffset.
Don't use getSymbolNMTypeChar for implementing COFFObjectFile::getSymbolFileOffset.

8 years agoSLPVectorizer: Remove duplicated function.
SLPVectorizer: Remove duplicated function.

8 years agoLoopVectorize: Remove quadratic behavior the local CSE.
LoopVectorize: Remove quadratic behavior the local CSE.

Doing this with a hash map doesn't change behavior and avoids calling
isIdenticalTo O(n^2) times. This should probably eventually move into a utility
class shared with EarlyCSE and the limited CSE in the SLPVectorizer.

8 years agoA better fix that also works on ppc: add a target tripple.
A better fix that also works on ppc: add a target tripple.

8 years agoFix this test to pass on darwin now that llvm-nm is working.
Fix this test to pass on darwin now that llvm-nm is working.

8 years agoFix llvm-nm to mach OS X's nm on some tests.
Fix llvm-nm to mach OS X's nm on some tests.

There is still a long way to go for llvm-nm, but at least we now match
nm's letter output in the cases we test for.

8 years agoFix PR17764
Fix PR17764

- When selecting BLEND from vselect, the operands need swapping as due to the
  difference between vselect and SSE/AVX's BLEND insn

8 years agoAdded command-line option to output llvm-cov to file.
Added command-line option to output llvm-cov to file.

Added -o option to llvm-cov. If no output file is specified, it defaults

8 years agoLoopVectorizer: Move cse code into its own function
LoopVectorizer: Move cse code into its own function

8 years agoComment some and reformat for clarity beginFunction.
Comment some and reformat for clarity beginFunction.

8 years agoDebugInfo: regenerate test case from Clang to adjust for fixes/improvements
DebugInfo: regenerate test case from Clang to adjust for fixes/improvements

I hit some problems with future work due to the member subprogram of
'a_b's type having a subprogram (an implicit default ctor, !52 in the
pre-commit source) with no name. Clang now generates a name for such a
function but in this case doesn't even emit debug info for it as it is
unused (Clang never emits the body of the ctor, instead just emitting
memset if needed).

8 years agoLoopVectorizer: Perform redundancy elimination on induction variables
LoopVectorizer: Perform redundancy elimination on induction variables

When the loop vectorizer was part of the SCC inliner pass manager gvn would
run after the loop vectorizer followed by instcombine. This way redundancy
(multiple uses) were removed and instcombine could perform scalarization on the
induction variables. Having moved the loop vectorizer to later we no longer run
any form of redundancy elimination before we perform instcombine. This caused
vectorized induction variables to survive that did not before.

On a recent iMac this helps linpack back from 6000Mflops to 7000Mflops.

This should also help lpbench and paq8p.

I ran a Release (without Asserts) build over the test-suite and did not see any
negative impact on compile time.


8 years agoDebugInfo: Improve readability of test case added in r193878
DebugInfo: Improve readability of test case added in r193878

The point is to ensure that the attribute in question
(DW_AT_data_member_location) is associated with the prior tag, so ensure
that we don't see another tag starting between the intended tag and the
desired attribute.

8 years agoDebugInfo: add a test case for data member locations (coverage for r193835)
DebugInfo: add a test case for data member locations (coverage for r193835)

8 years agoFix a test case broken by r193872
Fix a test case broken by r193872

8 years agoAdd comments.
Add comments.

8 years agoDebugInfo: Make pubnames header printing similar to unit header printing
DebugInfo: Make pubnames header printing similar to unit header printing

In a failed attempt to allow the gnu-public-names.ll test case to not
hardcode the size of the unit that the pubnames section referred to I've
at least managed to have unit headers and pubnames headers print out in
a similar style.

This failed to achieve the desired goal because the header in a unit
specifies the length of the unit without the length element of the
header whereas the length in the pubnames includes this element, so the
numbers are off by 4 bytes. I don't know of any arithmetic powers in
FileCheck so the test case can't simply say "CU_LENGTH + 4".

8 years ago[Stackmap] Remove erroneous assert.
[Stackmap] Remove erroneous assert.

8 years agoUse isa<> instead of dyn_cast<> with unused value
Use isa<> instead of dyn_cast<> with unused value

8 years ago[AArch64] Simplify a few of the instruction patterns. No functional change intended.
[AArch64] Simplify a few of the instruction patterns. No functional change intended.

8 years ago[AArch64] Fix assembly string formatting and other coding standard violations.
[AArch64] Fix assembly string formatting and other coding standard violations.

8 years agoRemove linkonce_odr_auto_hide.
Remove linkonce_odr_auto_hide.

linkonce_odr_auto_hide was in incomplete attempt to implement a way
for the linker to hide symbols that are known to be available in every
TU and whose addresses are not relevant for a particular DSO.

It was redundant in that it all its uses are equivalent to
linkonce_odr+unnamed_addr. Unlike those, it has never been connected
to clang or llvm's optimizers, so it was effectively dead.

Given that nothing produces it, this patch just nukes it
(other than the llvm-c enum value).

8 years agoCommenting out this assert because it is causing the build bots to fail. This effect...
Commenting out this assert because it is causing the build bots to fail.  This effectively reverts r193861, but needs to be fixed as part of r193769.

8 years agoFixing an order of evaluation error in an assert.
Fixing an order of evaluation error in an assert.

8 years agoLoopVectorize: Look for consecutive acces in GEPs with trailing zero indices
LoopVectorize: Look for consecutive acces in GEPs with trailing zero indices

If we have a pointer to a single-element struct we can still build wide loads
and stores to it (if there is no padding).

8 years ago[ARM] Add Virtualization subtarget feature and more build attributes in this area
[ARM] Add Virtualization subtarget feature and more build attributes in this area

Add a Virtualization ARM subtarget feature along with adding proper build
attribute emission for Tag_Virtualization_use (encodes Virtualization and
TrustZone) and Tag_MPextension_use.

Also rework test/CodeGen/ARM/2010-10-19-mc-elf-objheader.ll testcase to
something that is more maintainable. This changes the focus of this
testcase away from testing CPU defaults (which is tested elsewhere), onto
specifically testing that attributes are encoded correctly.

8 years ago[ARM] Fix Tag_ABI_HardFP_use build attribute
[ARM] Fix Tag_ABI_HardFP_use build attribute

Fix Tag_ABI_HardFP_use build attribute to handle single precision FP,
replace deprecated Tag_ABI_HardFP_use value of 3 with 0 and also add
some tests for Tag_ABI_VFP_args.

8 years agoConsider (x == -1) unlikely in BranchProbabilityInfo
Consider (x == -1) unlikely in BranchProbabilityInfo

This adds another heuristic to BPI, similar to the existing heuristic that
considers (x == 0) unlikely to be true. As suggested in the PACT'98 paper by
Deitrich, Cheng, and Hwu, -1 is often used to indicate an invalid index, and
equality comparisons with -1 are also unlikely to succeed. Local
experimentation supports this hypothesis: This yields a 1-2% speedup in the
test-suite sqlite benchmark on the PPC A2 core, with no significant

8 years agoLoopVectorizer: If dependency checks fail try runtime checks
LoopVectorizer: If dependency checks fail try runtime checks

When a dependence check fails we can still try to vectorize loops with runtime
array bounds checks.

This helps linpack to vectorize a loop in dgefa. And we are back to 2x of the
scalar performance on a corei7-avx.


8 years agoLoopVectorizer: Clear all member data structures in RuntimeCheck.reset()
LoopVectorizer: Clear all member data structures in RuntimeCheck.reset()

Clear all data structures when resetting the RuntimeCheck data structure.

No test case. This was exposed by an upcomming change.

8 years agoOCaml bindings: fix typo
OCaml bindings: fix typo

Patch by Peter Zotov

8 years agoOCaml bindings: remove unused DONT_BUILD_RELINKED from Makefiles
OCaml bindings: remove unused DONT_BUILD_RELINKED from Makefiles

Patch by Peter Zotov

