Inline a function when the always_inline attribute
Inline a function when the always_inline attribute
is set even when it contains a indirect branch.
The attribute overrules correctness concerns
like the escape of a local block address.

This is for rdar://16501761

Teach LLVMConfigVersion.cmake to behave as find_package() expects.
Teach LLVMConfigVersion.cmake to behave as find_package() expects.

Patch by Brad King

Add support for a patch version to the cmake system.
Add support for a patch version to the cmake system.

Patch by Brad King

[c++11] Tidy up AsmPrinter.cpp.
[c++11] Tidy up AsmPrinter.cpp.

Range'ify loops and tidy up some by-reference handling. No functional

iterator_range for machine block terminators.
iterator_range for machine block terminators.

Added new functionality to LLVM C API to use DiagnosticInfo to handle errors
Added new functionality to LLVM C API to use DiagnosticInfo to handle errors

Patch by: Darren Powell

Replacing a non-ASCII character in a comment with an ASCII character. Fixes a C4819 warning in MSVC.
Replacing a non-ASCII character in a comment with an ASCII character. Fixes a C4819 warning in MSVC.

Allow diagnostic handlers to check for optimization remarks.
Allow diagnostic handlers to check for optimization remarks.

When optimization remarks are enabled via the driver flag -Rpass, we
should allow the FE diagnostic handler to check if the given pass name
needs a diagnostic.

We were unconditionally checking the pattern defined in opt's
-pass-remarks flag. This was causing the FE to not emit any diagnostics.

Differential Revision: http://reviews.llvm.org/D3362

Test commit - Added a new line
Test commit - Added a new line

[mips] Use TwoOperandAliasConstraint for shift instructions.
[mips] Use TwoOperandAliasConstraint for shift instructions.

This enables TableGen to generate an additional two operand
matcher for our shift_rotate_imm and shift_rotate_reg class of instructions.

The tests were also updated so that they include now encoding information
for all affected instructions.

[mips] Add initial support for NaN2008 in the back-end.
[mips] Add initial support for NaN2008 in the back-end.

This is so that EF_MIPS_NAN2008 is set if we are using IEEE 754-2008
NaN encoding (-mnan=2008). This patch also adds support for parsing
'.nan legacy' and '.nan 2008' assembly directives. The handling of
these directives should match GAS' behaviour i.e., the last directive
in use sets the ELF header bit (EF_MIPS_NAN2008).

ARM64: silence sign-comparison warning.
ARM64: silence sign-comparison warning.

AArch64/ARM64: port some NEON tests to ARM64
AArch64/ARM64: port some NEON tests to ARM64

These ones used completely different sets of intrinsics, so the only way to do
it is create a separate ARM64 copy and change them all.

Other than that, CodeGen was straightforward, no deficiencies detected here.

AArch64/ARM64: produce correct relocation for conditional branches.
AArch64/ARM64: produce correct relocation for conditional branches.

[mips] Indentation
[mips] Indentation

[mips] Fix emission of '.option pic0' for MIPS-IV.
[mips] Fix emission of '.option pic0' for MIPS-IV.

Summary: This was a case of incorrect usage of hasMips64() vs isABI_N64()

[mips] Correct r206370 to account for non-Linux targets using the small data section.
[mips] Correct r206370 to account for non-Linux targets using the small data section.

This should fix the ninja-x64-msvc-RA-centos6 builder.

I suspect the check in MipsSubtarget.cpp is incorrect and is really trying to
check for a bare-metal target rather and anything other than linux. I'll
investigate this.

9 years ago[asan] add two new hidden compile-time flags for asan: asan-instrumentation-with...
[asan] add two new hidden compile-time flags for asan: asan-instrumentation-with-call-threshold and asan-memory-access-callback-prefix. This is part of the workaround for PR17409 (instrument huge functions with callbacks instead of inlined code). These flags will also help us experiment with kasan (kernel-asan) and clang

ARM64: specify triple so that Linux tests pass
ARM64: specify triple so that Linux tests pass

Now that Linux is trying to reparse all inline asm it chokes on the different
comment character in this test.

AArch64/ARM64: add another set of tests from AArch64
AArch64/ARM64: add another set of tests from AArch64

Another batch with no code changes.

AArch64/ARM64: port across stub handling for ELF C++ exceptions.
AArch64/ARM64: port across stub handling for ELF C++ exceptions.

The most important part here is that we should actuall emit the stubs we refer
to in the exception table, but as a side issue this uses more sensible & GCC
compatible representations for some of the bits of information.

ARM64: use 32-bit moves for constants where possible.
ARM64: use 32-bit moves for constants where possible.

If we know that a particular 64-bit constant has all high bits zero, then we
can rely on the fact that 32-bit ARM64 instructions automatically zero out the
high bits of an x-register. This gives the expansion logic less constraints to
satisfy and so sometimes allows it to pick better sequences.

Came up while porting test/CodeGen/AArch64/movw-consts.ll: this will allow a
32-bit MOVN to be used in @test8 soon.

ARM64: use the integrated assembler on ELF.
ARM64: use the integrated assembler on ELF.

[mips] Emit '.set nomicromips' before a function's entry label
if not in micromips mode.
[mips] Emit '.set nomicromips' before a function's entry label
if not in micromips mode.

The test (elf_st_other.ll) was renamed as the name and description didn't
make sense as the test wasn't checking any symbol table entry.

9 years agoFixing a compile error in debug versions of MSVC. It seems that the range-based for...
Fixing a compile error in debug versions of MSVC. It seems that the range-based for loop is confused by the DEBUG macro expansion unless a compound statement is used.

9 years ago[LCG] Stop playing fast and loose with reference members and assignment.
[LCG] Stop playing fast and loose with reference members and assignment.
It doesn't work. I'm still cleaning up all the places where I blindly
followed this pattern. There are more to come in this code too.

As a benefit, this lets the default copy and move operations Just Work.

[Allocator] Make BumpPtrAllocator movable and move assignable.
[Allocator] Make BumpPtrAllocator movable and move assignable.

[mips] Correct callee saved list for the N32 ABI and enable test
[mips] Correct callee saved list for the N32 ABI and enable test

Summary: Depends on D3339

Reviewers: matheusalmeida, vmedic

Reviewed By: matheusalmeida

[mips] Add calling convention tests covering O32, N32, and N64.
[mips] Add calling convention tests covering O32, N32, and N64.

I had difficulty finding tests for the N32 and N64 ABI so I've added a
collection of calling convention tests based on the document MIPS ABIs
Described (MD00305), the MIPSpro N32 Handbook, and the SYSV ABI. Where the
documents/implementations disagree, I've used GCC to resolve the conflict.

A few interesting details:
* For N32, LLVM uses 64-bit pointers when saving $ra despite pointers being
  32-bit. I've yet to find a supporting statement in the ABI documentation but
  the current behaviour matches GCC.

* For O32, the non-variable portion of a varargs argument list is also subject
  to the rule that floating-point is passed via GPR's (on N32/N64 only the
  variable portion is subject to this rule). This agrees with GCC's behaviour
  and the SYSV ABI but contradicts part of the MIPSpro N32 Handbook which talks about O32's behaviour.

* The N32 implementation has the wrong callee-saved register list.
  (I already have a fix for this but will commit it as a follow-up).

I've left RUN-TODO lines in for O32 on MIPS64. I don't plan to support this case
for now but we should revisit it.

Reviewers: matheusalmeida, vmedic

Reviewed By: matheusalmeida

[Allocator] Nuke to useless functions. The implicit ones are sufficient
here (obviously).
[Allocator] Nuke to useless functions. The implicit ones are sufficient
here (obviously).

ARM64: explicitly ask for Apple NEON syntax so test passes on Linux
ARM64: explicitly ask for Apple NEON syntax so test passes on Linux

ARM64: mark x7 as used when an i128 gets shunted onto the stack.
ARM64: mark x7 as used when an i128 gets shunted onto the stack.

The second half of a split i128 was ending up in x7, which is not a good thing.

This is another part of PR19432.

DAGCombiner: don't optimise non-existant litpool load
DAGCombiner: don't optimise non-existant litpool load

This particular DAG combine is designed to kick in when both ConstantFPs will
end up being loaded via a litpool, however those nodes have a semi-legal
status, dictated by isFPImmLegal so in some cases there wouldn't have been a
litpool in the first place. Don't try to be clever in those circumstances.

Simplify a static_assert so VS2013 can build it
Simplify a static_assert so VS2013 can build it

COFF: fix an off by one error
COFF: fix an off by one error

Adjust the tests to validate the number of auxiliary entries used to store the

Thanks to majnemer's sharp eye for catching the missing - 1 in the round up

Convert SelectionDAG::getVTList to use ArrayRef
Convert SelectionDAG::getVTList to use ArrayRef

[C++11] More 'nullptr' conversion. In some cases just using a boolean check instead of comparing to nullptr.
[C++11] More 'nullptr' conversion. In some cases just using a boolean check instead of comparing to nullptr.

COFF: add support for .file symbols
COFF: add support for .file symbols

Add support for emitting .file records.  This is mostly a quality of
implementation change (more complete support for COFF file emission) that was
noticed while working on COFF file emission for Windows on ARM.

A .file record is emitted as a symbol with storage class FILE (103) and the name
".file".  A series of auxiliary format 4 records follow which contain the file
name.  The filename is stored as an ANSI string and is padded with NULL if the
length is not a multiple of COFF::SymbolSize (18).

tools: fix invalid printing, buffer overrun in llvm-readobj
tools: fix invalid printing, buffer overrun in llvm-readobj

All auxiliary records are consumed when accessing a File record.

Target: whitespace
Target: whitespace

R600: Extend r600 sign_extend_inreg tests for EG
R600: Extend r600 sign_extend_inreg tests for EG

Patch by: Jan Vesely <jan.vesely@rutgers.edu>

R600: Expand sign extension of vectors.
R600: Expand sign extension of vectors.

Setting vector types to expand will result in scalarization on pre SI hw,
as those gpus don't have vector shifts either.
Expand also i32 vectors, this helps llvm make the correct decision
about scalarizing the vector ops.

v2: move setOperation() calls to R600ISelLowering.cpp.
    cleanup the SI code to make it obvious that this patch does is nop for SI

Patch by: Jan Vesely <jan.vesely@rutgers.edu>

[ARM64,C++11] Tidy up branch relaxation a bit w/ c++11.

No functional change.
[ARM64,C++11] Tidy up branch relaxation a bit w/ c++11.

No functional change.

ARM64: Nuke some dead code.

Missed in previous commit.
ARM64: Nuke some dead code.

Missed in previous commit.

9 years ago[ARM64,C++11] Clean up the ARM64 LOH collection pass.
[ARM64,C++11] Clean up the ARM64 LOH collection pass.

Range'ify a bunch of loops, mainly. As a result, we have a variety
of objects via reference rather than by pointer, so propogate that
through the various helper functions where it makes sense.

R600/SI: Print code size along with used registers
R600/SI: Print code size along with used registers

R600/SI: Print more immediates in hex format
R600/SI: Print more immediates in hex format

Print in decimal for inline immediates, and hex otherwise. Use hex
always for offsets in addressing offsets.

This approximately matches what the shader compiler does.

9 years agoR600/SI: Cleanup parsing of register names.
R600/SI: Cleanup parsing of register names.

Try to figure out the class and number of subregisters.

Make this test not match its own filename, when being run from a path that includes the string 'add'.
Make this test not match its own filename, when being run from a path that includes the string 'add'.

R600/SI: Fix loads of i1
R600/SI: Fix loads of i1

9 years agoRegionInfo: Do not access a value that was just moved away
RegionInfo: Do not access a value that was just moved away

This fixes a regression introduced in r206310.

9 years ago[Allocator] Fold the two templated overloads into a single one with
[Allocator] Fold the two templated overloads into a single one with
a default argument. The allocator interface we're modeling doesn't
distinguish between array and non-array allocation.

9 years ago[Allocator] Remove a really problematic overload. This is very confusing
[Allocator] Remove a really problematic overload. This is very confusing
because there is another (size_t, size_t) overload of Allocator, and the
only distinguishing factor is that one is a tempalte and the other
isn't. There was only one usage of this and that one was easily
converted to carry the alignment constraint in the type itself.

9 years agoMake FastISel::SelectInstruction return before target specific fast-isel code
Make FastISel::SelectInstruction return before target specific fast-isel code
handles Intrinsic::trap if TargetOptions::TrapFuncName is set.

This fixes a bug in which the trap function was not taken into consideration
when a program was compiled without optimization (at -O0).


[X86] Improve the lowering of packed shifts by constant build_vector.
[X86] Improve the lowering of packed shifts by constant build_vector.

This patch teaches the backend how to efficiently lower logical and
arithmetic packed shifts on both SSE and AVX/AVX2 machines.

When possible, instead of scalarizing a vector shift, the backend should try
to expand the shift into a sequence of two packed shifts by immedate count
followed by a MOVSS/MOVSD.

  (v4i32 (srl A, (build_vector < X, Y, Y, Y>)))

Can be rewritten as:
  (v4i32 (MOVSS (srl A, <Y,Y,Y,Y>), (srl A, <X,X,X,X>)))

[with X and Y ConstantInt]

The advantage is that the two new shifts from the example would be lowered into
X86ISD::VSRLI nodes. This is always cheaper than scalarizing the vector into
four scalar shifts plus four pairs of vector insert/extract.

[ARM64] Set default CPU to generic instead of cyclone.
[ARM64] Set default CPU to generic instead of cyclone.

9 years agoRevert r191049/r191059 as it can produce wrong code (see PR17975).
Revert r191049/r191059 as it can produce wrong code (see PR17975).
It has already been reverted on the 3.4 branch in r196521.

Use unique_ptr to manage ownership of child Regions within llvm::Region
Use unique_ptr to manage ownership of child Regions within llvm::Region

Add lifetime markers for allocas created to hold byval arguments, make them
appear in the InlineFunctionInfo.
Add lifetime markers for allocas created to hold byval arguments, make them
appear in the InlineFunctionInfo.

Split byval argument initialization so the memcpy(s) are injected at the
beginning of the first new block after inlining.
Split byval argument initialization so the memcpy(s) are injected at the
beginning of the first new block after inlining.

LTO: Add more loop simplification passes to LTO
LTO: Add more loop simplification passes to LTO

Similar to r202051, add missing loop simplification passes to the LTO
optimization pipeline.

Patch by Rafael Espindola.

verify-di: Add back braces for MSVC compatability

Fixup after r206300.
verify-di: Add back braces for MSVC compatability

Fixup after r206300.


verify-di: Implement DebugInfoVerifier
verify-di: Implement DebugInfoVerifier

Implement DebugInfoVerifier, which steals verification relying on
DebugInfoFinder from Verifier.

  - Adds LegacyDebugInfoVerifierPassPass, a ModulePass which wraps
    DebugInfoVerifier.  Uses -verify-di command-line flag.

  - Change verifyModule() to invoke DebugInfoVerifier as well as

  - Add a call to createDebugInfoVerifierPass() wherever there was a
    call to createVerifierPass().

This implementation as a module pass should sidestep efficiency issues,
allowing us to turn debug info verification back on.


verify-di: split out VerifierSupport
verify-di: split out VerifierSupport

Split out assertion and output helpers from Verifier in preparation for
writing the DebugInfoVerifier.


Use unique_ptr to manage PassInfo instances in the PassRegistry
Use unique_ptr to manage PassInfo instances in the PassRegistry

MipsAsmParser.cpp: Fix vg_leak in MipsOperand::CreateMem(). Mem.Base is managed by k_Memory itself.
MipsAsmParser.cpp: Fix vg_leak in MipsOperand::CreateMem(). Mem.Base is managed by k_Memory itself.

MipsAsmParser::ParseRegister(): Be responsible to delete an Operand on a temporary Operands.
MipsAsmParser::ParseRegister(): Be responsible to delete an Operand on a temporary Operands.

9 years agoAArch64/ARM64: enable more AArch64 tests on ARM64.
AArch64/ARM64: enable more AArch64 tests on ARM64.

No code changes for this bunch, just some test rejigs.

AArch64/ARM64: add missing pattern for extending load.
AArch64/ARM64: add missing pattern for extending load.

AArch64/ARM64: produce correct relocation for conditional branches.
AArch64/ARM64: only mangle MOVZ/MOVN during encoding when needed

Sometimes we need emit the bits that would actually be a MOVN when producing a
relocated MOVZ instruction (don't ask). But not always, a check which ARM64 got
wrong until now.

AArch64/ARM64: add support for large code-model jump tables.
AArch64/ARM64: add support for large code-model jump tables.

I've left the MachO CodeGen as it is, there's a reasonable chance it should use
the GOT like ConstPools, but I'm not certain.

AArch64/ARM64: add patterns for various commutations of FNMADD.
AArch64/ARM64: add patterns for various commutations of FNMADD.

AArch64/ARM64: add half as a storage type on ARM64.
AArch64/ARM64: add half as a storage type on ARM64.

This brings it into line with the AArch64 behaviour and should open the way for
certain OpenCL features.

AArch64/ARM64: copy patterns for fixed-point conversions
AArch64/ARM64: copy patterns for fixed-point conversions

Code is mostly copied directly across, with a slight extension of the
ISelDAGToDAG function so that it can cope with the floating-point constants
being behind a litpool.

ARM64: add constraints to various FastISel operations
ARM64: add constraints to various FastISel operations

FastISel: constrain the RegClass of operands when emitting instructions.
FastISel: constrain the RegClass of operands when emitting instructions.

ARM64 suffered multiple -verify-machineinstr failures (principally over the
xsp/xzr issue) because FastISel was completely ignoring which subset of the
general-purpose registers each instruction required.

More fixes are coming in ARM64 specific FastISel, but this should cover the
generic problems.

AArch64/ARM64: add more arm64 lines to AArch64 regression tests
AArch64/ARM64: add more arm64 lines to AArch64 regression tests

AArch64/ARM64: add dp tests from AArch64
AArch64/ARM64: add dp tests from AArch64

ARM64AsmParser.cpp: Fix vg_leak in MC/ARM64/fp-encoding.s.
ARM64AsmParser.cpp: Fix vg_leak in MC/ARM64/fp-encoding.s.

Optional hash symbol feature support for ARM64
Optional hash symbol feature support for ARM64

9 years agoCurrent definition of subtract with immediate instruction aliases uses CodeGenOnly...
Current definition of subtract with immediate instruction aliases uses CodeGenOnly defined instructions and post matcher expansion methods to emit real instructions add with immediate. However, they can directly alias add with immediate instruction and remove unnecessary definitions and code in MipsAsmParser.cpp. This patch makes no change in functionality, just removes unnecessary definitions and code.

vect.omp.persistence.ll REQUIRES asserts due to
vect.omp.persistence.ll REQUIRES asserts due to -debug-only.

9 years ago[Allocator] Finally, finish nuking the redundant code that led me here
[Allocator] Finally, finish nuking the redundant code that led me here
by removing the MallocSlabAllocator entirely and just using
MallocAllocator directly. This makes all off these allocators expose and
utilize the same core interface.

The only ugly part of this is that it exposes the fact that the JIT
allocator has no real handling of alignment, any more than the malloc
allocator does. =/ It would be nice to fix both of these to support
alignments, and then to leverage that in the BumpPtrAllocator to do less
over allocation in order to manually align pointers. But, that's another
patch for another day. This patch has no functional impact, it just
removes the somewhat meaningless wrapper around MallocAllocator.

9 years agoD3348 - [BUG] "Rotate Loop" pass kills "llvm.vectorizer.enable" metadata
D3348 - [BUG] "Rotate Loop" pass kills "llvm.vectorizer.enable" metadata

9 years ago[Allocator] Pass the size to the deallocation function. This, on some
[Allocator] Pass the size to the deallocation function. This, on some
allocation libraries, may allow more efficient allocation and
deallocation. It at least makes the interface implementable by the JIT
memory manager.

However, this highlights problematic overloading between the void* and
the T* deallocation functions. I'm looking into a better way to do this,
but as it happens, it comes up rarely in the codebase.

9 years agoX86JITInfo: [x86] Rework r206240, X86CompilationCallback_SSE() should be called for...
X86JITInfo: [x86] Rework r206240, X86CompilationCallback_SSE() should be called for SSE-enabled code generator, even if LLVM is not built with -msse.

9 years ago[Allocator] Fix r206256 which got the enabling case backwards on these
[Allocator] Fix r206256 which got the enabling case backwards on these
overloads. This doesn't matter *that* much yet, but it will in
a subsequent patch. I had tested the original pattern, but not my
attempt to pacify MSVC. This at least appears to work. Still fixing the
rest of the fallout in the final patch that uses these overloads, but it
will follow shortly.

9 years agoFix broken build of llvm using clang.
Fix broken build of llvm using clang.

9 years ago[Allocator] MSVC apparantly has broken SFINAE context handling of
[Allocator] MSVC apparantly has broken SFINAE context handling of
'sizeof(T)' for T == void and produces a hard error. I cannot fathom why
this is OK. Oh well. switch to an explicit test for being the
(potentially qualified) void type, which is the only specific case I was
worried about. Hopefully this survives the libstdc++ build bots which
have limited type traits implementations...

9 years agoBreak PseudoSourceValue out of the Value hierarchy. It is now the root of its own...
Break PseudoSourceValue out of the Value hierarchy. It is now the root of its own tree containing FixedStackPseudoSourceValue (which you can use isa/dyn_cast on) and MipsCallEntry (which you can't). Anything that needs to use either a PseudoSourceValue* and Value* is strongly encouraged to use a MachinePointerInfo instead.

9 years ago[C++11] More 'nullptr' conversion. In some cases just using a boolean check instead...
[C++11] More 'nullptr' conversion. In some cases just using a boolean check instead of comparing to nullptr.

9 years agoAdd a DenseMapInfo specialization for PointerUnion. In tree user to land shortly.
Add a DenseMapInfo specialization for PointerUnion. In tree user to land shortly.

9 years ago[C++11] More 'nullptr' conversion. In some cases just using a boolean check instead...
[C++11] More 'nullptr' conversion. In some cases just using a boolean check instead of comparing to nullptr.

9 years ago[Allocator] Constrain the Deallocate templated overloads to only apply
[Allocator] Constrain the Deallocate templated overloads to only apply
to types which we can compute the size of. The comparison with zero
isn't actually interesting here, it's mostly about putting sizeof into
a sfinae context.

This is particular important for Deallocate as otherwise the void*
overload can quickly become ambiguous.

9 years agoUse unique_ptr to manage TypePromotionActions owned by TypePromotionTransaction.
Use unique_ptr to manage TypePromotionActions owned by TypePromotionTransaction.

9 years agoUse unique_ptr to manage ownership of GCFunctionInfos in GCStrategy
Use unique_ptr to manage ownership of GCFunctionInfos in GCStrategy

9 years agoUse unique_ptr for the result of Registry entries.
Use unique_ptr for the result of Registry entries.

9 years agoUse unique_ptr to manage ownership of GCStrategy objects in GCMetadata
Use unique_ptr to manage ownership of GCStrategy objects in GCMetadata

9 years agoUse unique_ptr for section/segment ownership in WinCOFFObjectWriter
Use unique_ptr for section/segment ownership in WinCOFFObjectWriter

9 years agoUse unique_ptr to own MCFunctions within MCModule.
Use unique_ptr to own MCFunctions within MCModule.

MCModule's ctor had to be moved out of line so the definition of
MCFunction was available. (ctor requires the dtor of members (in case
the ctor throws) which required access to the dtor of MCFunction)

