10 years agoadd support for ocaml 3.12
add support for ocaml 3.12

10 years agoreplace a couple of single-line comments with /* */ to fix the build of stuff dependi...
replace a couple of single-line comments with /* */ to fix the build of stuff depending on the C headers

10 years agoFix a typo.
Fix a typo.

10 years agoNot all targets have efficient ISel code generation for select instructions.
Not all targets have efficient ISel code generation for select instructions.
For example, the ARM target does not have efficient ISel handling for vector
selects with scalar conditions. This patch adds a TLI hook which allows the
different targets to report which selects are supported well and which selects
should be converted to CF duting codegen prepare.

10 years agoLoopRotation: Make the brute force DomTree update more brute force.
LoopRotation: Make the brute force DomTree update more brute force.

We update until we hit a fixpoint. This is probably slow but also
slightly simplifies the code. It should also fix the occasional
invalid domtrees observed when building with expensive checking.

I couldn't find a case where this had a measurable slowdown, but
if someone finds a pathological case where it does we may have
to find a cleverer way of updating dominators here.

Thanks to Duncan for the test case.

10 years agoRename ANDROIDEABI to Android.
Rename ANDROIDEABI to Android.

Most of the code guarded with ANDROIDEABI are not
ARM-specific, and having no relation with arm-eabi.
Thus, it will be more natural to call this
environment "Android" instead of "ANDROIDEABI".

Note: We are not using ANDROID because several projects
are using "-DANDROID" as the conditional compilation

10 years agoGenerate better select code by allowing the target to use scalar select, and not...
Generate better select code by allowing the target to use scalar select, and not sign-extend.

10 years agoOnly legalise a VSELECT in to bitwise operations if the vector mask bool is zeros...
Only legalise a VSELECT in to bitwise operations if the vector mask bool is zeros or all ones.  A vector bool with just ones isn't suitable for masking with.

No test case unfortunately as i couldn't find a target which fit all
the conditions needed to hit this code.

10 years agoPR13689: Check for backtrace(3) in the cmake build.
PR13689: Check for backtrace(3) in the cmake build.

10 years agoLimit domain conversion to cases where it won't break dep chains.
Limit domain conversion to cases where it won't break dep chains.

NEON domain conversion was too heavy-handed with its widened
registers, which could have stripped existing instructions of their
dependency, leaving them vulnerable to scheduling errors.

10 years agoRevert "Take account of boolean vector contents when promoting a build vector from...
Revert "Take account of boolean vector contents when promoting a build vector from i1 to some other type.  rdar://problem/12210060"

This reverts commit 5dd9e214fb92847e947f9edab170f9b4e52b908f.

Thanks to Duncan for explaining how this should have been done.



10 years agoFix Thumb2 fixup kind in the integrated-as.
Fix Thumb2 fixup kind in the integrated-as.

10 years agoAdd ARM ELF support to llvm-objdump.
Add ARM ELF support to llvm-objdump.

10 years agoCode cleanup: tools/opt/opt.cpp
Code cleanup: tools/opt/opt.cpp

Remove unused local variable.

10 years agoFix typo.
Fix typo.

10 years agoLoopRotation: Check some invariants of the dominator updating code.
LoopRotation: Check some invariants of the dominator updating code.

10 years agoTypos
10 years agoTeach DAG combine a number of tricks to simplify FMA expressions in fast-math mode.
Teach DAG combine a number of tricks to simplify FMA expressions in fast-math mode.

10 years agoFix typo
Fix typo

10 years agollvm/test/CodeGen/X86/fp-fast.ll: Suppress FMA4 on AMD Bulldozer host, corresponding...
llvm/test/CodeGen/X86/fp-fast.ll: Suppress FMA4 on AMD Bulldozer host, corresponding to r162999.

10 years agoFix Atom bots for r163036.
Fix Atom bots for r163036.

10 years agoSelectionDAG: when constructing VZEXT_LOAD from other loads, make sure its
SelectionDAG: when constructing VZEXT_LOAD from other loads, make sure its
output chain is correctly setup.

As an example, if the original load must happen before later stores, we need
to make sure the constructed VZEXT_LOAD is constrained to be before the stores.


10 years agoMark FMA4 instructions as commutable and add them to the folding tables.
Mark FMA4 instructions as commutable and add them to the folding tables.

10 years agoMake sure to build libpthread to check for HAVE_PTHREAD_MUTEX_LOCK.
Make sure to build libpthread to check for HAVE_PTHREAD_MUTEX_LOCK.

Patch by Brad Smith!

10 years agoRemove an unused argument. The MCInst opcode is set in the ConvertToMCInst()
Remove an unused argument.  The MCInst opcode is set in the ConvertToMCInst()
function nowadays.

10 years agoAdd selection of RegOp2MemOpTable3 to canFoldMemoryOperand
Add selection of RegOp2MemOpTable3 to canFoldMemoryOperand

10 years agoAdd MachineInstr::tieOperands, remove setIsTied().
Add MachineInstr::tieOperands, remove setIsTied().

Manage tied operands entirely internally to MachineInstr. This makes it
possible to change the representation of tied operands, as I will do

The constraint that tied uses and defs must be in the same order was too

10 years agoFix PR12359
Fix PR12359

- In addition to undefined, if V2 is zero vector, skip 2nd PSHUFB and POR as
  well as PSHUFB will zero elements with negative indices.

  Patch by Sriram Murali <sriram.murali@intel.com>

10 years agoThe instruction DINS may be transformed into DINSU or DEXTM depending
The instruction DINS may be transformed into DINSU or DEXTM depending
on the size of the extraction and its position in the 64 bit word.

This patch allows support of the dext transformations with mips64 direct
object output.

0 <= msb < 32 0 <= lsb < 32 0 <= pos < 32 1 <= size <= 32
The field is entirely contained in the right-most word of the doubleword

32 <= msb < 64 0 <= lsb < 32 0 <= pos < 32 2 <= size <= 64
The field straddles the words of the doubleword

32 <= msb < 64 32 <= lsb < 64 32 <= pos < 64 1 <= size <= 32
The field is entirely contained in the left-most word of the doubleword

10 years agoMove the GCOVFormat enums into their own namespace per the LLVM coding standard.
Move the GCOVFormat enums into their own namespace per the LLVM coding standard.

10 years agoAdd a comment to explain what's really going on.
Add a comment to explain what's really going on.

10 years agoThe ConvertToMCInst() function can't fail, so remove the now dead Match_ConversionFai...
The ConvertToMCInst() function can't fail, so remove the now dead Match_ConversionFail enum.

10 years agoMark FMA3 instructions as commutable so that the operands to the multiply part can...
Mark FMA3 instructions as commutable so that the operands to the multiply part can be commuted.

10 years agoUse CloneMachineInstr to make a new MI in commuteInstruction to make the code toleran...
Use CloneMachineInstr to make a new MI in commuteInstruction to make the code tolerant of instructions with more than two input operands.

10 years agoAdd support for converting llvm.fma to fma4 instructions.
Add support for converting llvm.fma to fma4 instructions.

10 years agoDon't enforce ordered inline asm operands.
Don't enforce ordered inline asm operands.

I was too optimistic, inline asm can have tied operands that don't
follow the def order.

Fixes PR13742.

10 years agoClean up ProfileDataLoader a bit.
Clean up ProfileDataLoader a bit.

- Overloading operator<< for raw_ostream and pointers is dangerous, it alters
  the behavior of code that includes the header.
- Remove unused ID.
- Use LLVM's byte swapping helpers instead of a hand-coded.
- Make ReadProfilingData work directly on a pointer.

No functionality change.

10 years agollvm/test/CodeGen/X86/vec_select.ll: Fix failure on xmm-less hosts, to add -mattr...
llvm/test/CodeGen/X86/vec_select.ll: Fix failure on xmm-less hosts, to add -mattr=+sse2.

FIXME: Should this be tested with both +avx and -avx,+sse2?

10 years agoCleanups due to feedback. No functionality change. Patch by Alistair.
Cleanups due to feedback. No functionality change. Patch by Alistair.

10 years agoClean up AddedComplexity further after adding UseSSEx
Clean up AddedComplexity further after adding UseSSEx

10 years agoFix a couple of typos in EmitAtomic.
Fix a couple of typos in EmitAtomic.

Thumb2 instructions are mostly constrained to rGPR, not tGPR which is
for Thumb1.


10 years agoX86: Fix encoding of 'movd %xmm0, %rax'
X86: Fix encoding of 'movd %xmm0, %rax'

The assembly string for the VMOVPQIto64rr instruction incorrectly lacked the 'v'
prefix, resulting in mis-assembly of the vanilla movd instruction.

10 years agoWith the fix in r162954/162955 every cvt function returns true. Thus, have
With the fix in r162954/162955 every cvt function returns true.  Thus, have
the ConvertToMCInst() return void, rather then a bool.  Update all the cvt
functions as well.

10 years agoTake account of boolean vector contents when promoting a build vector from i1 to...
Take account of boolean vector contents when promoting a build vector from i1 to some other type.  rdar://problem/12210060

10 years agoTry to make this test more generic to unbreak buildbots.
Try to make this test more generic to unbreak buildbots.

10 years agoTeach the DAG combiner to turn chains of FADDs (x+x+x+x+...) into FMULs by constants...
Teach the DAG combiner to turn chains of FADDs (x+x+x+x+...) into FMULs by constants.  This is only enabled in unsafe FP math mode, since it does not preserve rounding effects for all such constants.

10 years agoFix for r162954. Return the Error.
Fix for r162954.  Return the Error.

10 years agoMove a check to the validateInstruction() function where it more properly belongs.
Move a check to the validateInstruction() function where it more properly belongs.

10 years ago[llvm] Updated the test fold-vector-select so that we test the vector selects exhaust...
[llvm] Updated the test fold-vector-select so that we test the vector selects exhaustively.

10 years agoTypo.
10 years agoWhitespace.
10 years agoWhitespace.
10 years agoHoist a check to eliminate obvious mismatches as early as possible. Also, fix
Hoist a check to eliminate obvious mismatches as early as possible.  Also, fix
an 80-column violation in the generated code.  No functional change intended.

10 years agoCurrently targets that do not support selects with scalar conditions and vector opera...
Currently targets that do not support selects with scalar conditions and vector operands - scalarize the code. ARM is such a target
because it does not support CMOV of vectors. To implement this efficientlyi, we broadcast the condition bit and use a sequence of NAND-OR
to select between the two operands. This is the same sequence we use for targets that don't have vector BLENDs (like SSE2).


10 years ago[ms-inline asm] Add a new function, GetMCInstOperandNum, to the
[ms-inline asm] Add a new function, GetMCInstOperandNum, to the
AsmMatcherEmitter.  This function maps inline assembly operands to MCInst

For example, '__asm mov j, eax' is represented by the follow MCInst:

<MCInst 1460 <MCOperand Reg:0> <MCOperand Imm:1> <MCOperand Reg:0>
             <MCOperand Expr:(j)> <MCOperand Reg:0> <MCOperand Reg:43>>

The first 5 MCInst operands are a result of j matching as a memory operand
consisting of a BaseReg (Reg:0), MemScale (Imm:1), MemIndexReg(Reg:0),
Expr (Expr:(j), and a MemSegReg (Reg:0).  The 6th MCInst operand represents
the eax register (Reg:43).

This translation is necessary to determine the Input and Output Exprs.  If a
single asm operand maps to multiple MCInst operands, the index of the first
MCInst operand is returned.  Ideally, it would return the operand we really
care out (i.e., the Expr:(j) in this case), but I haven't found an easy way
of doing this yet.

10 years agoIntroduce 'UseSSEx' to force SSE legacy encoding
Introduce 'UseSSEx' to force SSE legacy encoding

- Add 'UseSSEx' to force SSE legacy insn not being selected when AVX is

  As the penalty of inter-mixing SSE and AVX instructions, we need
  prevent SSE legacy insn from being generated except explicitly
  specified through some intrinsics. For patterns supported by both
  SSE and AVX, so far, we force AVX insn will be tried first relying on
  AddedComplexity or position in td file. It's error-prone and
  introduces bugs accidentally.

  'UseSSEx' is disabled when AVX is turned on. For SSE insns inherited
  by AVX, we need this predicate to force VEX encoding or SSE legacy
  encoding only.

  For insns not inherited by AVX, we still use the previous predicates,
  i.e. 'HasSSEx'. So far, these insns fall into the following
  * SSE insns with MMX operands
  * SSE insns with GPR/MEM operands only (xFENCE, PREFETCH, CLFLUSH,
    CRC, and etc.)
  * SSE4A insns.
  * MMX insns.
  * x87 insns added by SSE.

2 test cases are modified:

 - test/CodeGen/X86/fast-isel-x86-64.ll
   AVX code generation is different from SSE one. 'vcvtsi2sdq' cannot be
   selected by fast-isel due to complicated pattern and fast-isel
   fallback to materialize it from constant pool.

 - test/CodeGen/X86/widen_load-1.ll
   AVX code generation is different from SSE one after fixing SSE/AVX
   inter-mixing. Exec-domain fixing prefers 'vmovapd' instead of

10 years agoADTTests: [CMake] Exclude DenseMapTest.cpp and SmallVectorTest.cpp on MSVC9 due to...
ADTTests: [CMake] Exclude DenseMapTest.cpp and SmallVectorTest.cpp on MSVC9 due to its bug.

10 years agoApply "/Og-" also to MSC15(aka VS9) on VMCore/Function.cpp.
Apply "/Og-" also to MSC15(aka VS9) on VMCore/Function.cpp.

10 years agoPPCISelLowering.cpp: Fix r162725.
PPCISelLowering.cpp: Fix r162725.

[Tobias von Koch] What's happening here is that the CR6SET/CR6UNSET is breaking the chain of register copies glued to the function call (BL_SVR4 node). The scheduler then moves other instructions in between those and the function call, which isn't good!

Right. That's the case where there is no chain of register copies before the call, so InFlag == 0... Attached is a new revision of the patch which should fix this for good.

10 years agoPPCISelLowering.cpp: Whitespace.
PPCISelLowering.cpp: Whitespace.

10 years agotest
10 years agoFix test case.
Fix test case.

10 years agoLoopRotate: Also rotate loops with multiple exits.
LoopRotate: Also rotate loops with multiple exits.

The old PHI updating code in loop-rotate was replaced with SSAUpdater a while
ago, it has no problems with comples PHIs. What had to be fixed is detecting
whether a loop was already rotated and updating dominators when multiple exits
were present.

This change increases overall code size a bit, mostly due to additional loop
unrolling opportunities. Passes test-suite and selfhost with -verify-dom-info.
Fixes PR7447.

Thanks to Andy for the input on the domtree updating code.

10 years agoInstCombine: Fix comment to reflect the code.
InstCombine: Fix comment to reflect the code.

10 years agoDon't use MCInstrDesc flags for implicit operands.
Don't use MCInstrDesc flags for implicit operands.

When a MachineInstr is constructed, its implicit operands are added
first, then the explicit operands are inserted before the implicits.

MCInstrDesc has oprand flags like early clobber and operand ties that
apply to the explicit operands.

Don't look at those flags when the implicit operands are first added in
the explicit operands's positions.

10 years agoWhitespace
10 years agoIt is illegal to transform (sdiv (ashr X c1) c2) -> (sdiv x (2^c1 * c2)),
It is illegal to transform (sdiv (ashr X c1) c2)  -> (sdiv x (2^c1 * c2)),
because C always rounds towards zero.

Thanks Dirk and Ben.

10 years agoAdd support for moving pure S-register to NEON pipeline if desired
Add support for moving pure S-register to NEON pipeline if desired

10 years agoremove old docs
remove old docs

10 years agoRefactor fetching file/line info from DWARFContext to simplify the
Refactor fetching file/line info from DWARFContext to simplify the
code and allow better code reuse. Make the code a bit more conforming
to LLVM code style.
No functionality change.

10 years agoAdd FMA to switch statement in VectorLegalizer::LegalizeOp so that it can be expanded...
Add FMA to switch statement in VectorLegalizer::LegalizeOp so that it can be expanded when it isn't legal.

10 years agoAdd support for FMA to WidenVectorResult.
Add support for FMA to WidenVectorResult.

10 years agoOnly perform DAG combine on FMAs of legal types.
Only perform DAG combine on FMAs of legal types.

10 years agoPass by pointer and not std::string.
Pass by pointer and not std::string.

10 years agoShould put test case under test/ExecutionEngine/MCJIT/
Should put test case under test/ExecutionEngine/MCJIT/

10 years agoRevert r162855 in favor of changing clang to emit the absolute coverage file path.
Revert r162855 in favor of changing clang to emit the absolute coverage file path.

10 years agoFix HashString's Bernstein hash to use unsigned chars, as is usually done.
Fix HashString's Bernstein hash to use unsigned chars, as is usually done.

Changes the hash result for strings containing characters
with values >= 128, such as UTF8 strings (not normal ASCII).

Changed mostly so we match other implementations.

10 years agoFix PR13727
Fix PR13727

- The root cause is that target constant materialization in X86 fast-isel
  creates a PC-rel addressing which may overflow 32-bit range in non-Small code
  model if .rodata section is allocated too far away from code segment in
  MCJIT, which uses Large code model so far.
- Follow the similar logic to fix non-Small code model in fast-isel by skipping
  non-Small code model.

10 years agoAdd a bit of documentation to copyPhysReg.
Add a bit of documentation to copyPhysReg.

10 years agoVerify the order of tied operands in inline asm.
Verify the order of tied operands in inline asm.

When there are multiple tied use-def pairs on an inline asm instruction,
the tied uses must appear in the same order as the defs.

It is possible to write an LLVM IR inline asm instruction that breaks
this constraint, but there is no reason for a front end to emit the
operands out of order.

The gnu inline asm syntax specifies tied operands as a single read/write
constraint "+r", so ouf of order operands are not possible.

10 years agoExplicitly cast an expression to bool before handing it off to __builtin_expect.
Explicitly cast an expression to bool before handing it off to __builtin_expect.

Avoids surprises when someone uses LLVM_(UN)LIKELY with an integer.

10 years agoAdd some __builtin_expect magic to StringMap.
Add some __builtin_expect magic to StringMap.

Tombstones and full hash collisions are rare, mark the "empty"
and "no collision" paths as likely. The bug in simplifycfg
that prevented the hints from being picked during selfhost
up was fixed recently :)

10 years agoReplace the BUILTIN_EXPECT macro with a less horrible LLVM_LIKELY/LLVM_UNLIKELY inter...
Replace the BUILTIN_EXPECT macro with a less horrible LLVM_LIKELY/LLVM_UNLIKELY interface.

10 years agoAllow targets to specify a minimum supported NOP size when performing NOP padding...
Allow targets to specify a minimum supported NOP size when performing NOP padding.  If the desired padding is smaller than the supported NOP size,
we will enlarge the padding to make it work.

10 years agoSet the isTied flags when building INLINEASM MachineInstrs.
Set the isTied flags when building INLINEASM MachineInstrs.

For normal instructions, isTied() is set automatically by addOperand(),
based on MCInstrDesc, but inline asm has tied operands outside the

10 years agoPreserve branch profile metadata during switch formation.
Preserve branch profile metadata during switch formation.

Patch by Michael Ilseman!
This fixes SimplifyCFGOpt::FoldValueComparisonIntoPredecessors to preserve metata when folding conditional branches into switches.

void foo(int x) {
  if (x == 0)
  else if (__builtin_expect(x == 10, 1))
  else if (x == 20)


|  \
|   X0
|  \
|   X10
|  \
E   X20

Merge B0-B10:
w(B0-X0) = w(B0-X0)*sum-weights(B10) = w(B0-X0) * (w(B10-X10) + w(B10-B20))
w(B0-X10) = w(B0-B10) * w(B10-X10)
w(B0-B20) = w(B0-B10) * w(B10-B20)

B0 __
| \  \
| X10 X0
|  \
E  X20

Merge B0-B20:
w(B0-X0) = w(B0-X0) * sum-weights(B20) = w(B0-X0) * (w(B20-E) + w(B20-X20))
w(B0-X10) = w(B0-X10) * sum-weights(B20) = ...
w(B0-X20) = w(B0-B20) * w(B20-X20)
w(B0-E) = w(B0-B20) * w(B20-E)

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@162868 91177308-0d34-0410-b5e6-96231b3b80d8

10 years agoRename hasVolatileMemoryRef() to hasOrderedMemoryRef().
Rename hasVolatileMemoryRef() to hasOrderedMemoryRef().

Ordered memory operations are more constrained than volatile loads and
stores because they must be ordered with respect to all other memory

10 years agoAdd MachineMemOperand::isUnordered().
Add MachineMemOperand::isUnordered().

This means the same as LoadInst/StoreInst::isUnordered(), and implies

Atomic loads and stored are also ordered, and this is the right method
to check if it is safe to reorder memory operations. Ordered atomics
can't be reordered wrt normal loads and stores, which is a stronger
constraint than volatile.

10 years agoDon't move normal loads across volatile/atomic loads.
Don't move normal loads across volatile/atomic loads.

It is technically allowed to move a normal load across a volatile load,
but probably not a good idea.

It is not allowed to move a load across an atomic load with
Ordering > Monotonic, and we model those with MOVolatile as well.

I recently removed the mayStore flag from atomic load instructions, so
they don't need a pseudo-opcode. This patch makes up for the difference.

10 years agofix C++ comment in C header
fix C++ comment in C header

10 years agoUse the full path to output the .gcda file.
Use the full path to output the .gcda file.

This lets the user run the program from a different directory and still have the
.gcda files show up in the correct place.

10 years agoReserve space for the mandatory traceback fields on PPC64.
Reserve space for the mandatory traceback fields on PPC64.

We need to reserve space for the mandatory traceback fields,
though leaving them as zero is appropriate for now.

Although the ABI calls for these fields to be filled in fully, no
compiler on Linux currently does this, and GDB does not read these
fields.  GDB uses the first word of zeroes during exception handling to
find the end of the function and the size field, allowing it to compute
the beginning of the function.  DWARF information is used for everything
else.  We need the extra 8 bytes of pad so the size field is found in
the right place.

As a comparison, GCC fills in a few of the fields -- language, number
of saved registers -- but ignores the rest.  IBM's proprietary OSes do
make use of the full traceback table facility.

Patch by Bill Schmidt.

10 years agoUse ArrayRef instead of SmallVector when passing vector into function.
Use ArrayRef instead of SmallVector when passing vector into function.

10 years agoVerify the consistency of inline asm operands.
Verify the consistency of inline asm operands.

The operands on an INLINEASM machine instruction are divided into groups
headed by immediate flag operands. Verify this structure.

Extract verifyTiedOperands(), and only call it for non-inlineasm

10 years agoClean this up slightly, doesn't really fall through.
Clean this up slightly, doesn't really fall through.

10 years agoRefactor setExecutionDomain to be clearer about what it's doing and more robust.
Refactor setExecutionDomain to be clearer about what it's doing and more robust.

10 years agoMake helper function static.
Make helper function static.

10 years agoMake MemoryBuiltins aware of TargetLibraryInfo.
Make MemoryBuiltins aware of TargetLibraryInfo.

This disables malloc-specific optimization when -fno-builtin (or -ffreestanding)
is specified. This has been a problem for a long time but became more severe
with the recent memory builtin improvements.

Since the memory builtin functions are used everywhere, this required passing
TLI in many places. This means that functions that now have an optional TLI
argument, like RecursivelyDeleteTriviallyDeadFunctions, won't remove dead
mallocs anymore if the TLI argument is missing. I've updated most passes to do
the right thing.

Fixes PR13694 and probably others.

10 years agoConvert FMA4 patterns to use target specific nodes instead of intrinsics to align...
Convert FMA4 patterns to use target specific nodes instead of intrinsics to align with FMA3.

