9 years agoCMake: polish the Windows packaging rules
CMake: polish the Windows packaging rules

This tweaks the CMake rules for building an installation package on Windows:
 - Sets license file (otherwise nsis shows an ugly default)
 - Adds LLVM logo
 - Shows "do you want to add this to the system path" dialog.

Differential Revision: http://llvm-reviews.chandlerc.com/D1414

9 years agoTighten up the yamilizer so it stops eliding empty sequences if the embedded empty...
Tighten up the yamilizer so it stops eliding empty sequences if the embedded empty sequence is the first key/value in a map which is itself in a sequence.

Patch with help from Nick Kledzik.

9 years agoDon't do FoldCmpLoadFromIndexedGlobal for non inbounds GEPs
Don't do FoldCmpLoadFromIndexedGlobal for non inbounds GEPs

This path wasn't tested before without a datalayout,
so add some more tests and re-run with and without one.

9 years agoFix spelling
Fix spelling

9 years agoRemove empty directory.
Remove empty directory.

9 years ago[tests] Fix refacto in r187764 that effectively disabled SimplifyCFG tests. :(
[tests] Fix refacto in r187764 that effectively disabled SimplifyCFG tests. :(

9 years ago[lit] Remove some done TODOs.
[lit] Remove some done TODOs.

9 years agoSupport X86_64_GOTLoad relocations in RuntimeDyldMachO by treating them the
Support X86_64_GOTLoad relocations in RuntimeDyldMachO by treating them the
same way as X86_64_GOT relocations. The 'Load' part of GOTLoad is just an
optimization hint for the linker anyway, and can be safely ignored.

This patch also fixes some minor issues with the relocations introduced while
processing an X86_64_GOT[Load]: the addend for the GOT entry should always be
zero, and the addend for the replacement relocation at the original offset
should be the same as the addend of the relocation being replaced.

I haven't come up with a good way of testing this yet, but I'm working on it.

This fixes <rdar://problem/14651564>.

9 years agoFixing a corner-case bug in strchr and strrchr lib call optimizations where
Fixing a corner-case bug in strchr and strrchr lib call optimizations where
the input character is not converted to char before comparing with zero.

The patch was discussed in this thread:

9 years agomake arm-use-movt available for all ARM
make arm-use-movt available for all ARM

Before this patch this flag is IOS specific, but is also
useful for bare project like bootloaders / kernels etc,
since movw / movt prevents simple relocation. Therefore
make this flag more commonly available.

note: this patch depends on a similiar rename in clang

Patch by Jeroen Hofstee.

9 years agomake arm-reserve-r9 available for all ARM
make arm-reserve-r9 available for all ARM

r9 is defined as a platform-specific register in the ARM EABI.
It can be reserved for a special purpose or be used as a general
purpose register. Add support for reserving r9 for all ARM, while
leaving the IOS usage unchanged.

Patch by Jeroen Hofstee.

9 years agoMake a few more things const.
Make a few more things const.

9 years agoUse a reference instead of making an unnecessary copy. Also use 'const'.
Use a reference instead of making an unnecessary copy. Also use 'const'.

9 years agoDataFlowSanitizer: Add a debugging feature to help us track nonzero labels.
DataFlowSanitizer: Add a debugging feature to help us track nonzero labels.

When the -dfsan-debug-nonzero-labels parameter is supplied, the code
is instrumented such that when a call parameter, return value or load
produces a nonzero label, the function __dfsan_nonzero_label is called.
The idea is that a debugger breakpoint can be set on this function
in a nominally label-free program to help identify any bugs in the
instrumentation pass causing labels to be introduced.

Reviewers: eugenis

Differential Revision: http://llvm-reviews.chandlerc.com/D1405

9 years agoConstify the function parameters.
Constify the function parameters.

9 years agoDrive-by fix for a doxygen comment in MachineInstr.h.
Drive-by fix for a doxygen comment in MachineInstr.h.

9 years agoThis fixes three issues related to Thumb literal loads:
This fixes three issues related to Thumb literal loads:

1. The offset range for Thumb1 PC relative loads is [0..1020] and not [-1024..1020]
2. Thumb2 PC relative loads may define the PC, so the restriction placed on target register is removed
3. Removes unneeded alias between "ldr.n" and t1LDRpci. ".n" is actually stripped by both tablegen
and the ASM parser, so this alias rule really does nothing

9 years ago[Mips][msa] Added the simple builtins (madd_q to xori)
[Mips][msa] Added the simple builtins (madd_q to xori)

madd_q, maddr_q, maddv, max_[asu], maxi_[su], min_[asu], mini_[su], mod_[su],
msub_q, msubr_q, msubv, mul_q, mulr_q, mulv, nloc, nlzc, nori, ori, pckev,
pckod, pcnt, sat_[su], shf, sld, sldi, sll, slli, splat, splati, sr[al],
sr[al]i, subs_[su], subss_u, subus_s, subv, subvi, vshf, xori

Patch by Daniel Sanders

9 years ago[Mips][msa] Added the simple builtins (fadd to ftq)
[Mips][msa] Added the simple builtins (fadd to ftq)

fadd, fceq, fcg[et], fclass, fcl[et], fcne, fcun, fdiv, fexdo, fexp2,
fexup[lr], ffint_[su], ffql, ffqr, fill, flog2, fmadd, fmax, fmax_a, fmin,
fmin_a, fmsub, fmul, frint, frcp, frsqrt, fseq, fsge, fsgt, fsle, fslt,
fsne, fsqr, fsub, ftint_s, ftq

Patch by Daniel Sanders

9 years ago[Mips][msa] Added the simple builtins (add_a to dpsub[su], ilvev to ldi)
[Mips][msa] Added the simple builtins (add_a to dpsub[su], ilvev to ldi)

add_a, adds_[asu], addv, addvi, andi.b, asub_[su].[bhwd], aver?_[su]_[bhwd],
bclr, bclri, bins[lr], bins[lr]i, bmnzi, bmzi, bneg, bnegi, bseli, bset, bseti,
c(eq|ne), c(eq|ne)i, cl[et]_[su], cl[et]i_[su], copy_[su].[bhw], div_[su],
dotp_[su], dpadd_[su], dpsub_[su], ilvev, ilvl, ilvod, ilvr, insv, insve,

Patch by Daniel Sanders

9 years agoRevert r188449 as it turns out we're just missing the instructions that need the...
Revert r188449 as it turns out we're just missing the instructions that need the v16i32/v16f32 matching.

9 years agoClang and AArch64 backend patches to support shll/shl and vmovl instructions and...
Clang and AArch64 backend patches to support shll/shl and vmovl instructions and ACLE functions

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@188451 91177308-0d34-0410-b5e6-96231b3b80d8

9 years agoDon't let isPermImmMask handle v16i32 since VPERMI doesn't match on that type. Remove...
Craig Topper [Thu, 15 Aug 2013 07:30:51 +0000 (07:30 +0000)]
Don't let isPermImmMask handle v16i32 since VPERMI doesn't match on that type. Remove 128-bit vector handling from isPermImmMask too, it's covered by isPSHUFDMask.

9 years agoTentative fix for global-buffer-overflow caused by r188426. Found by AddressSanitizer
Tentative fix for global-buffer-overflow caused by r188426. Found by AddressSanitizer

9 years agoUse MVT instead of EVT in X86ISelDAGToDAG since all the types should be legal.
Use MVT instead of EVT in X86ISelDAGToDAG since all the types should be legal.

9 years agoUse MVT in place of EVT in more X86 operation lowering functions.
Use MVT in place of EVT in more X86 operation lowering functions.

9 years agoFixed typo in CMakeLists.txt.
Fixed typo in CMakeLists.txt.

ERROR_VARIABLES when clearly LLVMBUILDOUTPUT should be marked as

9 years agoReplace getValueType().getSimpleVT() with getSimpleValueType().
Replace getValueType().getSimpleVT() with getSimpleValueType().

9 years agoReplace getValueType().getSimpleVT() with getSimpleValueType(). Also remove one weird...
Replace getValueType().getSimpleVT() with getSimpleValueType(). Also remove one weird cast from MVT->EVT just to call getSimpleVT().

9 years agoAuto-compute live intervals on demand.
Auto-compute live intervals on demand.

When new virtual registers are created during splitting/spilling, defer
creation of the live interval until we need to use the live interval.

Along with the recent commits to notify LiveRangeEdit when new virtual
registers are created, this makes it possible for functions like
TargetInstrInfo::loadRegFromStackSlot() and
TargetInstrInfo::storeRegToStackSlot() to create multiple virtual
registers as part of the process of generating loads/stores for
different register classes, and then have the live intervals for those
new registers computed when they are needed.

9 years agoAdd the MachineInstrSpan class.
Add the MachineInstrSpan class.

MachineInstrSpan is initialized with a MachineBasicBlock::iterator,
and is intended to track which instructions are inserted before/after
that instruction from the time the MachineInstrSpan is created.

It provides a begin()/end() interface to walk the range of
instructions inserted around the initial instruction (including that
initial instruction).

It also provides a getInitial() interface to return the initial

9 years agoNotify LiveRangeEdit of new virtual registers.
Notify LiveRangeEdit of new virtual registers.

Add a delegate class to MachineRegisterInfo with a single virtual
function, MRI_NoteNewVirtualRegister(). Update LiveRangeEdit to inherit
from this delegate class and override the definition of the callback
with an implementation that tracks the newly created virtual registers.

9 years agoTrack new virtual registers by register number.
Track new virtual registers by register number.

Track new virtual registers by register number, rather than by the live
interval created for them. This is the first step in separating the
creation of new virtual registers and new live intervals.  Eventually
live intervals will be created and populated on demand after the virtual
registers have been created and used in instructions.

9 years agoR600/SI: Improve legalization of vector operations
R600/SI: Improve legalization of vector operations

This should fix hangs in the OpenCL piglit tests.

9 years agoR600/SI: Replace v1i32 type with i32 in imageload and sample intrinsics
R600/SI: Replace v1i32 type with i32 in imageload and sample intrinsics

9 years agoR600/SI: Convert v16i8 resource descriptors to i128
R600/SI: Convert v16i8 resource descriptors to i128

Now that compute support is better on SI, we can't continue using v16i8
for descriptors since this is also a legal type in OpenCL.

This patch fixes numerous hangs with the piglit OpenCL test and since
we now use a target specific DAG node for LOAD_CONSTANT with the
correct MemOperandFlags, this should also fix:


9 years agoR600/SI: Use i8 types for resource descriptors in tests
R600/SI: Use i8 types for resource descriptors in tests

We switched from i32 to i8 types a while ago and the tests were never

9 years agoR600/SI: Lower BUILD_VECTOR to REG_SEQUENCE v2
Using REG_SEQUENCE for BUILD_VECTOR rather than a series of INSERT_SUBREG
instructions should make it easier for the register allocator to coalasce
unnecessary copies.

  - Use an SGPR register class if all the operands of BUILD_VECTOR are

9 years agoR600/SI: Choose the correct MOV instruction for copying immediates
R600/SI: Choose the correct MOV instruction for copying immediates

The instruction selector will now try to infer the destination register
so it can decided whether to use V_MOV_B32 or S_MOV_B32 when copying

9 years agoR600/SI: Assign a register class to the $vaddr operand for MIMG instructions
R600/SI: Assign a register class to the $vaddr operand for MIMG instructions

The previous code declared the operand as unknown:$vaddr, which made
it possible for scalar registers to be used instead of vector registers.

9 years ago[llvm-build] Make Py3 compatible.
[llvm-build] Make Py3 compatible.

9 years agoDataFlowSanitizer: move abilist input file to Inputs.
DataFlowSanitizer: move abilist input file to Inputs.

9 years agoDebugInfo: Prefer references over pointers, pass by const reference for a type that...
DebugInfo: Prefer references over pointers, pass by const reference for a type that will grow in the future

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@188422 91177308-0d34-0410-b5e6-96231b3b80d8

9 years agoR600/SI: Handle MSAA texture targets
R600/SI: Handle MSAA texture targets

Patch by: Marek Olšák

9 years agoR600/SI: Allow conversion between v32i8 and v8i32
R600/SI: Allow conversion between v32i8 and v8i32

Patch by: Marek Olšák

9 years agoR600/SI: Fix an obvious typo
R600/SI: Fix an obvious typo

Patch by: Marek Olšák

9 years agoR600/SI: Add pattern for fp_to_uint
R600/SI: Add pattern for fp_to_uint

This fixes the F2U opcode for the Mesa driver.

Patch by: Marek Olšák

9 years ago[lit] Add test coverage of gtest format.
[lit] Add test coverage of gtest format.

9 years ago[lit] Ensure test output is converted to strings where possible.
[lit] Ensure test output is converted to strings where possible.

 - This cleans up the text output of failing tests when run under PY3.

9 years agoFix small typo: s/succ/Succ/
Fix small typo: s/succ/Succ/

9 years agoDataFlowSanitizer: Instrumentation for memset.
DataFlowSanitizer: Instrumentation for memset.

Differential Revision: http://llvm-reviews.chandlerc.com/D1395

9 years agoActually fix PPC64 64-bit GPR inline asm constraint matching
Actually fix PPC64 64-bit GPR inline asm constraint matching

This is a follow-up to r187693, correcting that code to request the correct
register class. The previous version, with the wrong register class, was not
really correcting the constraints, but rather was removing them. Coincidentally,
this fixed the failing test case in r187693, but obviously created other

Peter Collingbourne [Wed, 14 Aug 2013 18:54:12 +0000 (18:54 +0000)]
DataFlowSanitizer: greylist is now ABI list.

This replaces the old incomplete greylist functionality with an ABI
list, which can provide more detailed information about the ABI and
semantics of specific functions.  The pass treats every function in
the "uninstrumented" category in the ABI list file as conforming to
the "native" (i.e. unsanitized) ABI.  Unless the ABI list contains
additional categories for those functions, a call to one of those
functions will produce a warning message, as the labelling behaviour
of the function is unknown.  The other supported categories are
"functional", "discard" and "custom".

- "discard" -- This function does not write to (user-accessible) memory,
  and its return value is unlabelled.
- "functional" -- This function does not write to (user-accessible)
  memory, and the label of its return value is the union of the label of
  its arguments.
- "custom" -- Instead of calling the function, a custom wrapper __dfsw_F
  is called, where F is the name of the function.  This function may wrap
  the original function or provide its own implementation.

Differential Revision: http://llvm-reviews.chandlerc.com/D1345

9 years ago[lit] Support parsing scripts with inconsistent or invalid encodings.
[lit] Support parsing scripts with inconsistent or invalid encodings.

 - For whatever reason, we have a lot of test files with bogus unicode
   characters. This patch allows those scripts to still be parsed on Python3 by
   changing the parsing logic to work on binary files, and only require the
   actual script commands to be convertible to ascii.

 - This patch has been tweaked to now ensure that the command strings are not of
   unicode type on Python 2.6-7.

9 years agoUse the MSVC __cpuid intrinsic instead of inline asm
Use the MSVC __cpuid intrinsic instead of inline asm

This works around PR16830 in LLVM when self-hosting clang on Windows.

9 years agoRemove unnecessary parameter to RenumberValues.
Remove unnecessary parameter to RenumberValues.

Patch by Matthias Braun!

9 years agoRemove unused function.
Remove unused function.

Patch by Matthias Braun!

9 years agoImprove misleading comment.
Improve misleading comment.

Patch by Matthias Braun!

9 years agoRemove declaration of nonexistant function.
Remove declaration of nonexistant function.

Patch by Matthias Braun!

9 years agoLiveIntervalUnion is not used in RegAllocBase.
LiveIntervalUnion is not used in RegAllocBase.

Patch by Matthias Braun!

9 years agoRemove unused struct/enum
Remove unused struct/enum

Patch by Matthias Braun!

9 years agollvm-symbolizer: add support for .gnu_debuglink section
llvm-symbolizer: add support for .gnu_debuglink section

9 years agoLet t2LDRBi8 and t2LDRBi12 have same Base Pointer
Let t2LDRBi8 and t2LDRBi12 have same Base Pointer

When determining if two different loads are from the same base address,
this patch allows one load to use a t2LDRi8 address mode and another to
use a t2LDRi12 address mode. The current implementation is very
conservative and this allows the case of differing Thumb2 byte loads to
be considered. Allowing these differing modes instead of forcing the exact
same opcode is useful for situations where one opcodes loads from a base
address+1 and a second opcode loads for a base address-1.

Patch by Daniel Stewart.

9 years agoSphinx refuses to render this code block. Try adding a newline.
Sphinx refuses to render this code block. Try adding a newline.

9 years agoExpose CRC-32 implementation from zlib
Expose CRC-32 implementation from zlib

9 years agoRevert r188376, "[lit] Support parsing scripts with inconsistent or invalid encodings...
Revert r188376, "[lit] Support parsing scripts with inconsistent or invalid encodings.", this doesn't work yet for bots using the internal shell.

9 years agoAdd the C99 hex-float assembly syntax to our extension document.
Tim Northover [Wed, 14 Aug 2013 15:27:20 +0000 (15:27 +0000)]
Add the C99 hex-float assembly syntax to our extension document.

As Ben pointed out, GAS doesn't support this syntax so we should give at least
some warning that it might not be portable.

9 years ago[lit] Support parsing scripts with inconsistent or invalid encodings.
[lit] Support parsing scripts with inconsistent or invalid encodings.

 - For whatever reason, we have a lot of test files with bogus unicode
   characters. This patch allows those scripts to still be parsed on Python3 by
   changing the parsing logic to work on binary files, and only require the
   actual script commands to be convertible to ascii.

9 years agoAdd test-case for hex floating-literals
Add test-case for hex floating-literals

Somehow I forgot to test one of the error conditions I'd added.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@188372 91177308-0d34-0410-b5e6-96231b3b80d8

9 years agoSupport C99 hexadecimal floating-point literals in assembly
Support C99 hexadecimal floating-point literals in assembly

It's useful to be able to write down floating-point numbers without having to
worry about what they'll be rounded to (as C99 discovered), this extends that
ability to the MC assembly parsers.

9 years agoFix a really terrifying but improbable bug in mem2reg. If you have seen
Fix a really terrifying but improbable bug in mem2reg. If you have seen
extremely subtle miscompilations (such as a load getting replaced with
the value stored *below* the load within a basic block) related to
promoting an alloca to an SSA value, there is the dim possibility that
you hit this. Please let me know if you won this unfortunate lottery.

The first half of mem2reg's core logic (as it is used both in the
standalone mem2reg pass and in SROA) builds up a mapping from
'Instruction *' to the index of that instruction within its basic block.
This allows quickly establishing which store dominate a particular load
even for large basic blocks. We cache this information throughout the
run of mem2reg over a function in order to amortize the cost of
computing it.

This is not in and of itself a strange pattern in LLVM. However, it
introduces a very important constraint: absolutely no instruction can be
deleted from the program without updating the mapping. Otherwise a newly
allocated instruction might get the same pointer address, and then end
up with a wrong index. Yes, LLVM routinely suffers from a *single
threaded* variant of the ABA problem. Most places in LLVM don't find
avoiding this an imposition because they don't both delete and create
new instructions iteratively, but mem2reg *loves* to do this... All the
time. Fortunately, the mem2reg code was really careful about updating
this cache to handle this eventuallity... except when it comes to the
debug declare intrinsic. Oops. The fix is to invalidate that pointer in
the cache when we delete it, the same as we do when deleting alloca
instructions and other instructions.

I've also caused the same bug in new code while working on a fix to
PR16867, so this seems to be a really unfortunate pattern. Hopefully in
subsequent patches the deletion of dead instructions can be consolidated
sufficiently to make it less likely that we'll see future occurences of
this bug.

Sorry for not having a test case, but I have literally no idea how to
reliably trigger this kind of thing. It may be single-threaded, but it
remains an ABA problem. It would require a really amazing number of
stars to align.

9 years agoMake more helper methods into static functions.
Make more helper methods into static functions.

9 years agoRemove tab characters.
Remove tab characters.

9 years agoMake some helper methods static.
Make some helper methods static.

9 years agoUse MVT in more lowering code.
Use MVT in more lowering code.

9 years agoReplace EVT with MVT in isVectorShift. Keeps compiler from generating unneeded checks...
Replace EVT with MVT in isVectorShift. Keeps compiler from generating unneeded checks and handling for extended types.

9 years agoReplace EVT with MVT in many of the shuffle lowering functions. Keeps compiler from...
Replace EVT with MVT in many of the shuffle lowering functions. Keeps compiler from generating unneeded checks and handling for extended types.

9 years ago[lit] Fix a relative import issue I missed earlier.
[lit] Fix a relative import issue I missed earlier.

9 years ago[lit] Avoid StringIO.
[lit] Avoid StringIO.
 - We barely used it, and it is very hard to use in a 2.5-3 compatible
   way because of changing expectations for its input types.

9 years ago[lit] Fix tests to execute lit with same python as invoked with.
[lit] Fix tests to execute lit with same python as invoked with.

9 years ago[lit] Factor ShTest format script command parsing from other processing.
[lit] Factor ShTest format script command parsing from other processing.

9 years ago[lit] Move executeCommand() into lit.util.
[lit] Move executeCommand() into lit.util.

9 years ago[lit] Move formats into their own subpackage.
[lit] Move formats into their own subpackage.

9 years ago[CMake] add_llvm_library: Specify explicit suffix .imp to import library to avoid...
[CMake] add_llvm_library: Specify explicit suffix .imp to import library to avoid a warning between profile_rt-static and profile_rt-shared with lib/profile_rt.lib.

FIXME: It seems MS version of profile_rt.dll doesn't contain any export symbols.

9 years agoLit: Introduce "%/[STpst] into parseIntegratedTestScript(), to normalize substitutions.
Lit: Introduce "%/[STpst] into parseIntegratedTestScript(), to normalize substitutions.

9 years ago[mips] Fix bug in parsing accumulator registers.
[mips] Fix bug in parsing accumulator registers.

9 years ago[mips] Use register operands instead of register classes in DSP instruction
[mips] Use register operands instead of register classes in DSP instruction

9 years ago[mips] Rename DSPRegs.
[mips] Rename DSPRegs.

9 years ago[mips] Rename HIRegs and LORegs.
[mips] Rename HIRegs and LORegs.

9 years agollvm/test/CodeGen/X86/setcc-sentinals.ll: Relax expressions for x86_64-win32.
llvm/test/CodeGen/X86/setcc-sentinals.ll: Relax expressions for x86_64-win32.

9 years agoFix always creating GEP with i32 indices
Fix always creating GEP with i32 indices

Use the pointer size if datalayout is available.
Use i64 if it's not, which is consistent with what other
places do when the pointer size is unknown.

The test doesn't really test this in a useful way
since it will be transformed to that later anyway,
but this now tests it for non-zero arrays and when
datalayout isn't available. The cases in
visitGetElementPtrInst should save an extra re-visit to
the newly created GEP since it won't need to cleanup after

9 years agoUse type helper functions instead of cast
Use type helper functions instead of cast

9 years agoUse array initializer, space around operator
Use array initializer, space around operator

9 years ago[mips] Properly parse registers that appear in inline-asm constraints.
[mips] Properly parse registers that appear in inline-asm constraints.

9 years agoBBVectorize: Add initial stores to the write set when tracking uses
BBVectorize: Add initial stores to the write set when tracking uses

When computing the use set of a store, we need to add the store to the write
set prior to iterating over later instructions. Otherwise, if there is a later
aliasing load of that store, that load will not be tagged as a use, and bad
things will happen.

trackUsesOfI still adds later dependent stores of an instruction to that
instruction's write set, but it never sees the original instruction, and so
when tracking uses of a store, the store must be added to the write set by the

Fixes PR16834.

9 years agoRemove duplicate copy of testcase in r188327.
Remove duplicate copy of testcase in r188327.

9 years agoRevert r187191, which broke opt -mem2reg on the testcases included in PR16867.
Nick Lewycky [Tue, 13 Aug 2013 22:51:58 +0000 (22:51 +0000)]
However, opt -O2 doesn't run mem2reg directly so nobody noticed until r188146
when SROA started sending more things directly down the PromoteMemToReg path.

In order to revert r187191, I also revert dependent revisions r187296, r187322
and r188146. Fixes PR16867. Does not add the testcases from that PR, but both
of them should get added for both mem2reg and sroa when this revert gets

9 years ago[Mips][msa] Value types for MSA support.
[Mips][msa] Value types for MSA support.

Added v8f16 to ValueTypes.h, ValueTypes.cpp, ValueTypes.td,
and CodeGenTarget.cpp

Patch by Daniel Sanders

9 years agoOptions: explicit handling of --
Options: explicit handling of --

Clients of the option parsing library should handle it explicitly
using a KIND_REMAINING_ARGS option.

Clang and lld have been updated in r188316 and r188318, respectively.

Also fix -Wsign-compare warning in the option parsing test.

9 years agoDAG: Combine (and (setne X, 0), (setne X, -1)) -> (setuge (add X, 1), 2)
DAG: Combine (and (setne X, 0), (setne X, -1)) -> (setuge (add X, 1), 2)

A common idiom is to use zero and all-ones as sentinal values and to
check for both in a single conditional ("x != 0 && x != (unsigned)-1").
That generates code, for i32, like:
  testl %edi, %edi
  setne %al
  cmpl  $-1, %edi
  setne %cl
  andb  %al, %cl

With this transform, we generate the simpler:
  incl  %edi
  cmpl  $1, %edi
  seta  %al

Similar improvements for other integer sizes and on other platforms. In
general, combining the two setcc instructions into one is better.


