8 years ago[WinEH] Add some test cases I forgot to add to previous commits
[WinEH] Add some test cases I forgot to add to previous commits

8 years ago[WinEH] Insert the EH code load before the block terminator
[WinEH] Insert the EH code load before the block terminator

The previous code put the load after the terminator, leading to invalid
IR and downstream crashes. This caused http://crbug.com/506446.

8 years ago[X86][SSE4A] Shuffle lowering using SSE4A EXTRQ/INSERTQ instructions
[X86][SSE4A] Shuffle lowering using SSE4A EXTRQ/INSERTQ instructions

This patch adds support for v8i16 and v16i8 shuffle lowering using the immediate versions of the SSE4A EXTRQ and INSERTQ instructions. Although rather limited (they can only act on the lower 64-bits of the source vectors, leave the upper 64-bits of the result vector undefined and don't have VEX encoded variants), the instructions are still useful for the zero extension of any lane (EXTRQ) or inserting a lane into another vector (INSERTQ). Testing demonstrated that it wasn't typically worth it to use these instructions for v2i64 or v4i32 vector shuffles although they are capable of it.

As well as adding specific pattern matching for the shuffles, the patch uses EXTRQ for zero extension cases where SSE41 isn't available and its more efficient than the SSE2 'unpack' default approach. It also adds shuffle decode support for the EXTRQ / INSERTQ cases when the instructions are handling full byte-sized extractions / insertions.

From this foundation, future patches will be able to make use of the instructions for situations that use their ability to extract/insert at the bit level.

Differential Revision: http://reviews.llvm.org/D10146

8 years ago[X86][SSE] Use the general SMAX/SMIN/UMAX/UMIN opcodes and remove the X86 implementation
[X86][SSE] Use the general SMAX/SMIN/UMAX/UMIN opcodes and remove the X86 implementation

With the completion of D9746 there is now a common implementation of integer signed/unsigned min/max nodes, removing the need for the equivalent X86 specific implementations.

This patch removes the old X86ISD nodes, legalizes the relevant SSE2/SSE41/AVX2/AVX512 instructions for the ISD versions and converts the small amount of existing X86 code.

Differential Revision: http://reviews.llvm.org/D10947

8 years ago[TwoAddressInstructionPass] Rename a variable to match the coding style.
[TwoAddressInstructionPass] Rename a variable to match the coding style.

Spot by Bruno.

8 years agoSwap operands instead of using !.
Swap operands instead of using !.

This avoids returning true for A == B.

Thanks to Benjamin Kramer for noticing it.

8 years agoWhen sorting by address, undefined symbols go first.
When sorting by address, undefined symbols go first.

This matches gnu nm.

8 years agoReduce code duplication. NFC.
Reduce code duplication. NFC.

8 years ago[llvm-extract] Drop comdats from declarations
[llvm-extract] Drop comdats from declarations

The verifier rejects comdats on declarations.

8 years agoFix printing of common symbols.
Fix printing of common symbols.

Printing the symbol size matches the behavior or both gnu nm and freebsd nm.

8 years agollc: Add a 'run-pass' option.
llc: Add a 'run-pass' option.

This commit adds a 'run-pass' option to llc, which instructs the compiler to run
one specific code generation pass only.

Llc already has the 'start-after' and the 'stop-after' options, and this new
option complements the other two by making it easier to write tests that want
to invoke a single pass only.

Differential Revision: http://reviews.llvm.org/D10776

8 years agoAMDGPU: Run SIInsertWaits as pre-emit pass
AMDGPU: Run SIInsertWaits as pre-emit pass

Running this after the scheduler enables scheduling
waits later so other ALU instructions can run while
this would be waiting.

When combined with enabling the post-RA scheduler, this
gives about a ~20% improvement on sgemm.

8 years agoChange the last few internal StringRef triples into Triple objects.
Change the last few internal StringRef triples into Triple objects.

This concludes the patch series to eliminate StringRef forms of GNU triples
from the internals of LLVM that began in r239036.

At this point, the StringRef-form of GNU Triples should only be used in the
public API (including IR serialization) and a couple objects that directly
interact with the API (most notably the Module class). The next step is to
replace these Triple objects with the TargetTuple object that will represent
our authoratative/unambiguous internal equivalent to GNU Triples.

Subscribers: llvm-commits, jholewinski, ted, rengolin

Differential Revision: http://reviews.llvm.org/D10962

8 years agoDIBuilder: Don't rauw null pointers with empty arrays in finalize().
DIBuilder: Don't rauw null pointers with empty arrays in finalize().
This makes the IR a little easier to read.

8 years agoWhere Triple has a suitable predicate, use it rather than the enum values. NFC.
Where Triple has a suitable predicate, use it rather than the enum values. NFC.

Subscribers: llvm-commits, rengolin

Differential Revision: http://reviews.llvm.org/D10960

8 years agouse range-based for loops; NFCI
use range-based for loops; NFCI

8 years agoResubmit "Add new EliminateAvailableExternally module pass" (r239480)
Resubmit "Add new EliminateAvailableExternally module pass" (r239480)

This change includes a fix for https://code.google.com/p/chromium/issues/detail?id=499508#c3,
which required updating the visibility for symbols with eliminated definitions.

Add new EliminateAvailableExternally module pass, which is performed in
O2 compiles just before GlobalDCE, unless we are preparing for LTO.

This pass eliminates available externally globals (turning them into
declarations), regardless of whether they are dead/unreferenced, since
we are guaranteed to have a copy available elsewhere at link time.
This enables additional opportunities for GlobalDCE.

If we are preparing for LTO (e.g. a -flto -c compile), the pass is not
included as we want to preserve available externally functions for possible
link time inlining. The FE indicates whether we are doing an -flto compile
via the new PrepareForLTO flag on the PassManagerBuilder.

8 years agoUse an early exit in DIBuilder::finalize() to improve readability.
Use an early exit in DIBuilder::finalize() to improve readability.

8 years agoUse the correct DIArray types in DICompileUnit::replace*().
Use the correct DIArray types in DICompileUnit::replace*().

Thanks to Yaron Keren for noticing!

8 years agouse range-based for loops; NFCI
use range-based for loops; NFCI

8 years agoAMDGPU/SI: Add debugging subtarget feature for DS offsets
AMDGPU/SI: Add debugging subtarget feature for DS offsets

We don't have a good way to detect most situations where
DS offsets are usable on SI, so add an option to force using
them even if unsafe for debugging performance problems.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241462 91177308-0d34-0410-b5e6-96231b3b80d8

8 years ago[Sparc] Add more instruction aliases.
[Sparc] Add more instruction aliases.

These are mostly from the chart in the SparcV8 spec, section "A.3
Synthetic Instructions".

Differential Revision: http://reviews.llvm.org/D9834

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241461 91177308-0d34-0410-b5e6-96231b3b80d8

8 years ago[Sparc] Add support for flush instruction.
[Sparc] Add support for flush instruction.

Differential Revision: http://reviews.llvm.org/D9833

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241460 91177308-0d34-0410-b5e6-96231b3b80d8

8 years agoSimplify. NFC.
Simplify. NFC.

8 years agoSimplify. NFC.
Simplify. NFC.

8 years agoInline function into single use. NFC.
Inline function into single use. NFC.

8 years agoRemove getRelocationAddress.
Remove getRelocationAddress.

Originally added in r139314.

Back then it didn't actually get the address, it got whatever value the
relocation used: address or offset.

The values in different object formats are:

* MachO: Always an offset.
* COFF: Always an address, but when talking about the virtual address of
  sections it says: "for simplicity, compilers should set this to zero".
* ELF: An offset for .o files and and address for .so files. In the case of the
  .so, the relocation in not linked to any section (sh_info is 0). We can't
  really compute an offset.

Some API mappings would be:

* Use getAddress for everything. It would be quite cumbersome. To compute the
  address elf has to follow sh_info, which can be corrupted and therefore the
  method has to return an ErrorOr. The address of the section is also the same
  for every relocation in a section, so we shouldn't have to check the error
  and fetch the value for every relocation.

* Use a getValue and make it up to the user to know what it is getting.

* Use a getOffset and:
 * Assert for dynamic ELF objects. That is a very peculiar case and it is
   probably fair to ask any tool that wants to support it to use ELF.h. The
   only tool we have that reads those (llvm-readobj) already does that. The
   only other use case I can think of is a dynamic linker.
 * Check that COFF .obj files have sections with zero virtual address spaces. If
   it turns out that some assembler/compiler produces these, we can change
   COFFObjectFile::getRelocationOffset to subtract it. Given COFF format,
   this can be done without the need for ErrorOr.

The getRelocationAddress method was never implemented for COFF. It also
had exactly one use in a very peculiar case: a shortcut for adding the
section value to a pcrel reloc on MachO.

Given that, I don't expect that there is any use out there of the C API. If
that is not the case, let me know and I will add it back with the implementation
inlined and do a proper deprecation.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241450 91177308-0d34-0410-b5e6-96231b3b80d8

8 years agoFix a bug in the A57FPLoadBalancing register tracking/scavenger.
Fix a bug in the A57FPLoadBalancing register tracking/scavenger.

The code in AArch64A57FPLoadBalancing::scavengeRegister() to handle dead defs
was not correctly handling aliased registers.  E.g. if the dead def was of D2,
then S2 was not being marked as unavailable, so it could potentially be used
across a live-range in which it would be clobbered.

Patch by Geoff Berry <gberry@codeaurora.org>!
Phabricator: http://reviews.llvm.org/D10900

8 years agoCheck that COFF .obj files have sections with zero virtual address spaces.
Check that COFF .obj files have sections with zero virtual address spaces.

When talking about the virtual address of sections the coff spec says:
  ... for simplicity, compilers should set this to zero. Otherwise, it is an
  arbitrary value that is subtracted from offsets during relocation.

We don't currently subtract it, so check that it is zero.

If some producer does create such files, we can change getRelocationOffset

8 years ago[X86][SSE] Added missing stack folding test for SQRTSD and SQRTSS instructions.
[X86][SSE] Added missing stack folding test for SQRTSD and SQRTSS instructions.

8 years ago[X86][AVX512] Multiply Packed Unsigned Integers with Round and Scale
[X86][AVX512] Multiply Packed Unsigned Integers with Round and Scale


git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241443 91177308-0d34-0410-b5e6-96231b3b80d8

8 years ago[Mips] Add support for MCJIT for MIPS32r6
[Mips] Add support for MCJIT for MIPS32r6

Add support for resolving MIPS32r6 relocations in MCJIT.

Patch by Vladimir Radosavljevic.

Differential Revision: http://reviews.llvm.org/D10687

8 years agoFix handling of ELF::R_MIPS_32 on Mips64.
Fix handling of ELF::R_MIPS_32 on Mips64.

Thanks to Aboud, Amjad for reporting the regression and providing the testcase.

8 years ago[TableGen] Change a couple methods to return an ArrayRef instead of a const std:...
[TableGen] Change a couple methods to return an ArrayRef instead of a const std::vector reference. NFC

8 years agoMake this test a bit more interesting.
Make this test a bit more interesting.

Before every test was using a section with an address of zero.

8 years agoUntabify.
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241423 91177308-0d34-0410-b5e6-96231b3b80d8

change CHECK to CHECK-LABEL for more precision

8 years agoremove unnecessary test specifications
remove unnecessary test specifications

8 years agominimize test case and remove unnecessary opt passes
minimize test case and remove unnecessary opt passes

8 years agoremove unnecessary temp variable; NFCI
remove unnecessary temp variable; NFCI

8 years agoVerifier: Forbid comdats on linker declarations.
Verifier: Forbid comdats on linker declarations.

Differential Revision: http://reviews.llvm.org/D10945

8 years agoIR: Do not consider available_externally linkage to be linker-weak.
IR: Do not consider available_externally linkage to be linker-weak.

From the linker's perspective, an available_externally global is equivalent
to an external declaration (per isDeclarationForLinker()), so it is incorrect
to consider it to be a weak definition.

Also clean up some logic in the dead argument elimination pass and clarify
its comments to better explain how its behavior depends on linkage,
introduce GlobalValue::isStrongDefinitionForLinker() and start using
it throughout the optimizers and backend.

Differential Revision: http://reviews.llvm.org/D10941

8 years agouse range-based for loops; NFCI
use range-based for loops; NFCI

8 years ago[TargetLowering] StringRefize asm constraint getters.
[TargetLowering] StringRefize asm constraint getters.

There is some functional change here because it changes target code from
atoi(3) to StringRef::getAsInteger which has error checking. For valid
constraints there should be no difference.

8 years ago[X86][SSE3] Just use an explicit SSE3 target attribute - not a cpu type.
[X86][SSE3] Just use an explicit SSE3 target attribute - not a cpu type.

Merged arch/target into a specific triple - we had i686 and x86_64 targets overriding each other....

8 years ago[X86][SSE2] Just use an explicit SSE2 target attribute - not a cpu type.
[X86][SSE2] Just use an explicit SSE2 target attribute - not a cpu type.

corei7 is capable of a lot more than just SSE2....

8 years ago[RuntimeDyld] Add comment documenting the behavior change in r241383.
[RuntimeDyld] Add comment documenting the behavior change in r241383.

8 years ago[x86][AVX512] add Multiply High Op
[x86][AVX512] add Multiply High Op
include encoding and intrinsics tests.


8 years ago[X86] Fix incorrect/inefficient pushw encodings for x86-64 targets
[X86] Fix incorrect/inefficient pushw encodings for x86-64 targets

Correctly support assembling "pushw $imm8" on x86-64 targets.
Also some cleanup of the PUSH instructions (PUSH64i16 and PUSHi16 actually
represent the same instruction)

This fixes PR23996

Patch by: david.l.kreitzer@intel.com
Differential Revision: http://reviews.llvm.org/D10878

8 years ago[CMake] add_llvm_symbol_exports: Use Python oneliner instead of "cmd.exe /c type...
[CMake] add_llvm_symbol_exports: Use Python oneliner instead of "cmd.exe /c type" to generate *.def.

8 years agoAdd missing builtins to the PPC back end for ABI compliance (vol. 2)
Add missing builtins to the PPC back end for ABI compliance (vol. 2)

This patch corresponds to review:

Back end portion of the second round of additions to altivec.h.

8 years agouse range-based for loops; NFCI
use range-based for loops; NFCI

8 years ago[X86][SSE] Improved i8/i16 to f64 uint2fp vector conversions
[X86][SSE] Improved i8/i16 to f64 uint2fp vector conversions

Followup to D10433 and D10589 that fixes i8/i16 uint2fp vector conversions by zero extending to i32 and using the sint2fp path (unless the target does actually support uint2fp).

8 years agouse valid bits to avoid unnecessary machine trace metric recomputations
use valid bits to avoid unnecessary machine trace metric recomputations

Although this does cut the number of traces recomputed by ~10% for the
test case mentioned in http://reviews.llvm.org/D10460, it doesn't
make a dent in the overall performance. That example needs to be more
selective when invalidating traces.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241393 91177308-0d34-0410-b5e6-96231b3b80d8

Yaron Keren [Sat, 4 Jul 2015 05:48:52 +0000 (05:48 +0000)]
8 years agoLTO: expose LTO_SYMBOL_ALIAS, which indicates that the symbol is an alias.
LTO: expose LTO_SYMBOL_ALIAS, which indicates that the symbol is an alias.

This is needed for COFF linkers to distinguish between weak external aliases
and regular symbols with LLVM weak linkage, which are represented as strong
symbols in COFF.

8 years agoObject/COFF: Do not rely on VirtualSize being 0 in object files.
Object/COFF: Do not rely on VirtualSize being 0 in object files.

8 years ago[RuntimeDyld] Skip relocations for external symbols with 64-bit address ~0ULL.
[RuntimeDyld] Skip relocations for external symbols with 64-bit address ~0ULL.

Requested by Eugene Rozenfeld of the LLILC team, this feature allows JIT
clients to skip relocations for selected external symbols by returning ~0ULL
from their symbol resolver. If this value is returned for a given symbol,
RuntimeDyld will skip all relocations for that symbol. The client will be
responsible for applying the skipped relocations manually before the code
is executed.

8 years ago[X86] Add proper 64-bit mode checks to jrcxz and jcxz.
[X86] Add proper 64-bit mode checks to jrcxz and jcxz.

8 years agoAMDGPU: Fix indentation of switch
AMDGPU: Fix indentation of switch

8 years ago[ELFYAML] Fix handling SHT_NOBITS sections by obj2yaml/yaml2obj tools
[ELFYAML] Fix handling SHT_NOBITS sections by obj2yaml/yaml2obj tools

SHT_NOBITS sections do not have content in an object file. Now the yaml2obj
tool does not accept `Content` field for such sections, and the obj2yaml
tool does not attempt to read the section content from a file.

Restore r241350 and r241352.

8 years agoUse a continue to reduce indentation.
Use a continue to reduce indentation.

8 years agoUse a continue to reduce indentation.
Use a continue to reduce indentation.

8 years agoContext is allocated just a few lines above. Don't check if it is null.
Context is allocated just a few lines above. Don't check if it is null.

Rafael Espindola [Fri, 3 Jul 2015 21:47:00 +0000 (21:47 +0000)]

Is anyone using those?

8 years agoRemove always-true comparison, NFC.
Remove always-true comparison, NFC.

to in the following code:

    if (UpgradeIntrinsicFunction(&F, NewFn))
      UpgradedIntrinsics[&F] = NewFn;

Looking through UpgradeIntrinsicFunction, we always return false OR
NewFn will be set to a different function from our source.

This patch pulls the F != NewFn into UpgradeIntrinsicFunction as an
assert, and removes the check from callers of UpgradeIntrinsicFunction.

Subscribers: llvm-commits-list

Differential Revision: http://reviews.llvm.org/D10915

8 years ago[X86] Added 32-bit builds to fp<->int tests.
[X86] Added 32-bit builds to fp<->int tests.

Ensure that i686 x87/SSE/SSE2 targets all build.

8 years agoDelete dead code. NFC.
Delete dead code. NFC.

8 years agoReturn ErrorOr from getSymbolAddress.
Return ErrorOr from getSymbolAddress.

It can fail trying to get the section on ELF and COFF. This makes sure the
error is handled.

8 years agoReplace a few more MachO only uses of getSymbolAddress.
Replace a few more MachO only uses of getSymbolAddress.

8 years agoUse getValue instead of getAddress in a few MachO only cases.
Rafael Espindola [Fri, 3 Jul 2015 17:44:18 +0000 (17:44 +0000)]
In MachO the value of the symbol is always the address, so we can use the
simpler function.

8 years agoThis reverts commit r241350 and r241352.
This reverts commit r241350 and r241352.

r241350 broke lld tests.
r241352 depends on r241350.

"[ELFYAML] Fix handling SHT_NOBITS sections by obj2yaml/yaml2obj tools"
"[ELFYAML] Make the Size field for .bss section optional"

8 years agoDelete dead code.
Delete dead code.

8 years ago[ELFYAML] Make the Size field for .bss section optional
[ELFYAML] Make the Size field for .bss section optional

It's a common case to have a zero-size .bss section in an object file.

8 years ago[ELFYAML] Fix handling SHT_NOBITS sections by obj2yaml/yaml2obj tools
[ELFYAML] Fix handling SHT_NOBITS sections by obj2yaml/yaml2obj tools

SHT_NOBITS sections do not have content in an object file. Now yaml2obj
tool does not accept `Content` field for such sections, and obj2yaml
tool does not attempt to read the section content from a file.

8 years agoAvoid warning about unused variable when building without assertions.
Avoid warning about unused variable when building without assertions.

8 years agoAvoid a use after free.
Avoid a use after free.

8 years agoContinue to remove the notion that ELF has dynamic and static symbols.
Continue to remove the notion that ELF has dynamic and static symbols.

The ELFObjectFile now just reasons about a section/index pair, removing
one of the users that force ELF.h to maintain the difference.

8 years agollvm/test/CodeGen/ARM/fnattr-trap.ll: Add -mtriple, to appease targeting *-win32.
llvm/test/CodeGen/ARM/fnattr-trap.ll: Add -mtriple, to appease targeting *-win32.

  LLVM ERROR: CPU: 'generic' does not support ARM mode execution!

8 years agowhitespace tidyup. NFC.
whitespace tidyup. NFC.

8 years ago[X86][SSE] Sign extension for target vector sizes less than 128 bits (pt2)
[X86][SSE] Sign extension for target vector sizes less than 128 bits (pt2)

Add support for v2i8/v2i16 to v2f64 by using a sign extension to v2i32 before conversion to v2f64.

Differential Revision: http://reviews.llvm.org/D10589

8 years agoInitialize booleans CallsUnwindInit and CallsEHReturn with false instead of 0.
Initialize booleans CallsUnwindInit and CallsEHReturn with false instead of 0.

8 years ago[X86][SSE] Sign extension for target vector sizes less than 128 bits (pt1)
[X86][SSE] Sign extension for target vector sizes less than 128 bits (pt1)

This patch adds support for sign extension for sub 128-bit vectors, such as to v2i32. It concatenates with UNDEF subvectors up to 128-bits, performs the sign extension (i.e. as v4i32) and then extracts the target subvector.

Patch 1/2 of D10589 - the second patch covers the conversion of v2i8/v2i16 to v2f64.

8 years agoFix an overly aggressive assertion in getCopyFromPartsVector.
Fix an overly aggressive assertion in getCopyFromPartsVector.

The assertion in getCopyFromPartsVector assumed that the vector 'part' must
match the type of argument (arguments are potentially split into multiple
parts). However, in some cases the targets return a 'part' of the right size
but with a different type. We already handle this case correctly later on
and generate a bitcast. This commit just makes sure that we are actually
checking the property that we care about.

8 years agoDIBuilder: Now that DICompileUnit is distinct, stop using temporary nodes
DIBuilder: Now that DICompileUnit is distinct, stop using temporary nodes
for the arrays.

8 years agoUse function attribute "trap-func-name" and remove TargetOptions::TrapFuncName.
Use function attribute "trap-func-name" and remove TargetOptions::TrapFuncName.

This commit changes normal isel and fast isel to read the user-defined trap
function name from function attribute "trap-func-name" attached to llvm.trap or
llvm.debugtrap instead of from TargetOptions::TrapFuncName. This is needed to
use clang's command line option "-ftrap-function" for LTO and enable changing
the trap function name on a per-call-site basis.

Out-of-tree projects currently using TargetOptions::TrapFuncName to specify the
trap function name should attach attribute "trap-func-name" to the call sites
of llvm.trap and llvm.debugtrap instead.


git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241305 91177308-0d34-0410-b5e6-96231b3b80d8

8 years agoAdd functions for adding and testing string attributes to CallInst. NFC.
Add functions for adding and testing string attributes to CallInst. NFC.

This change is needed later when I make changes to attach string function
attributes to llvm.trap and llvm.debugtrap.

8 years ago[WebAssembly] Set the HasFloatingPointExceptions flag for WebAssembly.
[WebAssembly] Set the HasFloatingPointExceptions flag for WebAssembly.

8 years agoTry to fix the build of IntelJITEventListener.
Try to fix the build of IntelJITEventListener.

8 years agoReturn ErrorOr from SymbolRef::getName.
Return ErrorOr from SymbolRef::getName.

This function can really fail since the string table offset can be out of

Using ErrorOr makes sure the error is checked.

a diagnostic manager in Object.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@241297 91177308-0d34-0410-b5e6-96231b3b80d8

Bill Schmidt [Thu, 2 Jul 2015 19:01:22 +0000 (19:01 +0000)]
In r241285, I removed the SUBREG_TO_REG restriction from VSX swap
removal, determining that this was overly conservative.  We have
another form of the same restriction in that we check for the presence
of implicit subregs in vector operations.  As with SUBREG_TO_REG for
partial register conversions, an implicit subreg is safe in and of
itself, provided no other operation makes a lane-sensitive assumption
about the result.  This patch removes that restriction, by removing
the HasImplicitSubreg flag and all code that relies on it.

I've added a test case that fails to optimize before this patch is
applied, and optimizes properly with the patch.  Test based on a
report from Anton Blanchard.

8 years ago[Statepoints] Make operator bool() explicit.
[Statepoints] Make operator bool() explicit.

(Addressing post-commit review.)

8 years agoRemove a report_fatal_error that should be unreachable.
Remove a report_fatal_error that should be unreachable.

If we created a relocation iterator, we have a valid relocation section.

8 years ago[PPC64LE] Teach swap optimization about the doubleword splat idiom
[PPC64LE] Teach swap optimization about the doubleword splat idiom

With a previous patch, the VSX swap optimization is able to recognize
the doubleword load-splat idiom that can be implemented using lxvdsx.
However, that does not cover a doubleword splat where the source is a
register.  We can implement this using xxspltd (a special form of
xxpermdi).  This patch teaches the swap optimization pass about this

As a prerequisite, it also permits swap optimization to succeed for
all forms of SUBREG_TO_REG.  Previously we were conservative and only
allowed SUBREG_TO_REG when it copied a full register.  However, on
reflection any form of SUBREG_TO_REG is safe in and of itself, so long
as an unsafe operation is not performed on its result.  In particular,
a widening SUBREG_TO_REG often occurs as an input to a doubleword
splat idiom, particularly in auto-vectorized code.

The doubleword splat idiom is an XXPERMDI operation where both source
registers are identical, and the selection mask is either 0 (splat the
first element) or 3 (splat the second element).  To determine whether
the registers are identical, we use the existing mechanism for looking
through "copy-like" operations.  That mechanism has a side effect of
marking the XXPERMDI operation as using a physical register, which
would invalidate its presence in a swap-optimized region.  This is
correct for the form of XXPERMDI that performs a swap and hence would
be removed, but is not what we want for a doubleword-splat variety of
XXPERMDI.  Therefore we reset the physical-register flag on the
XXPERMDI when it represents a splat.

A simple test case is added to verify that we generate the splat and
that we also remove the xxswapd instructions that would otherwise be
associated with the load and store of another operand.

8 years agoConvert a member variable to a local one.
Convert a member variable to a local one.

8 years agoReworking the test part of r241149
Reworking the test part of r241149

The test part of r241149 has been reverted in r241451, due to misplaced test cases.
This patch splits those test cases among the appropriate targets.

Differential Revision: http://reviews.llvm.org/D10897

8 years agoFix for PR23310: llvm-dis crashes when trying to upgrade an intrinsic.
Fix for PR23310: llvm-dis crashes when trying to upgrade an intrinsic.

When trying to upgrade @llvm.x86.sse2.psrl.dq while parsing a module,
BitcodeReader adds the function to its worklist twice, resulting in a
crash when accessing it the second time.

This patch replaces the worklist vector by a map.

Patch by Philip Pfaffe.

8 years agoHandle .dynsym a bit more like we handle .symtab.
Handle .dynsym a bit more like we handle .symtab.

They have the same format and we find them in the same way, no reason to handle
them differently.

8 years agoRangify some loops.
Rangify some loops.

Patch by Philip Pfaffe!

8 years agoUse default member initializes. NFC.
Use default member initializes. NFC.

