[x86] Factor out the zero vector insertion logic in the new vector
[oota-llvm.git] / test / CodeGen / X86 / 2012-05-19-avx2-store.ll
1 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=corei7-avx -mattr=+avx2 | FileCheck %s
2
3 define void @double_save(<4 x i32>* %Ap, <4 x i32>* %Bp, <8 x i32>* %P) nounwind ssp {
4 entry:
5   ; CHECK: vmovaps
6   ; CHECK: vinsertf128 $1, ([[A0:%rdi|%rsi]]),
7   ; CHECK: vmovups
8   %A = load <4 x i32>* %Ap
9   %B = load <4 x i32>* %Bp
10   %Z = shufflevector <4 x i32>%A, <4 x i32>%B, <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7>
11   store <8 x i32> %Z, <8 x i32>* %P, align 16
12   ret void
13 }