LoopVectorize: Fix a bug in the scalarization of instructions.
[oota-llvm.git] / test / Transforms / LoopVectorize / scalar-store.ll
1 ; RUN: opt < %s  -loop-vectorize -force-vector-width=4 -dce -instcombine -licm -S -enable-if-conversion | FileCheck %s
2
3 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
4 target triple = "x86_64-apple-macosx10.9.0"
5
6 ; When we scalarize a store, make sure that the addresses are extracted
7 ; from a vector. We had a bug where the addresses were the old scalar
8 ; addresses.
9
10 ; CHECK: @foo
11 ; CHECK: select
12 ; CHECK: extractelement
13 ; CHECK-NEXT: store
14 ; CHECK: extractelement
15 ; CHECK-NEXT: store
16 ; CHECK: extractelement
17 ; CHECK-NEXT: store
18 ; CHECK: extractelement
19 ; CHECK-NEXT: store
20 ; CHECK: ret
21 define i32 @foo(i32* nocapture %a) nounwind uwtable ssp {
22   br label %1
23
24 ; <label>:1                                       ; preds = %7, %0
25   %indvars.iv = phi i64 [ 0, %0 ], [ %indvars.iv.next, %7 ]
26   %2 = mul nsw i64 %indvars.iv, 7
27   %3 = getelementptr inbounds i32* %a, i64 %2
28   %4 = load i32* %3, align 4
29   %5 = icmp sgt i32 %4, 3
30   br i1 %5, label %6, label %7
31
32 ; <label>:6                                       ; preds = %1
33   %tmp = add i32 %4, 4
34   %tmp1 = mul i32 %tmp, %4
35   br label %7
36
37 ; <label>:7                                       ; preds = %6, %1
38   %x.0 = phi i32 [ %tmp1, %6 ], [ %4, %1 ]
39   %8 = add nsw i32 %x.0, 3
40   store i32 %8, i32* %3, align 4
41   %indvars.iv.next = add i64 %indvars.iv, 1
42   %lftr.wideiv = trunc i64 %indvars.iv.next to i32
43   %exitcond = icmp eq i32 %lftr.wideiv, 256
44   br i1 %exitcond, label %9, label %1
45
46 ; <label>:9                                       ; preds = %7
47   ret i32 0
48 }