[LoopVectorizer] Refine loop vectorizer's register usage calculator by ignoring speci...
[oota-llvm.git] / test / Transforms / LoopVectorize / X86 / unroll-pm.ll
1 ; RUN: opt < %s -O2 -mtriple=x86_64-apple-macosx10.8.0 -mcpu=corei7-avx -force-vector-width=4 -S | FileCheck %s
2 ; RUN: opt < %s -O2 -mtriple=x86_64-apple-macosx10.8.0 -mcpu=corei7-avx -force-vector-width=4 -disable-loop-unrolling -S | FileCheck %s -check-prefix=CHECK-NOUNRL
3
4 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
5 target triple = "x86_64-apple-macosx10.8.0"
6 ;CHECK-LABEL: @bar(
7 ;CHECK: store <4 x i32>
8 ;CHECK: store <4 x i32>
9 ;CHECK: ret
10 ;CHECK-NOUNRL-LABEL: @bar(
11 ;CHECK-NOUNRL: store <4 x i32>
12 ;CHECK-NOUNRL-NOT: store <4 x i32>
13 ;CHECK-NOUNRL: ret
14 define i32 @bar(i32* nocapture %A, i32 %n) nounwind uwtable ssp {
15   %1 = icmp sgt i32 %n, 0
16   br i1 %1, label %.lr.ph, label %._crit_edge
17
18 .lr.ph:                                           ; preds = %0, %.lr.ph
19   %indvars.iv = phi i64 [ %indvars.iv.next, %.lr.ph ], [ 0, %0 ]
20   %2 = getelementptr inbounds i32, i32* %A, i64 %indvars.iv
21   %3 = load i32, i32* %2, align 4
22   %4 = add nsw i32 %3, 6
23   store i32 %4, i32* %2, align 4
24   %indvars.iv.next = add i64 %indvars.iv, 1
25   %lftr.wideiv = trunc i64 %indvars.iv.next to i32
26   %exitcond = icmp eq i32 %lftr.wideiv, %n
27   br i1 %exitcond, label %._crit_edge, label %.lr.ph
28
29 ._crit_edge:                                      ; preds = %.lr.ph, %0
30   ret i32 undef
31 }