Merge r261331: avoid out of bounds loads for interleaved access vectorization
[oota-llvm.git] / test / Transforms / LoopVectorize / control-flow.ll
1 ; RUN: opt < %s -loop-vectorize -force-vector-width=4 -S -pass-remarks-missed='loop-vectorize' 2>&1 | FileCheck %s
2
3 ; C/C++ code for control flow test
4 ; int test(int *A, int Length) {
5 ;   for (int i = 0; i < Length; i++) {
6 ;     if (A[i] > 10.0) goto end;
7 ;     A[i] = 0;
8 ;   }
9 ; end:
10 ;   return 0;
11 ; }
12
13 ; CHECK: remark: source.cpp:5:9: loop not vectorized: loop control flow is not understood by vectorizer
14 ; CHECK: remark: source.cpp:5:9: loop not vectorized: use -Rpass-analysis=loop-vectorize for more info
15
16 ; CHECK: _Z4testPii
17 ; CHECK-NOT: x i32>
18 ; CHECK: ret
19
20 target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
21
22 ; Function Attrs: nounwind optsize ssp uwtable
23 define i32 @_Z4testPii(i32* nocapture %A, i32 %Length) #0 !dbg !4 {
24 entry:
25   %cmp8 = icmp sgt i32 %Length, 0, !dbg !10
26   br i1 %cmp8, label %for.body.preheader, label %end, !dbg !10
27
28 for.body.preheader:                               ; preds = %entry
29   br label %for.body, !dbg !12
30
31 for.body:                                         ; preds = %for.body.preheader, %if.else
32   %indvars.iv = phi i64 [ %indvars.iv.next, %if.else ], [ 0, %for.body.preheader ]
33   %arrayidx = getelementptr inbounds i32, i32* %A, i64 %indvars.iv, !dbg !12
34   %0 = load i32, i32* %arrayidx, align 4, !dbg !12, !tbaa !15
35   %cmp1 = icmp sgt i32 %0, 10, !dbg !12
36   br i1 %cmp1, label %end.loopexit, label %if.else, !dbg !12
37
38 if.else:                                          ; preds = %for.body
39   store i32 0, i32* %arrayidx, align 4, !dbg !19, !tbaa !15
40   %indvars.iv.next = add nuw nsw i64 %indvars.iv, 1, !dbg !10
41   %1 = trunc i64 %indvars.iv.next to i32, !dbg !10
42   %cmp = icmp slt i32 %1, %Length, !dbg !10
43   br i1 %cmp, label %for.body, label %end.loopexit, !dbg !10
44
45 end.loopexit:                                     ; preds = %if.else, %for.body
46   br label %end
47
48 end:                                              ; preds = %end.loopexit, %entry
49   ret i32 0, !dbg !20
50 }
51
52 attributes #0 = { nounwind }
53
54 !llvm.dbg.cu = !{!0}
55 !llvm.module.flags = !{!7, !8}
56 !llvm.ident = !{!9}
57
58 !0 = distinct !DICompileUnit(language: DW_LANG_C_plus_plus, producer: "clang version 3.5.0", isOptimized: true, runtimeVersion: 6, emissionKind: 2, file: !1, enums: !2, retainedTypes: !2, subprograms: !3, globals: !2, imports: !2)
59 !1 = !DIFile(filename: "source.cpp", directory: ".")
60 !2 = !{}
61 !3 = !{!4}
62 !4 = distinct !DISubprogram(name: "test", line: 1, isLocal: false, isDefinition: true, virtualIndex: 6, flags: DIFlagPrototyped, isOptimized: true, scopeLine: 2, file: !1, scope: !5, type: !6, variables: !2)
63 !5 = !DIFile(filename: "source.cpp", directory: ".")
64 !6 = !DISubroutineType(types: !2)
65 !7 = !{i32 2, !"Dwarf Version", i32 2}
66 !8 = !{i32 2, !"Debug Info Version", i32 3}
67 !9 = !{!"clang version 3.5.0"}
68 !10 = !DILocation(line: 3, column: 8, scope: !11)
69 !11 = distinct !DILexicalBlock(line: 3, column: 3, file: !1, scope: !4)
70 !12 = !DILocation(line: 5, column: 9, scope: !13)
71 !13 = distinct !DILexicalBlock(line: 5, column: 9, file: !1, scope: !14)
72 !14 = distinct !DILexicalBlock(line: 4, column: 3, file: !1, scope: !11)
73 !15 = !{!16, !16, i64 0}
74 !16 = !{!"int", !17, i64 0}
75 !17 = !{!"omnipotent char", !18, i64 0}
76 !18 = !{!"Simple C/C++ TBAA"}
77 !19 = !DILocation(line: 8, column: 7, scope: !13)
78 !20 = !DILocation(line: 12, column: 3, scope: !4)