llvm/test/CodeGen/AArch64/tailcall_misched_graph.ll: s/REQUIRE/REQUIRES/
[oota-llvm.git] / test / CodeGen / Hexagon / remove_lsr.ll
1 ; Test fix for PR-13709.
2 ; RUN: llc -march=hexagon -mcpu=hexagonv4 < %s | FileCheck %s
3 ; CHECK: foo
4 ; CHECK-NOT: lsr(r{{[0-9]+}}:{{[0-9]+}}, #32)
5 ; CHECK-NOT: lsr(r{{[0-9]+}}:{{[0-9]+}}, #32)
6
7 ; Convert the sequence
8 ; r17:16 = lsr(r11:10, #32)
9 ; .. = r16
10 ; into
11 ; r17:16 = lsr(r11:10, #32)
12 ; .. = r11
13 ; This makes the lsr instruction dead and it gets removed subsequently
14 ; by a dead code removal pass.
15
16 %union.vect64 = type { i64 }
17 %union.vect32 = type { i32 }
18
19 define void @foo(%union.vect64* nocapture %sss_extracted_bit_rx_data_ptr,
20  %union.vect32* nocapture %s_even, %union.vect32* nocapture %s_odd,
21  i8* nocapture %scr_s_even_code_ptr, i8* nocapture %scr_s_odd_code_ptr)
22  nounwind {
23 entry:
24   %scevgep = getelementptr %union.vect64, %union.vect64* %sss_extracted_bit_rx_data_ptr, i32 1
25   %scevgep28 = getelementptr %union.vect32, %union.vect32* %s_odd, i32 1
26   %scevgep32 = getelementptr %union.vect32, %union.vect32* %s_even, i32 1
27   %scevgep36 = getelementptr i8, i8* %scr_s_odd_code_ptr, i32 1
28   %scevgep39 = getelementptr i8, i8* %scr_s_even_code_ptr, i32 1
29   br label %for.body
30
31 for.body:                                         ; preds = %for.body, %entry
32   %lsr.iv42 = phi i32 [ %lsr.iv.next, %for.body ], [ 2, %entry ]
33   %lsr.iv40 = phi i8* [ %scevgep41, %for.body ], [ %scevgep39, %entry ]
34   %lsr.iv37 = phi i8* [ %scevgep38, %for.body ], [ %scevgep36, %entry ]
35   %lsr.iv33 = phi %union.vect32* [ %scevgep34, %for.body ], [ %scevgep32, %entry ]
36   %lsr.iv29 = phi %union.vect32* [ %scevgep30, %for.body ], [ %scevgep28, %entry ]
37   %lsr.iv = phi %union.vect64* [ %scevgep26, %for.body ], [ %scevgep, %entry ]
38   %predicate_1.023 = phi i8 [ undef, %entry ], [ %10, %for.body ]
39   %predicate.022 = phi i8 [ undef, %entry ], [ %9, %for.body ]
40   %val.021 = phi i64 [ undef, %entry ], [ %srcval, %for.body ]
41   %lsr.iv3335 = bitcast %union.vect32* %lsr.iv33 to i32*
42   %lsr.iv2931 = bitcast %union.vect32* %lsr.iv29 to i32*
43   %lsr.iv27 = bitcast %union.vect64* %lsr.iv to i64*
44   %0 = tail call i64 @llvm.hexagon.A2.vsubhs(i64 0, i64 %val.021)
45   %conv3 = sext i8 %predicate.022 to i32
46   %1 = trunc i64 %val.021 to i32
47   %2 = trunc i64 %0 to i32
48   %3 = tail call i32 @llvm.hexagon.C2.mux(i32 %conv3, i32 %1, i32 %2)
49   store i32 %3, i32* %lsr.iv3335, align 4
50   %conv8 = sext i8 %predicate_1.023 to i32
51   %4 = lshr i64 %val.021, 32
52   %5 = trunc i64 %4 to i32
53   %6 = lshr i64 %0, 32
54   %7 = trunc i64 %6 to i32
55   %8 = tail call i32 @llvm.hexagon.C2.mux(i32 %conv8, i32 %5, i32 %7)
56   store i32 %8, i32* %lsr.iv2931, align 4
57   %srcval = load i64, i64* %lsr.iv27, align 8
58   %9 = load i8, i8* %lsr.iv40, align 1
59   %10 = load i8, i8* %lsr.iv37, align 1
60   %lftr.wideiv = trunc i32 %lsr.iv42 to i8
61   %exitcond = icmp eq i8 %lftr.wideiv, 32
62   %scevgep26 = getelementptr %union.vect64, %union.vect64* %lsr.iv, i32 1
63   %scevgep30 = getelementptr %union.vect32, %union.vect32* %lsr.iv29, i32 1
64   %scevgep34 = getelementptr %union.vect32, %union.vect32* %lsr.iv33, i32 1
65   %scevgep38 = getelementptr i8, i8* %lsr.iv37, i32 1
66   %scevgep41 = getelementptr i8, i8* %lsr.iv40, i32 1
67   %lsr.iv.next = add i32 %lsr.iv42, 1
68   br i1 %exitcond, label %for.end, label %for.body
69
70 for.end:                                          ; preds = %for.body
71   ret void
72 }
73
74 declare i64 @llvm.hexagon.A2.vsubhs(i64, i64) nounwind readnone
75
76 declare i32 @llvm.hexagon.C2.mux(i32, i32, i32) nounwind readnone