[AVX512] Bring back vector-shuffle lowering support through broadcasts
[oota-llvm.git] / test / CodeGen / X86 / fold-tied-op.ll
1 ; RUN: llc -verify-machineinstrs -mtriple=i386--netbsd < %s | FileCheck %s\r
2 ; Regression test for http://reviews.llvm.org/D5701\r
3 \r
4 ; ModuleID = 'xxhash.i'\r
5 target datalayout = "e-m:e-p:32:32-f64:32:64-f80:32-n8:16:32-S128"\r
6 target triple = "i386--netbsd"\r
7 \r
8 ; CHECK-LABEL: fn1\r
9 ; CHECK:       shldl {{.*#+}} 4-byte Folded Spill\r
10 ; CHECK:       orl   {{.*#+}} 4-byte Folded Reload\r
11 ; CHECK:       shldl {{.*#+}} 4-byte Folded Spill\r
12 ; CHECK:       orl   {{.*#+}} 4-byte Folded Reload\r
13 ; CHECK:       addl  {{.*#+}} 4-byte Folded Reload\r
14 ; CHECK:       imull {{.*#+}} 4-byte Folded Reload\r
15 ; CHECK:       orl   {{.*#+}} 4-byte Folded Reload\r
16 ; CHECK:       retl\r
17 \r
18 %struct.XXH_state64_t = type { i32, i32, i64, i64, i64 }\r
19 \r
20 @a = common global i32 0, align 4\r
21 @b = common global i64 0, align 8\r
22 \r
23 ; Function Attrs: nounwind uwtable\r
24 define i64 @fn1() #0 {\r
25 entry:\r
26   %0 = load i32* @a, align 4, !tbaa !1\r
27   %1 = inttoptr i32 %0 to %struct.XXH_state64_t*\r
28   %total_len = getelementptr inbounds %struct.XXH_state64_t* %1, i32 0, i32 0\r
29   %2 = load i32* %total_len, align 4, !tbaa !5\r
30   %tobool = icmp eq i32 %2, 0\r
31   br i1 %tobool, label %if.else, label %if.then\r
32 \r
33 if.then:                                          ; preds = %entry\r
34   %v3 = getelementptr inbounds %struct.XXH_state64_t* %1, i32 0, i32 3\r
35   %3 = load i64* %v3, align 4, !tbaa !8\r
36   %v4 = getelementptr inbounds %struct.XXH_state64_t* %1, i32 0, i32 4\r
37   %4 = load i64* %v4, align 4, !tbaa !9\r
38   %v2 = getelementptr inbounds %struct.XXH_state64_t* %1, i32 0, i32 2\r
39   %5 = load i64* %v2, align 4, !tbaa !10\r
40   %shl = shl i64 %5, 1\r
41   %or = or i64 %shl, %5\r
42   %shl2 = shl i64 %3, 2\r
43   %shr = lshr i64 %3, 1\r
44   %or3 = or i64 %shl2, %shr\r
45   %add = add i64 %or, %or3\r
46   %mul = mul i64 %4, -4417276706812531889\r
47   %shl4 = mul i64 %4, -8834553413625063778\r
48   %shr5 = ashr i64 %mul, 3\r
49   %or6 = or i64 %shr5, %shl4\r
50   %mul7 = mul nsw i64 %or6, 1400714785074694791\r
51   %xor = xor i64 %add, %mul7\r
52   store i64 %xor, i64* @b, align 8, !tbaa !11\r
53   %mul8 = mul nsw i64 %xor, 1400714785074694791\r
54   br label %if.end\r
55 \r
56 if.else:                                          ; preds = %entry\r
57   %6 = load i64* @b, align 8, !tbaa !11\r
58   %xor10 = xor i64 %6, -4417276706812531889\r
59   %mul11 = mul nsw i64 %xor10, 400714785074694791\r
60   br label %if.end\r
61 \r
62 if.end:                                           ; preds = %if.else, %if.then\r
63   %storemerge.in = phi i64 [ %mul11, %if.else ], [ %mul8, %if.then ]\r
64   %storemerge = add i64 %storemerge.in, -8796714831421723037\r
65   store i64 %storemerge, i64* @b, align 8, !tbaa !11\r
66   ret i64 undef\r
67 }\r
68 \r
69 attributes #0 = { nounwind uwtable "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft-float"="false" }\r
70 \r
71 !llvm.ident = !{!0}\r
72 \r
73 !0 = metadata !{metadata !"clang version 3.6 (trunk 219587)"}\r
74 !1 = metadata !{metadata !2, metadata !2, i64 0}\r
75 !2 = metadata !{metadata !"int", metadata !3, i64 0}\r
76 !3 = metadata !{metadata !"omnipotent char", metadata !4, i64 0}\r
77 !4 = metadata !{metadata !"Simple C/C++ TBAA"}\r
78 !5 = metadata !{metadata !6, metadata !2, i64 0}\r
79 !6 = metadata !{metadata !"XXH_state64_t", metadata !2, i64 0, metadata !2, i64 4, metadata !7, i64 8, metadata !7, i64 16, metadata !7, i64 24}\r
80 !7 = metadata !{metadata !"long long", metadata !3, i64 0}\r
81 !8 = metadata !{metadata !6, metadata !7, i64 16}\r
82 !9 = metadata !{metadata !6, metadata !7, i64 24}\r
83 !10 = metadata !{metadata !6, metadata !7, i64 8}\r
84 !11 = metadata !{metadata !7, metadata !7, i64 0}\r