Use movups to lower memcpy and memset even if it's not fast (like corei7).
[oota-llvm.git] / test / CodeGen / X86 / tlv-1.ll
1 ; RUN: llc < %s -mtriple x86_64-apple-darwin | FileCheck %s
2
3 %struct.A = type { [48 x i8], i32, i32, i32 }
4
5 @c = external thread_local global %struct.A, align 4
6
7 define void @main() nounwind ssp {
8 entry:
9   call void @llvm.memset.p0i8.i64(i8* getelementptr inbounds (%struct.A* @c, i32 0, i32 0, i32 0), i8 0, i64 60, i32 1, i1 false)
10   unreachable  
11   ; CHECK: movq    _c@TLVP(%rip), %rdi
12   ; CHECK-NEXT: callq   *(%rdi)
13   ; CHECK-NEXT: pxor    %xmm0, %xmm0
14   ; CHECK-NEXT: movups  %xmm0, 32(%rax)
15   ; CHECK-NEXT: movups  %xmm0, 16(%rax)
16   ; CHECK-NEXT: movups  %xmm0, (%rax)
17   ; CHECK-NEXT: movl $0, 56(%rax)
18   ; CHECK-NEXT: movq $0, 48(%rax)
19 }
20
21 declare void @llvm.memset.p0i8.i64(i8* nocapture, i8, i64, i32, i1) nounwind
22
23 @a = thread_local global i32 0                    ; <i32*> [#uses=0]
24 @b = thread_local global i32 0                    ; <i32*> [#uses=0]
25
26 ; CHECK: .tbss _a$tlv$init, 4, 2
27 ; CHECK:        .section        __DATA,__thread_vars,thread_local_variables
28 ; CHECK:        .globl  _a
29 ; CHECK: _a:
30 ; CHECK:        .quad   __tlv_bootstrap
31 ; CHECK:        .quad   0
32 ; CHECK:        .quad   _a$tlv$init
33
34 ; CHECK: .tbss _b$tlv$init, 4, 2
35 ; CHECK:        .globl  _b
36 ; CHECK: _b:
37 ; CHECK:        .quad   __tlv_bootstrap
38 ; CHECK:        .quad   0
39 ; CHECK:        .quad   _b$tlv$init