Merge branch 'x86-syscall-for-linus' of git://git.kernel.org/pub/scm/linux/kernel...
[firefly-linux-kernel-4.4.55.git] / arch / x86 / ia32 / ia32entry.S
1 /*
2  * Compatibility mode system call entry point for x86-64. 
3  *              
4  * Copyright 2000-2002 Andi Kleen, SuSE Labs.
5  */              
6
7 #include <asm/dwarf2.h>
8 #include <asm/calling.h>
9 #include <asm/asm-offsets.h>
10 #include <asm/current.h>
11 #include <asm/errno.h>
12 #include <asm/ia32_unistd.h>    
13 #include <asm/thread_info.h>    
14 #include <asm/segment.h>
15 #include <asm/irqflags.h>
16 #include <linux/linkage.h>
17
18 /* Avoid __ASSEMBLER__'ifying <linux/audit.h> just for this.  */
19 #include <linux/elf-em.h>
20 #define AUDIT_ARCH_I386         (EM_386|__AUDIT_ARCH_LE)
21 #define __AUDIT_ARCH_LE    0x40000000
22
23 #ifndef CONFIG_AUDITSYSCALL
24 #define sysexit_audit ia32_ret_from_sys_call
25 #define sysretl_audit ia32_ret_from_sys_call
26 #endif
27
28         .section .entry.text, "ax"
29
30         .macro IA32_ARG_FIXUP noebp=0
31         movl    %edi,%r8d
32         .if \noebp
33         .else
34         movl    %ebp,%r9d
35         .endif
36         xchg    %ecx,%esi
37         movl    %ebx,%edi
38         movl    %edx,%edx       /* zero extension */
39         .endm 
40
41         /* clobbers %eax */     
42         .macro  CLEAR_RREGS offset=0, _r9=rax
43         xorl    %eax,%eax
44         movq    %rax,\offset+R11(%rsp)
45         movq    %rax,\offset+R10(%rsp)
46         movq    %\_r9,\offset+R9(%rsp)
47         movq    %rax,\offset+R8(%rsp)
48         .endm
49
50         /*
51          * Reload arg registers from stack in case ptrace changed them.
52          * We don't reload %eax because syscall_trace_enter() returned
53          * the %rax value we should see.  Instead, we just truncate that
54          * value to 32 bits again as we did on entry from user mode.
55          * If it's a new value set by user_regset during entry tracing,
56          * this matches the normal truncation of the user-mode value.
57          * If it's -1 to make us punt the syscall, then (u32)-1 is still
58          * an appropriately invalid value.
59          */
60         .macro LOAD_ARGS32 offset, _r9=0
61         .if \_r9
62         movl \offset+16(%rsp),%r9d
63         .endif
64         movl \offset+40(%rsp),%ecx
65         movl \offset+48(%rsp),%edx
66         movl \offset+56(%rsp),%esi
67         movl \offset+64(%rsp),%edi
68         movl %eax,%eax                  /* zero extension */
69         .endm
70         
71         .macro CFI_STARTPROC32 simple
72         CFI_STARTPROC   \simple
73         CFI_UNDEFINED   r8
74         CFI_UNDEFINED   r9
75         CFI_UNDEFINED   r10
76         CFI_UNDEFINED   r11
77         CFI_UNDEFINED   r12
78         CFI_UNDEFINED   r13
79         CFI_UNDEFINED   r14
80         CFI_UNDEFINED   r15
81         .endm
82
83 #ifdef CONFIG_PARAVIRT
84 ENTRY(native_usergs_sysret32)
85         swapgs
86         sysretl
87 ENDPROC(native_usergs_sysret32)
88
89 ENTRY(native_irq_enable_sysexit)
90         swapgs
91         sti
92         sysexit
93 ENDPROC(native_irq_enable_sysexit)
94 #endif
95
96 /*
97  * 32bit SYSENTER instruction entry.
98  *
99  * Arguments:
100  * %eax System call number.
101  * %ebx Arg1
102  * %ecx Arg2
103  * %edx Arg3
104  * %esi Arg4
105  * %edi Arg5
106  * %ebp user stack
107  * 0(%ebp) Arg6 
108  *      
109  * Interrupts off.
110  *      
111  * This is purely a fast path. For anything complicated we use the int 0x80
112  * path below.  Set up a complete hardware stack frame to share code
113  * with the int 0x80 path.
114  */     
115 ENTRY(ia32_sysenter_target)
116         CFI_STARTPROC32 simple
117         CFI_SIGNAL_FRAME
118         CFI_DEF_CFA     rsp,0
119         CFI_REGISTER    rsp,rbp
120         SWAPGS_UNSAFE_STACK
121         movq    PER_CPU_VAR(kernel_stack), %rsp
122         addq    $(KERNEL_STACK_OFFSET),%rsp
123         /*
124          * No need to follow this irqs on/off section: the syscall
125          * disabled irqs, here we enable it straight after entry:
126          */
127         ENABLE_INTERRUPTS(CLBR_NONE)
128         movl    %ebp,%ebp               /* zero extension */
129         pushq_cfi $__USER32_DS
130         /*CFI_REL_OFFSET ss,0*/
131         pushq_cfi %rbp
132         CFI_REL_OFFSET rsp,0
133         pushfq_cfi
134         /*CFI_REL_OFFSET rflags,0*/
135         movl    TI_sysenter_return+THREAD_INFO(%rsp,3*8-KERNEL_STACK_OFFSET),%r10d
136         CFI_REGISTER rip,r10
137         pushq_cfi $__USER32_CS
138         /*CFI_REL_OFFSET cs,0*/
139         movl    %eax, %eax
140         pushq_cfi %r10
141         CFI_REL_OFFSET rip,0
142         pushq_cfi %rax
143         cld
144         SAVE_ARGS 0,1,0
145         /* no need to do an access_ok check here because rbp has been
146            32bit zero extended */ 
147 1:      movl    (%rbp),%ebp
148         .section __ex_table,"a"
149         .quad 1b,ia32_badarg
150         .previous       
151         orl     $TS_COMPAT,TI_status+THREAD_INFO(%rsp,RIP-ARGOFFSET)
152         testl   $_TIF_WORK_SYSCALL_ENTRY,TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
153         CFI_REMEMBER_STATE
154         jnz  sysenter_tracesys
155         cmpq    $(IA32_NR_syscalls-1),%rax
156         ja      ia32_badsys
157 sysenter_do_call:
158         IA32_ARG_FIXUP
159 sysenter_dispatch:
160         call    *ia32_sys_call_table(,%rax,8)
161         movq    %rax,RAX-ARGOFFSET(%rsp)
162         DISABLE_INTERRUPTS(CLBR_NONE)
163         TRACE_IRQS_OFF
164         testl   $_TIF_ALLWORK_MASK,TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
165         jnz     sysexit_audit
166 sysexit_from_sys_call:
167         andl    $~TS_COMPAT,TI_status+THREAD_INFO(%rsp,RIP-ARGOFFSET)
168         /* clear IF, that popfq doesn't enable interrupts early */
169         andl  $~0x200,EFLAGS-R11(%rsp) 
170         movl    RIP-R11(%rsp),%edx              /* User %eip */
171         CFI_REGISTER rip,rdx
172         RESTORE_ARGS 0,24,0,0,0,0
173         xorq    %r8,%r8
174         xorq    %r9,%r9
175         xorq    %r10,%r10
176         xorq    %r11,%r11
177         popfq_cfi
178         /*CFI_RESTORE rflags*/
179         popq_cfi %rcx                           /* User %esp */
180         CFI_REGISTER rsp,rcx
181         TRACE_IRQS_ON
182         ENABLE_INTERRUPTS_SYSEXIT32
183
184 #ifdef CONFIG_AUDITSYSCALL
185         .macro auditsys_entry_common
186         movl %esi,%r9d                  /* 6th arg: 4th syscall arg */
187         movl %edx,%r8d                  /* 5th arg: 3rd syscall arg */
188         /* (already in %ecx)               4th arg: 2nd syscall arg */
189         movl %ebx,%edx                  /* 3rd arg: 1st syscall arg */
190         movl %eax,%esi                  /* 2nd arg: syscall number */
191         movl $AUDIT_ARCH_I386,%edi      /* 1st arg: audit arch */
192         call audit_syscall_entry
193         movl RAX-ARGOFFSET(%rsp),%eax   /* reload syscall number */
194         cmpq $(IA32_NR_syscalls-1),%rax
195         ja ia32_badsys
196         movl %ebx,%edi                  /* reload 1st syscall arg */
197         movl RCX-ARGOFFSET(%rsp),%esi   /* reload 2nd syscall arg */
198         movl RDX-ARGOFFSET(%rsp),%edx   /* reload 3rd syscall arg */
199         movl RSI-ARGOFFSET(%rsp),%ecx   /* reload 4th syscall arg */
200         movl RDI-ARGOFFSET(%rsp),%r8d   /* reload 5th syscall arg */
201         .endm
202
203         .macro auditsys_exit exit
204         testl $(_TIF_ALLWORK_MASK & ~_TIF_SYSCALL_AUDIT),TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
205         jnz ia32_ret_from_sys_call
206         TRACE_IRQS_ON
207         sti
208         movl %eax,%esi          /* second arg, syscall return value */
209         cmpl $0,%eax            /* is it < 0? */
210         setl %al                /* 1 if so, 0 if not */
211         movzbl %al,%edi         /* zero-extend that into %edi */
212         inc %edi /* first arg, 0->1(AUDITSC_SUCCESS), 1->2(AUDITSC_FAILURE) */
213         call audit_syscall_exit
214         movl RAX-ARGOFFSET(%rsp),%eax   /* reload syscall return value */
215         movl $(_TIF_ALLWORK_MASK & ~_TIF_SYSCALL_AUDIT),%edi
216         cli
217         TRACE_IRQS_OFF
218         testl %edi,TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
219         jz \exit
220         CLEAR_RREGS -ARGOFFSET
221         jmp int_with_check
222         .endm
223
224 sysenter_auditsys:
225         CFI_RESTORE_STATE
226         auditsys_entry_common
227         movl %ebp,%r9d                  /* reload 6th syscall arg */
228         jmp sysenter_dispatch
229
230 sysexit_audit:
231         auditsys_exit sysexit_from_sys_call
232 #endif
233
234 sysenter_tracesys:
235 #ifdef CONFIG_AUDITSYSCALL
236         testl   $(_TIF_WORK_SYSCALL_ENTRY & ~_TIF_SYSCALL_AUDIT),TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
237         jz      sysenter_auditsys
238 #endif
239         SAVE_REST
240         CLEAR_RREGS
241         movq    $-ENOSYS,RAX(%rsp)/* ptrace can change this for a bad syscall */
242         movq    %rsp,%rdi        /* &pt_regs -> arg1 */
243         call    syscall_trace_enter
244         LOAD_ARGS32 ARGOFFSET  /* reload args from stack in case ptrace changed it */
245         RESTORE_REST
246         cmpq    $(IA32_NR_syscalls-1),%rax
247         ja      int_ret_from_sys_call /* sysenter_tracesys has set RAX(%rsp) */
248         jmp     sysenter_do_call
249         CFI_ENDPROC
250 ENDPROC(ia32_sysenter_target)
251
252 /*
253  * 32bit SYSCALL instruction entry.
254  *
255  * Arguments:
256  * %eax System call number.
257  * %ebx Arg1
258  * %ecx return EIP 
259  * %edx Arg3
260  * %esi Arg4
261  * %edi Arg5
262  * %ebp Arg2    [note: not saved in the stack frame, should not be touched]
263  * %esp user stack 
264  * 0(%esp) Arg6
265  *      
266  * Interrupts off.
267  *      
268  * This is purely a fast path. For anything complicated we use the int 0x80
269  * path below.  Set up a complete hardware stack frame to share code
270  * with the int 0x80 path.      
271  */     
272 ENTRY(ia32_cstar_target)
273         CFI_STARTPROC32 simple
274         CFI_SIGNAL_FRAME
275         CFI_DEF_CFA     rsp,KERNEL_STACK_OFFSET
276         CFI_REGISTER    rip,rcx
277         /*CFI_REGISTER  rflags,r11*/
278         SWAPGS_UNSAFE_STACK
279         movl    %esp,%r8d
280         CFI_REGISTER    rsp,r8
281         movq    PER_CPU_VAR(kernel_stack),%rsp
282         /*
283          * No need to follow this irqs on/off section: the syscall
284          * disabled irqs and here we enable it straight after entry:
285          */
286         ENABLE_INTERRUPTS(CLBR_NONE)
287         SAVE_ARGS 8,0,0
288         movl    %eax,%eax       /* zero extension */
289         movq    %rax,ORIG_RAX-ARGOFFSET(%rsp)
290         movq    %rcx,RIP-ARGOFFSET(%rsp)
291         CFI_REL_OFFSET rip,RIP-ARGOFFSET
292         movq    %rbp,RCX-ARGOFFSET(%rsp) /* this lies slightly to ptrace */
293         movl    %ebp,%ecx
294         movq    $__USER32_CS,CS-ARGOFFSET(%rsp)
295         movq    $__USER32_DS,SS-ARGOFFSET(%rsp)
296         movq    %r11,EFLAGS-ARGOFFSET(%rsp)
297         /*CFI_REL_OFFSET rflags,EFLAGS-ARGOFFSET*/
298         movq    %r8,RSP-ARGOFFSET(%rsp) 
299         CFI_REL_OFFSET rsp,RSP-ARGOFFSET
300         /* no need to do an access_ok check here because r8 has been
301            32bit zero extended */ 
302         /* hardware stack frame is complete now */      
303 1:      movl    (%r8),%r9d
304         .section __ex_table,"a"
305         .quad 1b,ia32_badarg
306         .previous       
307         orl     $TS_COMPAT,TI_status+THREAD_INFO(%rsp,RIP-ARGOFFSET)
308         testl   $_TIF_WORK_SYSCALL_ENTRY,TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
309         CFI_REMEMBER_STATE
310         jnz   cstar_tracesys
311         cmpq $IA32_NR_syscalls-1,%rax
312         ja  ia32_badsys
313 cstar_do_call:
314         IA32_ARG_FIXUP 1
315 cstar_dispatch:
316         call *ia32_sys_call_table(,%rax,8)
317         movq %rax,RAX-ARGOFFSET(%rsp)
318         DISABLE_INTERRUPTS(CLBR_NONE)
319         TRACE_IRQS_OFF
320         testl $_TIF_ALLWORK_MASK,TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
321         jnz sysretl_audit
322 sysretl_from_sys_call:
323         andl $~TS_COMPAT,TI_status+THREAD_INFO(%rsp,RIP-ARGOFFSET)
324         RESTORE_ARGS 0,-ARG_SKIP,0,0,0
325         movl RIP-ARGOFFSET(%rsp),%ecx
326         CFI_REGISTER rip,rcx
327         movl EFLAGS-ARGOFFSET(%rsp),%r11d       
328         /*CFI_REGISTER rflags,r11*/
329         xorq    %r10,%r10
330         xorq    %r9,%r9
331         xorq    %r8,%r8
332         TRACE_IRQS_ON
333         movl RSP-ARGOFFSET(%rsp),%esp
334         CFI_RESTORE rsp
335         USERGS_SYSRET32
336         
337 #ifdef CONFIG_AUDITSYSCALL
338 cstar_auditsys:
339         CFI_RESTORE_STATE
340         movl %r9d,R9-ARGOFFSET(%rsp)    /* register to be clobbered by call */
341         auditsys_entry_common
342         movl R9-ARGOFFSET(%rsp),%r9d    /* reload 6th syscall arg */
343         jmp cstar_dispatch
344
345 sysretl_audit:
346         auditsys_exit sysretl_from_sys_call
347 #endif
348
349 cstar_tracesys:
350 #ifdef CONFIG_AUDITSYSCALL
351         testl $(_TIF_WORK_SYSCALL_ENTRY & ~_TIF_SYSCALL_AUDIT),TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
352         jz cstar_auditsys
353 #endif
354         xchgl %r9d,%ebp
355         SAVE_REST
356         CLEAR_RREGS 0, r9
357         movq $-ENOSYS,RAX(%rsp) /* ptrace can change this for a bad syscall */
358         movq %rsp,%rdi        /* &pt_regs -> arg1 */
359         call syscall_trace_enter
360         LOAD_ARGS32 ARGOFFSET, 1  /* reload args from stack in case ptrace changed it */
361         RESTORE_REST
362         xchgl %ebp,%r9d
363         cmpq $(IA32_NR_syscalls-1),%rax
364         ja int_ret_from_sys_call /* cstar_tracesys has set RAX(%rsp) */
365         jmp cstar_do_call
366 END(ia32_cstar_target)
367                                 
368 ia32_badarg:
369         movq $-EFAULT,%rax
370         jmp ia32_sysret
371         CFI_ENDPROC
372
373 /* 
374  * Emulated IA32 system calls via int 0x80. 
375  *
376  * Arguments:    
377  * %eax System call number.
378  * %ebx Arg1
379  * %ecx Arg2
380  * %edx Arg3
381  * %esi Arg4
382  * %edi Arg5
383  * %ebp Arg6    [note: not saved in the stack frame, should not be touched]
384  *
385  * Notes:
386  * Uses the same stack frame as the x86-64 version.     
387  * All registers except %eax must be saved (but ptrace may violate that)
388  * Arguments are zero extended. For system calls that want sign extension and
389  * take long arguments a wrapper is needed. Most calls can just be called
390  * directly.
391  * Assumes it is only called from user space and entered with interrupts off.   
392  */                             
393
394 ENTRY(ia32_syscall)
395         CFI_STARTPROC32 simple
396         CFI_SIGNAL_FRAME
397         CFI_DEF_CFA     rsp,SS+8-RIP
398         /*CFI_REL_OFFSET        ss,SS-RIP*/
399         CFI_REL_OFFSET  rsp,RSP-RIP
400         /*CFI_REL_OFFSET        rflags,EFLAGS-RIP*/
401         /*CFI_REL_OFFSET        cs,CS-RIP*/
402         CFI_REL_OFFSET  rip,RIP-RIP
403         PARAVIRT_ADJUST_EXCEPTION_FRAME
404         SWAPGS
405         /*
406          * No need to follow this irqs on/off section: the syscall
407          * disabled irqs and here we enable it straight after entry:
408          */
409         ENABLE_INTERRUPTS(CLBR_NONE)
410         movl %eax,%eax
411         pushq_cfi %rax
412         cld
413         /* note the registers are not zero extended to the sf.
414            this could be a problem. */
415         SAVE_ARGS 0,1,0
416         orl $TS_COMPAT,TI_status+THREAD_INFO(%rsp,RIP-ARGOFFSET)
417         testl $_TIF_WORK_SYSCALL_ENTRY,TI_flags+THREAD_INFO(%rsp,RIP-ARGOFFSET)
418         jnz ia32_tracesys
419         cmpq $(IA32_NR_syscalls-1),%rax
420         ja ia32_badsys
421 ia32_do_call:
422         IA32_ARG_FIXUP
423         call *ia32_sys_call_table(,%rax,8) # xxx: rip relative
424 ia32_sysret:
425         movq %rax,RAX-ARGOFFSET(%rsp)
426 ia32_ret_from_sys_call:
427         CLEAR_RREGS -ARGOFFSET
428         jmp int_ret_from_sys_call 
429
430 ia32_tracesys:                   
431         SAVE_REST
432         CLEAR_RREGS
433         movq $-ENOSYS,RAX(%rsp) /* ptrace can change this for a bad syscall */
434         movq %rsp,%rdi        /* &pt_regs -> arg1 */
435         call syscall_trace_enter
436         LOAD_ARGS32 ARGOFFSET  /* reload args from stack in case ptrace changed it */
437         RESTORE_REST
438         cmpq $(IA32_NR_syscalls-1),%rax
439         ja  int_ret_from_sys_call       /* ia32_tracesys has set RAX(%rsp) */
440         jmp ia32_do_call
441 END(ia32_syscall)
442
443 ia32_badsys:
444         movq $0,ORIG_RAX-ARGOFFSET(%rsp)
445         movq $-ENOSYS,%rax
446         jmp ia32_sysret
447
448         CFI_ENDPROC
449         
450         .macro PTREGSCALL label, func, arg
451         ALIGN
452 GLOBAL(\label)
453         leaq \func(%rip),%rax
454         leaq -ARGOFFSET+8(%rsp),\arg    /* 8 for return address */
455         jmp  ia32_ptregs_common 
456         .endm
457
458         CFI_STARTPROC32
459
460         PTREGSCALL stub32_rt_sigreturn, sys32_rt_sigreturn, %rdi
461         PTREGSCALL stub32_sigreturn, sys32_sigreturn, %rdi
462         PTREGSCALL stub32_sigaltstack, sys32_sigaltstack, %rdx
463         PTREGSCALL stub32_execve, sys32_execve, %rcx
464         PTREGSCALL stub32_fork, sys_fork, %rdi
465         PTREGSCALL stub32_clone, sys32_clone, %rdx
466         PTREGSCALL stub32_vfork, sys_vfork, %rdi
467         PTREGSCALL stub32_iopl, sys_iopl, %rsi
468
469         ALIGN
470 ia32_ptregs_common:
471         popq %r11
472         CFI_ENDPROC
473         CFI_STARTPROC32 simple
474         CFI_SIGNAL_FRAME
475         CFI_DEF_CFA     rsp,SS+8-ARGOFFSET
476         CFI_REL_OFFSET  rax,RAX-ARGOFFSET
477         CFI_REL_OFFSET  rcx,RCX-ARGOFFSET
478         CFI_REL_OFFSET  rdx,RDX-ARGOFFSET
479         CFI_REL_OFFSET  rsi,RSI-ARGOFFSET
480         CFI_REL_OFFSET  rdi,RDI-ARGOFFSET
481         CFI_REL_OFFSET  rip,RIP-ARGOFFSET
482 /*      CFI_REL_OFFSET  cs,CS-ARGOFFSET*/
483 /*      CFI_REL_OFFSET  rflags,EFLAGS-ARGOFFSET*/
484         CFI_REL_OFFSET  rsp,RSP-ARGOFFSET
485 /*      CFI_REL_OFFSET  ss,SS-ARGOFFSET*/
486         SAVE_REST
487         call *%rax
488         RESTORE_REST
489         jmp  ia32_sysret        /* misbalances the return cache */
490         CFI_ENDPROC
491 END(ia32_ptregs_common)