Provide annotation for SSE version of callback. It's even more
[oota-llvm.git] / lib / Target / X86 / X86JITInfo.cpp
index b32fab21db0f99e6ba7d17767c5959a0d883e8b7..01d2c5c693a4055987345f107a56c310414c094b 100644 (file)
@@ -116,11 +116,18 @@ extern "C" {
     ".align 8\n"
     ".globl " ASMPREFIX  "X86CompilationCallback\n"
   ASMPREFIX "X86CompilationCallback:\n"
+    ".cfi_startproc\n"
     "pushl   %ebp\n"
+    ".cfi_def_cfa_offset 8\n"
+    ".cfi_offset ebp, -8\n"
     "movl    %esp, %ebp\n"    // Standard prologue
+    ".cfi_def_cfa_register ebp\n"
     "pushl   %eax\n"
+    ".cfi_rel_offset eax, 0\n"
     "pushl   %edx\n"          // Save EAX/EDX/ECX
+    ".cfi_rel_offset edx, 4\n"
     "pushl   %ecx\n"
+    ".cfi_rel_offset ecx, 8\n"
 #if defined(__APPLE__)
     "andl    $-16, %esp\n"    // Align ESP on 16-byte boundary
 #endif
@@ -130,12 +137,23 @@ extern "C" {
     "movl    %ebp, (%esp)\n"
     "call    " ASMPREFIX "X86CompilationCallback2\n"
     "movl    %ebp, %esp\n"    // Restore ESP
+    ".cfi_def_cfa_register esp\n"
     "subl    $12, %esp\n"
+    ".cfi_adjust_cfa_offset 12\n"
     "popl    %ecx\n"
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore ecx\n"
     "popl    %edx\n"
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore edx\n"
     "popl    %eax\n"
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore eax\n"
     "popl    %ebp\n"
-    "ret\n");
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore ebp\n"
+    "ret\n"
+    ".cfi_endproc\n");
 
   // Same as X86CompilationCallback but also saves XMM argument registers.
   void X86CompilationCallback_SSE(void);
@@ -144,14 +162,24 @@ extern "C" {
     ".align 8\n"
     ".globl " ASMPREFIX  "X86CompilationCallback_SSE\n"
   ASMPREFIX "X86CompilationCallback_SSE:\n"
+    ".cfi_startproc\n"
     "pushl   %ebp\n"
+    ".cfi_def_cfa_offset 8\n"
+    ".cfi_offset ebp, -8\n"
     "movl    %esp, %ebp\n"    // Standard prologue
+    ".cfi_def_cfa_register ebp\n"
     "pushl   %eax\n"
+    ".cfi_rel_offset eax, 0\n"
     "pushl   %edx\n"          // Save EAX/EDX/ECX
+    ".cfi_rel_offset edx, 4\n"
     "pushl   %ecx\n"
+    ".cfi_rel_offset ecx, 8\n"
     "andl    $-16, %esp\n"    // Align ESP on 16-byte boundary
     // Save all XMM arg registers
     "subl    $64, %esp\n"
+    // FIXME: provide frame move information for xmm registers.
+    // This can be tricky, because CFA register is ebp (unaligned)
+    // and we need to produce offsets relative to it.
     "movaps  %xmm0, (%esp)\n"
     "movaps  %xmm1, 16(%esp)\n"
     "movaps  %xmm2, 32(%esp)\n"
@@ -163,16 +191,31 @@ extern "C" {
     "call    " ASMPREFIX "X86CompilationCallback2\n"
     "addl    $16, %esp\n"
     "movaps  48(%esp), %xmm3\n"
+    ".cfi_restore xmm3\n"
     "movaps  32(%esp), %xmm2\n"
+    ".cfi_restore xmm2\n"
     "movaps  16(%esp), %xmm1\n"
+    ".cfi_restore xmm1\n"
     "movaps  (%esp), %xmm0\n"
+    ".cfi_restore xmm0\n"
     "movl    %ebp, %esp\n"    // Restore ESP
+    ".cfi_def_cfa_register esp\n"
     "subl    $12, %esp\n"
+    ".cfi_adjust_cfa_offset 12\n"
     "popl    %ecx\n"
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore ecx\n"
     "popl    %edx\n"
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore edx\n"
     "popl    %eax\n"
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore eax\n"
     "popl    %ebp\n"
-    "ret\n");
+    ".cfi_adjust_cfa_offset -4\n"
+    ".cfi_restore ebp\n"
+    "ret\n"
+    ".cfi_endproc\n");
 #else
   void X86CompilationCallback2(void);
 
@@ -306,9 +349,20 @@ void *X86JITInfo::emitFunctionStub(void *Fn, MachineCodeEmitter &MCE) {
   bool NotCC = Fn != (void*)(intptr_t)X86CompilationCallback;
 #endif
   if (NotCC) {
+#ifdef __x86_64__
+    MCE.startFunctionStub(13, 4);
+    MCE.emitByte(0x49);          // REX prefix
+    MCE.emitByte(0xB8+2);        // movabsq r10
+    MCE.emitWordLE(((unsigned *)&Fn)[0]);
+    MCE.emitWordLE(((unsigned *)&Fn)[1]);
+    MCE.emitByte(0x41);          // REX prefix
+    MCE.emitByte(0xFF);          // jmpq *r10
+    MCE.emitByte(2 | (4 << 3) | (3 << 6));
+#else
     MCE.startFunctionStub(5, 4);
     MCE.emitByte(0xE9);
     MCE.emitWordLE((intptr_t)Fn-MCE.getCurrentPCValue()-4);
+#endif
     return MCE.finishFunctionStub(0);
   }