Make LABEL a builtin opcode.
[oota-llvm.git] / lib / Target / PowerPC / PPCJITInfo.cpp
index a3ca3c52f88473f3f8b282564ad8664d43e0dc41..02554ff730869559bae39be936d2ce030fbe0894 100644 (file)
@@ -18,7 +18,6 @@
 #include "llvm/Config/alloca.h"
 #include "llvm/Support/Debug.h"
 #include <set>
-#include <iostream>
 using namespace llvm;
 
 static TargetJITInfo::JITCompilerFn JITCompilerFunction;
@@ -31,7 +30,7 @@ static TargetJITInfo::JITCompilerFn JITCompilerFunction;
   ((25 << 26) | ((RS) << 21) | ((RD) << 16) | ((UIMM16) & 65535))
 #define BUILD_RLDICR(RD,RS,SH,ME) \
   ((30 << 26) | ((RS) << 21) | ((RD) << 16) | (((SH) & 31) << 11) | \
-   (((ME) & 63) << 6) | (1 << 3) | (((SH) >> 5) & 1))
+   (((ME) & 63) << 6) | (1 << 2) | ((((SH) >> 5) & 1) << 1))
 #define BUILD_MTSPR(RS,SPR)      \
   ((31 << 26) | ((RS) << 21) | ((SPR) << 16) | (467 << 1))
 #define BUILD_BCCTRx(BO,BI,LINK) \
@@ -70,7 +69,8 @@ static void EmitBranchToAt(uint64_t At, uint64_t To, bool isCall, bool is64Bit){
 extern "C" void PPC32CompilationCallback();
 extern "C" void PPC64CompilationCallback();
 
-#if (defined(__POWERPC__) || defined (__ppc__) || defined(_POWER)) && !defined(__ppc64__)
+#if (defined(__POWERPC__) || defined (__ppc__) || defined(_POWER)) && \
+    !defined(__ppc64__)
 // CompilationCallback stub - We can't use a C function with inline assembly in
 // it, because we the prolog/epilog inserted by GCC won't work for us.  Instead,
 // write our own wrapper, which does things our way, so we have complete control
@@ -84,9 +84,14 @@ asm(
     // FIXME: need to save v[0-19] for altivec?
     // FIXME: could shrink frame
     // Set up a proper stack frame
-    "stwu r1, -208(r1)\n"
+    // FIXME Layout
+    //   PowerPC64 ABI linkage    -  24 bytes
+    //                 parameters -  32 bytes
+    //   13 double registers      - 104 bytes
+    //   8 int registers          -  32 bytes
     "mflr r0\n"
-    "stw r0,  216(r1)\n"
+    "stw r0,  8(r1)\n"
+    "stwu r1, -208(r1)\n"
     // Save all int arg registers
     "stw r10, 204(r1)\n"    "stw r9,  200(r1)\n"
     "stw r8,  196(r1)\n"    "stw r7,  192(r1)\n"
@@ -103,6 +108,7 @@ asm(
     // Arguments to Compilation Callback:
     // r3 - our lr (address of the call instruction in stub plus 4)
     // r4 - stub's lr (address of instruction that called the stub plus 4)
+    // r5 - is64Bit - always 0.
     "mr   r3, r0\n"
     "lwz  r2, 208(r1)\n" // stub's frame
     "lwz  r4, 8(r2)\n" // stub's lr
@@ -135,7 +141,8 @@ void PPC32CompilationCallback() {
 }
 #endif
 
-#if (defined(__POWERPC__) || defined (__ppc__) || defined(_POWER)) && defined(__ppc64__)
+#if (defined(__POWERPC__) || defined (__ppc__) || defined(_POWER)) && \
+    defined(__ppc64__)
 asm(
     ".text\n"
     ".align 2\n"
@@ -144,46 +151,52 @@ asm(
     // Make space for 8 ints r[3-10] and 13 doubles f[1-13] and the 
     // FIXME: need to save v[0-19] for altivec?
     // Set up a proper stack frame
-    "stdu r1, -208(r1)\n"
+    // Layout
+    //   PowerPC64 ABI linkage    -  48 bytes
+    //                 parameters -  64 bytes
+    //   13 double registers      - 104 bytes
+    //   8 int registers          -  64 bytes
     "mflr r0\n"
-    "std r0,  224(r1)\n"
+    "std r0,  16(r1)\n"
+    "stdu r1, -280(r1)\n"
     // Save all int arg registers
-    "std r10, 200(r1)\n"    "std r9,  192(r1)\n"
-    "std r8,  184(r1)\n"    "std r7,  176(r1)\n"
-    "std r6,  168(r1)\n"    "std r5,  160(r1)\n"
-    "std r4,  152(r1)\n"    "std r3,  144(r1)\n"
+    "std r10, 272(r1)\n"    "std r9,  264(r1)\n"
+    "std r8,  256(r1)\n"    "std r7,  248(r1)\n"
+    "std r6,  240(r1)\n"    "std r5,  232(r1)\n"
+    "std r4,  224(r1)\n"    "std r3,  216(r1)\n"
     // Save all call-clobbered FP regs.
-    "stfd f13, 136(r1)\n"   "stfd f12, 128(r1)\n"
-    "stfd f11, 120(r1)\n"   "stfd f10, 112(r1)\n"
-    "stfd f9,  104(r1)\n"   "stfd f8,   96(r1)\n"
-    "stfd f7,   88(r1)\n"   "stfd f6,   80(r1)\n"
-    "stfd f5,   72(r1)\n"   "stfd f4,   64(r1)\n"
-    "stfd f3,   56(r1)\n"   "stfd f2,   48(r1)\n"
-    "stfd f1,   40(r1)\n"
+    "stfd f13, 208(r1)\n"    "stfd f12, 200(r1)\n"
+    "stfd f11, 192(r1)\n"    "stfd f10, 184(r1)\n"
+    "stfd f9,  176(r1)\n"    "stfd f8,  168(r1)\n"
+    "stfd f7,  160(r1)\n"    "stfd f6,  152(r1)\n"
+    "stfd f5,  144(r1)\n"    "stfd f4,  136(r1)\n"
+    "stfd f3,  128(r1)\n"    "stfd f2,  120(r1)\n"
+    "stfd f1,  112(r1)\n"
     // Arguments to Compilation Callback:
     // r3 - our lr (address of the call instruction in stub plus 4)
     // r4 - stub's lr (address of instruction that called the stub plus 4)
+    // r5 - is64Bit - always 1.
     "mr   r3, r0\n"
-    "ld   r2, 208(r1)\n" // stub's frame
+    "ld   r2, 280(r1)\n" // stub's frame
     "ld   r4, 16(r2)\n"  // stub's lr
     "li   r5, 1\n"       // 1 == 64 bit
     "bl _PPCCompilationCallbackC\n"
     "mtctr r3\n"
     // Restore all int arg registers
-    "ld r10, 200(r1)\n"    "ld r9,  192(r1)\n"
-    "ld r8,  184(r1)\n"    "ld r7,  176(r1)\n"
-    "ld r6,  168(r1)\n"    "ld r5,  160(r1)\n"
-    "ld r4,  152(r1)\n"    "ld r3,  144(r1)\n"
+    "ld r10, 272(r1)\n"    "ld r9,  264(r1)\n"
+    "ld r8,  256(r1)\n"    "ld r7,  248(r1)\n"
+    "ld r6,  240(r1)\n"    "ld r5,  232(r1)\n"
+    "ld r4,  224(r1)\n"    "ld r3,  216(r1)\n"
     // Restore all FP arg registers
-    "lfd f13, 136(r1)\n"    "lfd f12, 128(r1)\n"
-    "lfd f11, 120(r1)\n"    "lfd f10, 112(r1)\n"
-    "lfd f9,  104(r1)\n"    "lfd f8,   96(r1)\n"
-    "lfd f7,   88(r1)\n"    "lfd f6,   80(r1)\n"
-    "lfd f5,   72(r1)\n"    "lfd f4,   64(r1)\n"
-    "lfd f3,   56(r1)\n"    "lfd f2,   48(r1)\n"
-    "lfd f1,   40(r1)\n"
+    "lfd f13, 208(r1)\n"    "lfd f12, 200(r1)\n"
+    "lfd f11, 192(r1)\n"    "lfd f10, 184(r1)\n"
+    "lfd f9,  176(r1)\n"    "lfd f8,  168(r1)\n"
+    "lfd f7,  160(r1)\n"    "lfd f6,  152(r1)\n"
+    "lfd f5,  144(r1)\n"    "lfd f4,  136(r1)\n"
+    "lfd f3,  128(r1)\n"    "lfd f2,  120(r1)\n"
+    "lfd f1,  112(r1)\n"
     // Pop 3 frames off the stack and branch to target
-    "ld  r1, 208(r1)\n"
+    "ld  r1, 280(r1)\n"
     "ld  r2, 16(r1)\n"
     "mtlr r2\n"
     "bctr\n"
@@ -312,15 +325,12 @@ void PPCJITInfo::relocate(void *Function, MachineRelocation *MR,
              "Relocation out of range!");
       *RelocPos |= (ResultPtr & ((1 << 14)-1))  << 2;
       break;
-    case PPC::reloc_absolute_ptr_high: // Pointer relocations.
-    case PPC::reloc_absolute_ptr_low:
     case PPC::reloc_absolute_high:     // high bits of ref -> low 16 of instr
     case PPC::reloc_absolute_low: {    // low bits of ref  -> low 16 of instr
       ResultPtr += MR->getConstantVal();
 
       // If this is a high-part access, get the high-part.
-      if (MR->getRelocationType() == PPC::reloc_absolute_high ||
-          MR->getRelocationType() == PPC::reloc_absolute_ptr_high) {
+      if (MR->getRelocationType() == PPC::reloc_absolute_high) {
         // If the low part will have a carry (really a borrow) from the low
         // 16-bits into the high 16, add a bit to borrow from.
         if (((int)ResultPtr << 16) < 0)