Hush a noisy warning from GCC 4.2 about overflow during conversion by using
[oota-llvm.git] / lib / ExecutionEngine / JIT / JITEmitter.cpp
1 //===-- JITEmitter.cpp - Write machine code to executable memory ----------===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file was developed by the LLVM research group and is distributed under
6 // the University of Illinois Open Source License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file defines a MachineCodeEmitter object that is used by the JIT to
11 // write machine code to memory and remember where relocatable values are.
12 //
13 //===----------------------------------------------------------------------===//
14
15 #define DEBUG_TYPE "jit"
16 #include "JIT.h"
17 #include "llvm/Constant.h"
18 #include "llvm/Module.h"
19 #include "llvm/Type.h"
20 #include "llvm/CodeGen/MachineCodeEmitter.h"
21 #include "llvm/CodeGen/MachineFunction.h"
22 #include "llvm/CodeGen/MachineConstantPool.h"
23 #include "llvm/CodeGen/MachineJumpTableInfo.h"
24 #include "llvm/CodeGen/MachineRelocation.h"
25 #include "llvm/ExecutionEngine/GenericValue.h"
26 #include "llvm/Target/TargetData.h"
27 #include "llvm/Target/TargetJITInfo.h"
28 #include "llvm/Target/TargetMachine.h"
29 #include "llvm/Support/Debug.h"
30 #include "llvm/Support/MutexGuard.h"
31 #include "llvm/System/Disassembler.h"
32 #include "llvm/ADT/Statistic.h"
33 #include "llvm/System/Memory.h"
34 #include <algorithm>
35 using namespace llvm;
36
37 STATISTIC(NumBytes, "Number of bytes of machine code compiled");
38 STATISTIC(NumRelos, "Number of relocations applied");
39 static JIT *TheJIT = 0;
40
41 //===----------------------------------------------------------------------===//
42 // JITMemoryManager code.
43 //
44 namespace {
45   /// MemoryRangeHeader - For a range of memory, this is the header that we put
46   /// on the block of memory.  It is carefully crafted to be one word of memory.
47   /// Allocated blocks have just this header, free'd blocks have FreeRangeHeader
48   /// which starts with this.
49   struct FreeRangeHeader;
50   struct MemoryRangeHeader {
51     /// ThisAllocated - This is true if this block is currently allocated.  If
52     /// not, this can be converted to a FreeRangeHeader.
53     unsigned ThisAllocated : 1;
54     
55     /// PrevAllocated - Keep track of whether the block immediately before us is
56     /// allocated.  If not, the word immediately before this header is the size
57     /// of the previous block.
58     unsigned PrevAllocated : 1;
59     
60     /// BlockSize - This is the size in bytes of this memory block,
61     /// including this header.
62     uintptr_t BlockSize : (sizeof(intptr_t)*8 - 2);
63     
64
65     /// getBlockAfter - Return the memory block immediately after this one.
66     ///
67     MemoryRangeHeader &getBlockAfter() const {
68       return *(MemoryRangeHeader*)((char*)this+BlockSize);
69     }
70     
71     /// getFreeBlockBefore - If the block before this one is free, return it,
72     /// otherwise return null.
73     FreeRangeHeader *getFreeBlockBefore() const {
74       if (PrevAllocated) return 0;
75       intptr_t PrevSize = ((intptr_t *)this)[-1];
76       return (FreeRangeHeader*)((char*)this-PrevSize);
77     }
78     
79     /// FreeBlock - Turn an allocated block into a free block, adjusting
80     /// bits in the object headers, and adding an end of region memory block.
81     FreeRangeHeader *FreeBlock(FreeRangeHeader *FreeList);
82     
83     /// TrimAllocationToSize - If this allocated block is significantly larger
84     /// than NewSize, split it into two pieces (where the former is NewSize
85     /// bytes, including the header), and add the new block to the free list.
86     FreeRangeHeader *TrimAllocationToSize(FreeRangeHeader *FreeList, 
87                                           uint64_t NewSize);
88   };
89
90   /// FreeRangeHeader - For a memory block that isn't already allocated, this
91   /// keeps track of the current block and has a pointer to the next free block.
92   /// Free blocks are kept on a circularly linked list.
93   struct FreeRangeHeader : public MemoryRangeHeader {
94     FreeRangeHeader *Prev;
95     FreeRangeHeader *Next;
96     
97     /// getMinBlockSize - Get the minimum size for a memory block.  Blocks
98     /// smaller than this size cannot be created.
99     static unsigned getMinBlockSize() {
100       return sizeof(FreeRangeHeader)+sizeof(intptr_t);
101     }
102     
103     /// SetEndOfBlockSizeMarker - The word at the end of every free block is
104     /// known to be the size of the free block.  Set it for this block.
105     void SetEndOfBlockSizeMarker() {
106       void *EndOfBlock = (char*)this + BlockSize;
107       ((intptr_t *)EndOfBlock)[-1] = BlockSize;
108     }
109
110     FreeRangeHeader *RemoveFromFreeList() {
111       assert(Next->Prev == this && Prev->Next == this && "Freelist broken!");
112       Next->Prev = Prev;
113       return Prev->Next = Next;
114     }
115     
116     void AddToFreeList(FreeRangeHeader *FreeList) {
117       Next = FreeList;
118       Prev = FreeList->Prev;
119       Prev->Next = this;
120       Next->Prev = this;
121     }
122
123     /// GrowBlock - The block after this block just got deallocated.  Merge it
124     /// into the current block.
125     void GrowBlock(uintptr_t NewSize);
126     
127     /// AllocateBlock - Mark this entire block allocated, updating freelists
128     /// etc.  This returns a pointer to the circular free-list.
129     FreeRangeHeader *AllocateBlock();
130   };
131 }
132
133
134 /// AllocateBlock - Mark this entire block allocated, updating freelists
135 /// etc.  This returns a pointer to the circular free-list.
136 FreeRangeHeader *FreeRangeHeader::AllocateBlock() {
137   assert(!ThisAllocated && !getBlockAfter().PrevAllocated &&
138          "Cannot allocate an allocated block!");
139   // Mark this block allocated.
140   ThisAllocated = 1;
141   getBlockAfter().PrevAllocated = 1;
142  
143   // Remove it from the free list.
144   return RemoveFromFreeList();
145 }
146
147 /// FreeBlock - Turn an allocated block into a free block, adjusting
148 /// bits in the object headers, and adding an end of region memory block.
149 /// If possible, coalesce this block with neighboring blocks.  Return the
150 /// FreeRangeHeader to allocate from.
151 FreeRangeHeader *MemoryRangeHeader::FreeBlock(FreeRangeHeader *FreeList) {
152   MemoryRangeHeader *FollowingBlock = &getBlockAfter();
153   assert(ThisAllocated && "This block is already allocated!");
154   assert(FollowingBlock->PrevAllocated && "Flags out of sync!");
155   
156   FreeRangeHeader *FreeListToReturn = FreeList;
157   
158   // If the block after this one is free, merge it into this block.
159   if (!FollowingBlock->ThisAllocated) {
160     FreeRangeHeader &FollowingFreeBlock = *(FreeRangeHeader *)FollowingBlock;
161     // "FreeList" always needs to be a valid free block.  If we're about to
162     // coalesce with it, update our notion of what the free list is.
163     if (&FollowingFreeBlock == FreeList) {
164       FreeList = FollowingFreeBlock.Next;
165       FreeListToReturn = 0;
166       assert(&FollowingFreeBlock != FreeList && "No tombstone block?");
167     }
168     FollowingFreeBlock.RemoveFromFreeList();
169     
170     // Include the following block into this one.
171     BlockSize += FollowingFreeBlock.BlockSize;
172     FollowingBlock = &FollowingFreeBlock.getBlockAfter();
173     
174     // Tell the block after the block we are coalescing that this block is
175     // allocated.
176     FollowingBlock->PrevAllocated = 1;
177   }
178   
179   assert(FollowingBlock->ThisAllocated && "Missed coalescing?");
180   
181   if (FreeRangeHeader *PrevFreeBlock = getFreeBlockBefore()) {
182     PrevFreeBlock->GrowBlock(PrevFreeBlock->BlockSize + BlockSize);
183     return FreeListToReturn ? FreeListToReturn : PrevFreeBlock;
184   }
185
186   // Otherwise, mark this block free.
187   FreeRangeHeader &FreeBlock = *(FreeRangeHeader*)this;
188   FollowingBlock->PrevAllocated = 0;
189   FreeBlock.ThisAllocated = 0;
190
191   // Link this into the linked list of free blocks.
192   FreeBlock.AddToFreeList(FreeList);
193
194   // Add a marker at the end of the block, indicating the size of this free
195   // block.
196   FreeBlock.SetEndOfBlockSizeMarker();
197   return FreeListToReturn ? FreeListToReturn : &FreeBlock;
198 }
199
200 /// GrowBlock - The block after this block just got deallocated.  Merge it
201 /// into the current block.
202 void FreeRangeHeader::GrowBlock(uintptr_t NewSize) {
203   assert(NewSize > BlockSize && "Not growing block?");
204   BlockSize = NewSize;
205   SetEndOfBlockSizeMarker();
206   getBlockAfter().PrevAllocated = 0;
207 }
208
209 /// TrimAllocationToSize - If this allocated block is significantly larger
210 /// than NewSize, split it into two pieces (where the former is NewSize
211 /// bytes, including the header), and add the new block to the free list.
212 FreeRangeHeader *MemoryRangeHeader::
213 TrimAllocationToSize(FreeRangeHeader *FreeList, uint64_t NewSize) {
214   assert(ThisAllocated && getBlockAfter().PrevAllocated &&
215          "Cannot deallocate part of an allocated block!");
216
217   // Round up size for alignment of header.
218   unsigned HeaderAlign = __alignof(FreeRangeHeader);
219   NewSize = (NewSize+ (HeaderAlign-1)) & ~(HeaderAlign-1);
220   
221   // Size is now the size of the block we will remove from the start of the
222   // current block.
223   assert(NewSize <= BlockSize &&
224          "Allocating more space from this block than exists!");
225   
226   // If splitting this block will cause the remainder to be too small, do not
227   // split the block.
228   if (BlockSize <= NewSize+FreeRangeHeader::getMinBlockSize())
229     return FreeList;
230   
231   // Otherwise, we splice the required number of bytes out of this block, form
232   // a new block immediately after it, then mark this block allocated.
233   MemoryRangeHeader &FormerNextBlock = getBlockAfter();
234   
235   // Change the size of this block.
236   BlockSize = NewSize;
237   
238   // Get the new block we just sliced out and turn it into a free block.
239   FreeRangeHeader &NewNextBlock = (FreeRangeHeader &)getBlockAfter();
240   NewNextBlock.BlockSize = (char*)&FormerNextBlock - (char*)&NewNextBlock;
241   NewNextBlock.ThisAllocated = 0;
242   NewNextBlock.PrevAllocated = 1;
243   NewNextBlock.SetEndOfBlockSizeMarker();
244   FormerNextBlock.PrevAllocated = 0;
245   NewNextBlock.AddToFreeList(FreeList);
246   return &NewNextBlock;
247 }
248
249  
250 namespace {  
251   /// JITMemoryManager - Manage memory for the JIT code generation in a logical,
252   /// sane way.  This splits a large block of MAP_NORESERVE'd memory into two
253   /// sections, one for function stubs, one for the functions themselves.  We
254   /// have to do this because we may need to emit a function stub while in the
255   /// middle of emitting a function, and we don't know how large the function we
256   /// are emitting is.  This never bothers to release the memory, because when
257   /// we are ready to destroy the JIT, the program exits.
258   class JITMemoryManager {
259     std::vector<sys::MemoryBlock> Blocks; // Memory blocks allocated by the JIT
260     FreeRangeHeader *FreeMemoryList;      // Circular list of free blocks.
261     
262     // When emitting code into a memory block, this is the block.
263     MemoryRangeHeader *CurBlock;
264     
265     unsigned char *CurStubPtr, *StubBase;
266     unsigned char *GOTBase;      // Target Specific reserved memory
267
268     // Centralize memory block allocation.
269     sys::MemoryBlock getNewMemoryBlock(unsigned size);
270     
271     std::map<const Function*, MemoryRangeHeader*> FunctionBlocks;
272   public:
273     JITMemoryManager(bool useGOT);
274     ~JITMemoryManager();
275
276     inline unsigned char *allocateStub(unsigned StubSize, unsigned Alignment);
277     
278     /// startFunctionBody - When a function starts, allocate a block of free
279     /// executable memory, returning a pointer to it and its actual size.
280     unsigned char *startFunctionBody(uintptr_t &ActualSize) {
281       CurBlock = FreeMemoryList;
282       
283       // Allocate the entire memory block.
284       FreeMemoryList = FreeMemoryList->AllocateBlock();
285       ActualSize = CurBlock->BlockSize-sizeof(MemoryRangeHeader);
286       return (unsigned char *)(CurBlock+1);
287     }
288     
289     /// endFunctionBody - The function F is now allocated, and takes the memory
290     /// in the range [FunctionStart,FunctionEnd).
291     void endFunctionBody(const Function *F, unsigned char *FunctionStart,
292                          unsigned char *FunctionEnd) {
293       assert(FunctionEnd > FunctionStart);
294       assert(FunctionStart == (unsigned char *)(CurBlock+1) &&
295              "Mismatched function start/end!");
296       
297       uintptr_t BlockSize = FunctionEnd - (unsigned char *)CurBlock;
298       FunctionBlocks[F] = CurBlock;
299
300       // Release the memory at the end of this block that isn't needed.
301       FreeMemoryList =CurBlock->TrimAllocationToSize(FreeMemoryList, BlockSize);
302     }
303     
304     unsigned char *getGOTBase() const {
305       return GOTBase;
306     }
307     bool isManagingGOT() const {
308       return GOTBase != NULL;
309     }
310     
311     /// deallocateMemForFunction - Deallocate all memory for the specified
312     /// function body.
313     void deallocateMemForFunction(const Function *F) {
314       std::map<const Function*, MemoryRangeHeader*>::iterator
315         I = FunctionBlocks.find(F);
316       if (I == FunctionBlocks.end()) return;
317       
318       // Find the block that is allocated for this function.
319       MemoryRangeHeader *MemRange = I->second;
320       assert(MemRange->ThisAllocated && "Block isn't allocated!");
321       
322       // Fill the buffer with garbage!
323       DEBUG(memset(MemRange+1, 0xCD, MemRange->BlockSize-sizeof(*MemRange)));
324       
325       // Free the memory.
326       FreeMemoryList = MemRange->FreeBlock(FreeMemoryList);
327       
328       // Finally, remove this entry from FunctionBlocks.
329       FunctionBlocks.erase(I);
330     }
331   };
332 }
333
334 JITMemoryManager::JITMemoryManager(bool useGOT) {
335   // Allocate a 16M block of memory for functions.
336   sys::MemoryBlock MemBlock = getNewMemoryBlock(16 << 20);
337
338   unsigned char *MemBase = reinterpret_cast<unsigned char*>(MemBlock.base());
339
340   // Allocate stubs backwards from the base, allocate functions forward
341   // from the base.
342   StubBase   = MemBase;
343   CurStubPtr = MemBase + 512*1024; // Use 512k for stubs, working backwards.
344   
345   // We set up the memory chunk with 4 mem regions, like this:
346   //  [ START
347   //    [ Free      #0 ] -> Large space to allocate functions from.
348   //    [ Allocated #1 ] -> Tiny space to separate regions.
349   //    [ Free      #2 ] -> Tiny space so there is always at least 1 free block.
350   //    [ Allocated #3 ] -> Tiny space to prevent looking past end of block.
351   //  END ]
352   //
353   // The last three blocks are never deallocated or touched.
354   
355   // Add MemoryRangeHeader to the end of the memory region, indicating that
356   // the space after the block of memory is allocated.  This is block #3.
357   MemoryRangeHeader *Mem3 = (MemoryRangeHeader*)(MemBase+MemBlock.size())-1;
358   Mem3->ThisAllocated = 1;
359   Mem3->PrevAllocated = 0;
360   Mem3->BlockSize     = 0;
361   
362   /// Add a tiny free region so that the free list always has one entry.
363   FreeRangeHeader *Mem2 = 
364     (FreeRangeHeader *)(((char*)Mem3)-FreeRangeHeader::getMinBlockSize());
365   Mem2->ThisAllocated = 0;
366   Mem2->PrevAllocated = 1;
367   Mem2->BlockSize     = FreeRangeHeader::getMinBlockSize();
368   Mem2->SetEndOfBlockSizeMarker();
369   Mem2->Prev = Mem2;   // Mem2 *is* the free list for now.
370   Mem2->Next = Mem2;
371
372   /// Add a tiny allocated region so that Mem2 is never coalesced away.
373   MemoryRangeHeader *Mem1 = (MemoryRangeHeader*)Mem2-1;
374   Mem1->ThisAllocated = 1;
375   Mem1->PrevAllocated = 0;
376   Mem1->BlockSize     = (char*)Mem2 - (char*)Mem1;
377   
378   // Add a FreeRangeHeader to the start of the function body region, indicating
379   // that the space is free.  Mark the previous block allocated so we never look
380   // at it.
381   FreeRangeHeader *Mem0 = (FreeRangeHeader*)CurStubPtr;
382   Mem0->ThisAllocated = 0;
383   Mem0->PrevAllocated = 1;
384   Mem0->BlockSize = (char*)Mem1-(char*)Mem0;
385   Mem0->SetEndOfBlockSizeMarker();
386   Mem0->AddToFreeList(Mem2);
387   
388   // Start out with the freelist pointing to Mem0.
389   FreeMemoryList = Mem0;
390
391   // Allocate the GOT.
392   GOTBase = NULL;
393   if (useGOT) GOTBase = new unsigned char[sizeof(void*) * 8192];
394 }
395
396 JITMemoryManager::~JITMemoryManager() {
397   for (unsigned i = 0, e = Blocks.size(); i != e; ++i)
398     sys::Memory::ReleaseRWX(Blocks[i]);
399   
400   delete[] GOTBase;
401   Blocks.clear();
402 }
403
404 unsigned char *JITMemoryManager::allocateStub(unsigned StubSize,
405                                               unsigned Alignment) {
406   CurStubPtr -= StubSize;
407   CurStubPtr = (unsigned char*)(((intptr_t)CurStubPtr) &
408                                 ~(intptr_t)(Alignment-1));
409   if (CurStubPtr < StubBase) {
410     // FIXME: allocate a new block
411     cerr << "JIT ran out of memory for function stubs!\n";
412     abort();
413   }
414   return CurStubPtr;
415 }
416
417 sys::MemoryBlock JITMemoryManager::getNewMemoryBlock(unsigned size) {
418   // Allocate a new block close to the last one.
419   const sys::MemoryBlock *BOld = Blocks.empty() ? 0 : &Blocks.front();
420   std::string ErrMsg;
421   sys::MemoryBlock B = sys::Memory::AllocateRWX(size, BOld, &ErrMsg);
422   if (B.base() == 0) {
423     cerr << "Allocation failed when allocating new memory in the JIT\n";
424     cerr << ErrMsg << "\n";
425     abort();
426   }
427   Blocks.push_back(B);
428   return B;
429 }
430
431 //===----------------------------------------------------------------------===//
432 // JIT lazy compilation code.
433 //
434 namespace {
435   class JITResolverState {
436   private:
437     /// FunctionToStubMap - Keep track of the stub created for a particular
438     /// function so that we can reuse them if necessary.
439     std::map<Function*, void*> FunctionToStubMap;
440
441     /// StubToFunctionMap - Keep track of the function that each stub
442     /// corresponds to.
443     std::map<void*, Function*> StubToFunctionMap;
444
445   public:
446     std::map<Function*, void*>& getFunctionToStubMap(const MutexGuard& locked) {
447       assert(locked.holds(TheJIT->lock));
448       return FunctionToStubMap;
449     }
450
451     std::map<void*, Function*>& getStubToFunctionMap(const MutexGuard& locked) {
452       assert(locked.holds(TheJIT->lock));
453       return StubToFunctionMap;
454     }
455   };
456
457   /// JITResolver - Keep track of, and resolve, call sites for functions that
458   /// have not yet been compiled.
459   class JITResolver {
460     /// LazyResolverFn - The target lazy resolver function that we actually
461     /// rewrite instructions to use.
462     TargetJITInfo::LazyResolverFn LazyResolverFn;
463
464     JITResolverState state;
465
466     /// ExternalFnToStubMap - This is the equivalent of FunctionToStubMap for
467     /// external functions.
468     std::map<void*, void*> ExternalFnToStubMap;
469
470     //map addresses to indexes in the GOT
471     std::map<void*, unsigned> revGOTMap;
472     unsigned nextGOTIndex;
473
474     static JITResolver *TheJITResolver;
475   public:
476     JITResolver(JIT &jit) : nextGOTIndex(0) {
477       TheJIT = &jit;
478
479       LazyResolverFn = jit.getJITInfo().getLazyResolverFunction(JITCompilerFn);
480       assert(TheJITResolver == 0 && "Multiple JIT resolvers?");
481       TheJITResolver = this;
482     }
483     
484     ~JITResolver() {
485       TheJITResolver = 0;
486     }
487
488     /// getFunctionStub - This returns a pointer to a function stub, creating
489     /// one on demand as needed.
490     void *getFunctionStub(Function *F);
491
492     /// getExternalFunctionStub - Return a stub for the function at the
493     /// specified address, created lazily on demand.
494     void *getExternalFunctionStub(void *FnAddr);
495
496     /// AddCallbackAtLocation - If the target is capable of rewriting an
497     /// instruction without the use of a stub, record the location of the use so
498     /// we know which function is being used at the location.
499     void *AddCallbackAtLocation(Function *F, void *Location) {
500       MutexGuard locked(TheJIT->lock);
501       /// Get the target-specific JIT resolver function.
502       state.getStubToFunctionMap(locked)[Location] = F;
503       return (void*)(intptr_t)LazyResolverFn;
504     }
505
506     /// getGOTIndexForAddress - Return a new or existing index in the GOT for
507     /// and address.  This function only manages slots, it does not manage the
508     /// contents of the slots or the memory associated with the GOT.
509     unsigned getGOTIndexForAddr(void* addr);
510
511     /// JITCompilerFn - This function is called to resolve a stub to a compiled
512     /// address.  If the LLVM Function corresponding to the stub has not yet
513     /// been compiled, this function compiles it first.
514     static void *JITCompilerFn(void *Stub);
515   };
516 }
517
518 JITResolver *JITResolver::TheJITResolver = 0;
519
520 #if (defined(__POWERPC__) || defined (__ppc__) || defined(_POWER)) && \
521     defined(__APPLE__)
522 extern "C" void sys_icache_invalidate(const void *Addr, size_t len);
523 #endif
524
525 /// synchronizeICache - On some targets, the JIT emitted code must be
526 /// explicitly refetched to ensure correct execution.
527 static void synchronizeICache(const void *Addr, size_t len) {
528 #if (defined(__POWERPC__) || defined (__ppc__) || defined(_POWER)) && \
529     defined(__APPLE__)
530   sys_icache_invalidate(Addr, len);
531 #endif
532 }
533
534 /// getFunctionStub - This returns a pointer to a function stub, creating
535 /// one on demand as needed.
536 void *JITResolver::getFunctionStub(Function *F) {
537   MutexGuard locked(TheJIT->lock);
538
539   // If we already have a stub for this function, recycle it.
540   void *&Stub = state.getFunctionToStubMap(locked)[F];
541   if (Stub) return Stub;
542
543   // Call the lazy resolver function unless we already KNOW it is an external
544   // function, in which case we just skip the lazy resolution step.
545   void *Actual = (void*)(intptr_t)LazyResolverFn;
546   if (F->isDeclaration() && !F->hasNotBeenReadFromBitcode())
547     Actual = TheJIT->getPointerToFunction(F);
548
549   // Otherwise, codegen a new stub.  For now, the stub will call the lazy
550   // resolver function.
551   Stub = TheJIT->getJITInfo().emitFunctionStub(Actual,
552                                                *TheJIT->getCodeEmitter());
553
554   if (Actual != (void*)(intptr_t)LazyResolverFn) {
555     // If we are getting the stub for an external function, we really want the
556     // address of the stub in the GlobalAddressMap for the JIT, not the address
557     // of the external function.
558     TheJIT->updateGlobalMapping(F, Stub);
559   }
560
561   // Invalidate the icache if necessary.
562   synchronizeICache(Stub, TheJIT->getCodeEmitter()->getCurrentPCValue() -
563                           (intptr_t)Stub);
564
565   DOUT << "JIT: Stub emitted at [" << Stub << "] for function '"
566        << F->getName() << "'\n";
567
568   // Finally, keep track of the stub-to-Function mapping so that the
569   // JITCompilerFn knows which function to compile!
570   state.getStubToFunctionMap(locked)[Stub] = F;
571   return Stub;
572 }
573
574 /// getExternalFunctionStub - Return a stub for the function at the
575 /// specified address, created lazily on demand.
576 void *JITResolver::getExternalFunctionStub(void *FnAddr) {
577   // If we already have a stub for this function, recycle it.
578   void *&Stub = ExternalFnToStubMap[FnAddr];
579   if (Stub) return Stub;
580
581   Stub = TheJIT->getJITInfo().emitFunctionStub(FnAddr,
582                                                *TheJIT->getCodeEmitter());
583
584   // Invalidate the icache if necessary.
585   synchronizeICache(Stub, TheJIT->getCodeEmitter()->getCurrentPCValue() -
586                     (intptr_t)Stub);
587
588   DOUT << "JIT: Stub emitted at [" << Stub
589        << "] for external function at '" << FnAddr << "'\n";
590   return Stub;
591 }
592
593 unsigned JITResolver::getGOTIndexForAddr(void* addr) {
594   unsigned idx = revGOTMap[addr];
595   if (!idx) {
596     idx = ++nextGOTIndex;
597     revGOTMap[addr] = idx;
598     DOUT << "Adding GOT entry " << idx
599          << " for addr " << addr << "\n";
600     //    ((void**)MemMgr.getGOTBase())[idx] = addr;
601   }
602   return idx;
603 }
604
605 /// JITCompilerFn - This function is called when a lazy compilation stub has
606 /// been entered.  It looks up which function this stub corresponds to, compiles
607 /// it if necessary, then returns the resultant function pointer.
608 void *JITResolver::JITCompilerFn(void *Stub) {
609   JITResolver &JR = *TheJITResolver;
610
611   MutexGuard locked(TheJIT->lock);
612
613   // The address given to us for the stub may not be exactly right, it might be
614   // a little bit after the stub.  As such, use upper_bound to find it.
615   std::map<void*, Function*>::iterator I =
616     JR.state.getStubToFunctionMap(locked).upper_bound(Stub);
617   assert(I != JR.state.getStubToFunctionMap(locked).begin() &&
618          "This is not a known stub!");
619   Function *F = (--I)->second;
620
621   // If we have already code generated the function, just return the address.
622   void *Result = TheJIT->getPointerToGlobalIfAvailable(F);
623   
624   if (!Result) {
625     // Otherwise we don't have it, do lazy compilation now.
626     
627     // If lazy compilation is disabled, emit a useful error message and abort.
628     if (TheJIT->isLazyCompilationDisabled()) {
629       cerr << "LLVM JIT requested to do lazy compilation of function '"
630       << F->getName() << "' when lazy compiles are disabled!\n";
631       abort();
632     }
633   
634     // We might like to remove the stub from the StubToFunction map.
635     // We can't do that! Multiple threads could be stuck, waiting to acquire the
636     // lock above. As soon as the 1st function finishes compiling the function,
637     // the next one will be released, and needs to be able to find the function
638     // it needs to call.
639     //JR.state.getStubToFunctionMap(locked).erase(I);
640
641     DOUT << "JIT: Lazily resolving function '" << F->getName()
642          << "' In stub ptr = " << Stub << " actual ptr = "
643          << I->first << "\n";
644
645     Result = TheJIT->getPointerToFunction(F);
646   }
647
648   // We don't need to reuse this stub in the future, as F is now compiled.
649   JR.state.getFunctionToStubMap(locked).erase(F);
650
651   // FIXME: We could rewrite all references to this stub if we knew them.
652
653   // What we will do is set the compiled function address to map to the
654   // same GOT entry as the stub so that later clients may update the GOT
655   // if they see it still using the stub address.
656   // Note: this is done so the Resolver doesn't have to manage GOT memory
657   // Do this without allocating map space if the target isn't using a GOT
658   if(JR.revGOTMap.find(Stub) != JR.revGOTMap.end())
659     JR.revGOTMap[Result] = JR.revGOTMap[Stub];
660
661   return Result;
662 }
663
664
665 //===----------------------------------------------------------------------===//
666 // JITEmitter code.
667 //
668 namespace {
669   /// JITEmitter - The JIT implementation of the MachineCodeEmitter, which is
670   /// used to output functions to memory for execution.
671   class JITEmitter : public MachineCodeEmitter {
672     JITMemoryManager MemMgr;
673
674     // When outputting a function stub in the context of some other function, we
675     // save BufferBegin/BufferEnd/CurBufferPtr here.
676     unsigned char *SavedBufferBegin, *SavedBufferEnd, *SavedCurBufferPtr;
677
678     /// Relocations - These are the relocations that the function needs, as
679     /// emitted.
680     std::vector<MachineRelocation> Relocations;
681     
682     /// MBBLocations - This vector is a mapping from MBB ID's to their address.
683     /// It is filled in by the StartMachineBasicBlock callback and queried by
684     /// the getMachineBasicBlockAddress callback.
685     std::vector<intptr_t> MBBLocations;
686
687     /// ConstantPool - The constant pool for the current function.
688     ///
689     MachineConstantPool *ConstantPool;
690
691     /// ConstantPoolBase - A pointer to the first entry in the constant pool.
692     ///
693     void *ConstantPoolBase;
694
695     /// JumpTable - The jump tables for the current function.
696     ///
697     MachineJumpTableInfo *JumpTable;
698     
699     /// JumpTableBase - A pointer to the first entry in the jump table.
700     ///
701     void *JumpTableBase;
702     
703     /// Resolver - This contains info about the currently resolved functions.
704     JITResolver Resolver;
705   public:
706     JITEmitter(JIT &jit)
707        : MemMgr(jit.getJITInfo().needsGOT()), Resolver(jit) {
708       if (MemMgr.isManagingGOT()) DOUT << "JIT is managing a GOT\n";
709     }
710     
711     JITResolver &getJITResolver() { return Resolver; }
712
713     virtual void startFunction(MachineFunction &F);
714     virtual bool finishFunction(MachineFunction &F);
715     
716     void emitConstantPool(MachineConstantPool *MCP);
717     void initJumpTableInfo(MachineJumpTableInfo *MJTI);
718     void emitJumpTableInfo(MachineJumpTableInfo *MJTI);
719     
720     virtual void startFunctionStub(unsigned StubSize, unsigned Alignment = 1);
721     virtual void* finishFunctionStub(const Function *F);
722
723     virtual void addRelocation(const MachineRelocation &MR) {
724       Relocations.push_back(MR);
725     }
726     
727     virtual void StartMachineBasicBlock(MachineBasicBlock *MBB) {
728       if (MBBLocations.size() <= (unsigned)MBB->getNumber())
729         MBBLocations.resize((MBB->getNumber()+1)*2);
730       MBBLocations[MBB->getNumber()] = getCurrentPCValue();
731     }
732
733     virtual intptr_t getConstantPoolEntryAddress(unsigned Entry) const;
734     virtual intptr_t getJumpTableEntryAddress(unsigned Entry) const;
735     
736     virtual intptr_t getMachineBasicBlockAddress(MachineBasicBlock *MBB) const {
737       assert(MBBLocations.size() > (unsigned)MBB->getNumber() && 
738              MBBLocations[MBB->getNumber()] && "MBB not emitted!");
739       return MBBLocations[MBB->getNumber()];
740     }
741
742     /// deallocateMemForFunction - Deallocate all memory for the specified
743     /// function body.
744     void deallocateMemForFunction(Function *F) {
745       MemMgr.deallocateMemForFunction(F);
746     }
747   private:
748     void *getPointerToGlobal(GlobalValue *GV, void *Reference, bool NoNeedStub);
749   };
750 }
751
752 void *JITEmitter::getPointerToGlobal(GlobalValue *V, void *Reference,
753                                      bool DoesntNeedStub) {
754   if (GlobalVariable *GV = dyn_cast<GlobalVariable>(V)) {
755     /// FIXME: If we straightened things out, this could actually emit the
756     /// global immediately instead of queuing it for codegen later!
757     return TheJIT->getOrEmitGlobalVariable(GV);
758   }
759
760   // If we have already compiled the function, return a pointer to its body.
761   Function *F = cast<Function>(V);
762   void *ResultPtr = TheJIT->getPointerToGlobalIfAvailable(F);
763   if (ResultPtr) return ResultPtr;
764
765   if (F->isDeclaration() && !F->hasNotBeenReadFromBitcode()) {
766     // If this is an external function pointer, we can force the JIT to
767     // 'compile' it, which really just adds it to the map.
768     if (DoesntNeedStub)
769       return TheJIT->getPointerToFunction(F);
770
771     return Resolver.getFunctionStub(F);
772   }
773
774   // Okay, the function has not been compiled yet, if the target callback
775   // mechanism is capable of rewriting the instruction directly, prefer to do
776   // that instead of emitting a stub.
777   if (DoesntNeedStub)
778     return Resolver.AddCallbackAtLocation(F, Reference);
779
780   // Otherwise, we have to emit a lazy resolving stub.
781   return Resolver.getFunctionStub(F);
782 }
783
784 void JITEmitter::startFunction(MachineFunction &F) {
785   uintptr_t ActualSize;
786   BufferBegin = CurBufferPtr = MemMgr.startFunctionBody(ActualSize);
787   BufferEnd = BufferBegin+ActualSize;
788   
789   // Ensure the constant pool/jump table info is at least 4-byte aligned.
790   emitAlignment(16);
791
792   emitConstantPool(F.getConstantPool());
793   initJumpTableInfo(F.getJumpTableInfo());
794
795   // About to start emitting the machine code for the function.
796   emitAlignment(std::max(F.getFunction()->getAlignment(), 8U));
797   TheJIT->updateGlobalMapping(F.getFunction(), CurBufferPtr);
798
799   MBBLocations.clear();
800 }
801
802 bool JITEmitter::finishFunction(MachineFunction &F) {
803   if (CurBufferPtr == BufferEnd) {
804     // FIXME: Allocate more space, then try again.
805     cerr << "JIT: Ran out of space for generated machine code!\n";
806     abort();
807   }
808   
809   emitJumpTableInfo(F.getJumpTableInfo());
810   
811   // FnStart is the start of the text, not the start of the constant pool and
812   // other per-function data.
813   unsigned char *FnStart =
814     (unsigned char *)TheJIT->getPointerToGlobalIfAvailable(F.getFunction());
815   unsigned char *FnEnd   = CurBufferPtr;
816   
817   MemMgr.endFunctionBody(F.getFunction(), BufferBegin, FnEnd);
818   NumBytes += FnEnd-FnStart;
819
820   if (!Relocations.empty()) {
821     NumRelos += Relocations.size();
822
823     // Resolve the relocations to concrete pointers.
824     for (unsigned i = 0, e = Relocations.size(); i != e; ++i) {
825       MachineRelocation &MR = Relocations[i];
826       void *ResultPtr;
827       if (MR.isString()) {
828         ResultPtr = TheJIT->getPointerToNamedFunction(MR.getString());
829
830         // If the target REALLY wants a stub for this function, emit it now.
831         if (!MR.doesntNeedFunctionStub())
832           ResultPtr = Resolver.getExternalFunctionStub(ResultPtr);
833       } else if (MR.isGlobalValue()) {
834         ResultPtr = getPointerToGlobal(MR.getGlobalValue(),
835                                        BufferBegin+MR.getMachineCodeOffset(),
836                                        MR.doesntNeedFunctionStub());
837       } else if (MR.isBasicBlock()) {
838         ResultPtr = (void*)getMachineBasicBlockAddress(MR.getBasicBlock());
839       } else if (MR.isConstantPoolIndex()) {
840         ResultPtr=(void*)getConstantPoolEntryAddress(MR.getConstantPoolIndex());
841       } else {
842         assert(MR.isJumpTableIndex());
843         ResultPtr=(void*)getJumpTableEntryAddress(MR.getJumpTableIndex());
844       }
845
846       MR.setResultPointer(ResultPtr);
847
848       // if we are managing the GOT and the relocation wants an index,
849       // give it one
850       if (MemMgr.isManagingGOT() && MR.isGOTRelative()) {
851         unsigned idx = Resolver.getGOTIndexForAddr(ResultPtr);
852         MR.setGOTIndex(idx);
853         if (((void**)MemMgr.getGOTBase())[idx] != ResultPtr) {
854           DOUT << "GOT was out of date for " << ResultPtr
855                << " pointing at " << ((void**)MemMgr.getGOTBase())[idx]
856                << "\n";
857           ((void**)MemMgr.getGOTBase())[idx] = ResultPtr;
858         }
859       }
860     }
861
862     TheJIT->getJITInfo().relocate(BufferBegin, &Relocations[0],
863                                   Relocations.size(), MemMgr.getGOTBase());
864   }
865
866   // Update the GOT entry for F to point to the new code.
867   if (MemMgr.isManagingGOT()) {
868     unsigned idx = Resolver.getGOTIndexForAddr((void*)BufferBegin);
869     if (((void**)MemMgr.getGOTBase())[idx] != (void*)BufferBegin) {
870       DOUT << "GOT was out of date for " << (void*)BufferBegin
871            << " pointing at " << ((void**)MemMgr.getGOTBase())[idx] << "\n";
872       ((void**)MemMgr.getGOTBase())[idx] = (void*)BufferBegin;
873     }
874   }
875
876   // Invalidate the icache if necessary.
877   synchronizeICache(FnStart, FnEnd-FnStart);
878
879   DOUT << "JIT: Finished CodeGen of [" << (void*)FnStart
880        << "] Function: " << F.getFunction()->getName()
881        << ": " << (FnEnd-FnStart) << " bytes of text, "
882        << Relocations.size() << " relocations\n";
883   Relocations.clear();
884
885 #ifndef NDEBUG
886   if (sys::hasDisassembler())
887     DOUT << "Disassembled code:\n"
888          << sys::disassembleBuffer(FnStart, FnEnd-FnStart, (uintptr_t)FnStart);
889 #endif
890   
891   return false;
892 }
893
894 void JITEmitter::emitConstantPool(MachineConstantPool *MCP) {
895   const std::vector<MachineConstantPoolEntry> &Constants = MCP->getConstants();
896   if (Constants.empty()) return;
897
898   MachineConstantPoolEntry CPE = Constants.back();
899   unsigned Size = CPE.Offset;
900   const Type *Ty = CPE.isMachineConstantPoolEntry()
901     ? CPE.Val.MachineCPVal->getType() : CPE.Val.ConstVal->getType();
902   Size += TheJIT->getTargetData()->getTypeSize(Ty);
903
904   ConstantPoolBase = allocateSpace(Size, 1 << MCP->getConstantPoolAlignment());
905   ConstantPool = MCP;
906
907   if (ConstantPoolBase == 0) return;  // Buffer overflow.
908
909   // Initialize the memory for all of the constant pool entries.
910   for (unsigned i = 0, e = Constants.size(); i != e; ++i) {
911     void *CAddr = (char*)ConstantPoolBase+Constants[i].Offset;
912     if (Constants[i].isMachineConstantPoolEntry()) {
913       // FIXME: add support to lower machine constant pool values into bytes!
914       cerr << "Initialize memory with machine specific constant pool entry"
915            << " has not been implemented!\n";
916       abort();
917     }
918     TheJIT->InitializeMemory(Constants[i].Val.ConstVal, CAddr);
919   }
920 }
921
922 void JITEmitter::initJumpTableInfo(MachineJumpTableInfo *MJTI) {
923   const std::vector<MachineJumpTableEntry> &JT = MJTI->getJumpTables();
924   if (JT.empty()) return;
925   
926   unsigned NumEntries = 0;
927   for (unsigned i = 0, e = JT.size(); i != e; ++i)
928     NumEntries += JT[i].MBBs.size();
929
930   unsigned EntrySize = MJTI->getEntrySize();
931
932   // Just allocate space for all the jump tables now.  We will fix up the actual
933   // MBB entries in the tables after we emit the code for each block, since then
934   // we will know the final locations of the MBBs in memory.
935   JumpTable = MJTI;
936   JumpTableBase = allocateSpace(NumEntries * EntrySize, MJTI->getAlignment());
937 }
938
939 void JITEmitter::emitJumpTableInfo(MachineJumpTableInfo *MJTI) {
940   const std::vector<MachineJumpTableEntry> &JT = MJTI->getJumpTables();
941   if (JT.empty() || JumpTableBase == 0) return;
942   
943   if (TargetMachine::getRelocationModel() == Reloc::PIC_) {
944     assert(MJTI->getEntrySize() == 4 && "Cross JIT'ing?");
945     // For each jump table, place the offset from the beginning of the table
946     // to the target address.
947     int *SlotPtr = (int*)JumpTableBase;
948
949     for (unsigned i = 0, e = JT.size(); i != e; ++i) {
950       const std::vector<MachineBasicBlock*> &MBBs = JT[i].MBBs;
951       // Store the offset of the basic block for this jump table slot in the
952       // memory we allocated for the jump table in 'initJumpTableInfo'
953       intptr_t Base = (intptr_t)SlotPtr;
954       for (unsigned mi = 0, me = MBBs.size(); mi != me; ++mi)
955         *SlotPtr++ = (intptr_t)getMachineBasicBlockAddress(MBBs[mi]) - Base;
956     }
957   } else {
958     assert(MJTI->getEntrySize() == sizeof(void*) && "Cross JIT'ing?");
959     
960     // For each jump table, map each target in the jump table to the address of 
961     // an emitted MachineBasicBlock.
962     intptr_t *SlotPtr = (intptr_t*)JumpTableBase;
963
964     for (unsigned i = 0, e = JT.size(); i != e; ++i) {
965       const std::vector<MachineBasicBlock*> &MBBs = JT[i].MBBs;
966       // Store the address of the basic block for this jump table slot in the
967       // memory we allocated for the jump table in 'initJumpTableInfo'
968       for (unsigned mi = 0, me = MBBs.size(); mi != me; ++mi)
969         *SlotPtr++ = getMachineBasicBlockAddress(MBBs[mi]);
970     }
971   }
972 }
973
974 void JITEmitter::startFunctionStub(unsigned StubSize, unsigned Alignment) {
975   SavedBufferBegin = BufferBegin;
976   SavedBufferEnd = BufferEnd;
977   SavedCurBufferPtr = CurBufferPtr;
978   
979   BufferBegin = CurBufferPtr = MemMgr.allocateStub(StubSize, Alignment);
980   BufferEnd = BufferBegin+StubSize+1;
981 }
982
983 void *JITEmitter::finishFunctionStub(const Function *F) {
984   NumBytes += getCurrentPCOffset();
985   std::swap(SavedBufferBegin, BufferBegin);
986   BufferEnd = SavedBufferEnd;
987   CurBufferPtr = SavedCurBufferPtr;
988   return SavedBufferBegin;
989 }
990
991 // getConstantPoolEntryAddress - Return the address of the 'ConstantNum' entry
992 // in the constant pool that was last emitted with the 'emitConstantPool'
993 // method.
994 //
995 intptr_t JITEmitter::getConstantPoolEntryAddress(unsigned ConstantNum) const {
996   assert(ConstantNum < ConstantPool->getConstants().size() &&
997          "Invalid ConstantPoolIndex!");
998   return (intptr_t)ConstantPoolBase +
999          ConstantPool->getConstants()[ConstantNum].Offset;
1000 }
1001
1002 // getJumpTableEntryAddress - Return the address of the JumpTable with index
1003 // 'Index' in the jumpp table that was last initialized with 'initJumpTableInfo'
1004 //
1005 intptr_t JITEmitter::getJumpTableEntryAddress(unsigned Index) const {
1006   const std::vector<MachineJumpTableEntry> &JT = JumpTable->getJumpTables();
1007   assert(Index < JT.size() && "Invalid jump table index!");
1008   
1009   unsigned Offset = 0;
1010   unsigned EntrySize = JumpTable->getEntrySize();
1011   
1012   for (unsigned i = 0; i < Index; ++i)
1013     Offset += JT[i].MBBs.size();
1014   
1015    Offset *= EntrySize;
1016   
1017   return (intptr_t)((char *)JumpTableBase + Offset);
1018 }
1019
1020 //===----------------------------------------------------------------------===//
1021 //  Public interface to this file
1022 //===----------------------------------------------------------------------===//
1023
1024 MachineCodeEmitter *JIT::createEmitter(JIT &jit) {
1025   return new JITEmitter(jit);
1026 }
1027
1028 // getPointerToNamedFunction - This function is used as a global wrapper to
1029 // JIT::getPointerToNamedFunction for the purpose of resolving symbols when
1030 // bugpoint is debugging the JIT. In that scenario, we are loading an .so and
1031 // need to resolve function(s) that are being mis-codegenerated, so we need to
1032 // resolve their addresses at runtime, and this is the way to do it.
1033 extern "C" {
1034   void *getPointerToNamedFunction(const char *Name) {
1035     if (Function *F = TheJIT->FindFunctionNamed(Name))
1036       return TheJIT->getPointerToFunction(F);
1037     return TheJIT->getPointerToNamedFunction(Name);
1038   }
1039 }
1040
1041 // getPointerToFunctionOrStub - If the specified function has been
1042 // code-gen'd, return a pointer to the function.  If not, compile it, or use
1043 // a stub to implement lazy compilation if available.
1044 //
1045 void *JIT::getPointerToFunctionOrStub(Function *F) {
1046   // If we have already code generated the function, just return the address.
1047   if (void *Addr = getPointerToGlobalIfAvailable(F))
1048     return Addr;
1049   
1050   // Get a stub if the target supports it.
1051   assert(dynamic_cast<JITEmitter*>(MCE) && "Unexpected MCE?");
1052   JITEmitter *JE = static_cast<JITEmitter*>(getCodeEmitter());
1053   return JE->getJITResolver().getFunctionStub(F);
1054 }
1055
1056 /// freeMachineCodeForFunction - release machine code memory for given Function.
1057 ///
1058 void JIT::freeMachineCodeForFunction(Function *F) {
1059   // Delete translation for this from the ExecutionEngine, so it will get
1060   // retranslated next time it is used.
1061   updateGlobalMapping(F, 0);
1062
1063   // Free the actual memory for the function body and related stuff.
1064   assert(dynamic_cast<JITEmitter*>(MCE) && "Unexpected MCE?");
1065   static_cast<JITEmitter*>(MCE)->deallocateMemForFunction(F);
1066 }
1067