Fix minor memory leak
[oota-llvm.git] / lib / AsmParser / llvmAsmParser.y
1 //===-- llvmAsmParser.y - Parser for llvm assembly files ---------*- C++ -*--=//
2 //
3 //  This file implements the bison parser for LLVM assembly languages files.
4 //
5 //===------------------------------------------------------------------------=//
6
7 %{
8 #include "ParserInternals.h"
9 #include "llvm/Assembly/Parser.h"
10 #include "llvm/SymbolTable.h"
11 #include "llvm/Module.h"
12 #include "llvm/GlobalVariable.h"
13 #include "llvm/Method.h"
14 #include "llvm/BasicBlock.h"
15 #include "llvm/DerivedTypes.h"
16 #include "llvm/iTerminators.h"
17 #include "llvm/iMemory.h"
18 #include "llvm/iPHINode.h"
19 #include "Support/STLExtras.h"
20 #include "Support/DepthFirstIterator.h"
21 #include <list>
22 #include <utility>            // Get definition of pair class
23 #include <algorithm>
24 #include <stdio.h>            // This embarasment is due to our flex lexer...
25 #include <iostream>
26 using std::list;
27 using std::vector;
28 using std::pair;
29 using std::map;
30 using std::pair;
31 using std::make_pair;
32 using std::cerr;
33 using std::string;
34
35 int yyerror(const char *ErrorMsg); // Forward declarations to prevent "implicit
36 int yylex();                       // declaration" of xxx warnings.
37 int yyparse();
38
39 static Module *ParserResult;
40 string CurFilename;
41
42 // DEBUG_UPREFS - Define this symbol if you want to enable debugging output
43 // relating to upreferences in the input stream.
44 //
45 //#define DEBUG_UPREFS 1
46 #ifdef DEBUG_UPREFS
47 #define UR_OUT(X) cerr << X
48 #else
49 #define UR_OUT(X)
50 #endif
51
52 // This contains info used when building the body of a method.  It is destroyed
53 // when the method is completed.
54 //
55 typedef vector<Value *> ValueList;           // Numbered defs
56 static void ResolveDefinitions(vector<ValueList> &LateResolvers,
57                                vector<ValueList> *FutureLateResolvers = 0);
58
59 static struct PerModuleInfo {
60   Module *CurrentModule;
61   vector<ValueList>    Values;     // Module level numbered definitions
62   vector<ValueList>    LateResolveValues;
63   vector<PATypeHolder<Type> > Types;
64   map<ValID, PATypeHolder<Type> > LateResolveTypes;
65
66   // GlobalRefs - This maintains a mapping between <Type, ValID>'s and forward
67   // references to global values.  Global values may be referenced before they
68   // are defined, and if so, the temporary object that they represent is held
69   // here.  This is used for forward references of ConstantPointerRefs.
70   //
71   typedef map<pair<const PointerType *, ValID>, GlobalVariable*> GlobalRefsType;
72   GlobalRefsType GlobalRefs;
73
74   void ModuleDone() {
75     // If we could not resolve some methods at method compilation time (calls to
76     // methods before they are defined), resolve them now...  Types are resolved
77     // when the constant pool has been completely parsed.
78     //
79     ResolveDefinitions(LateResolveValues);
80
81     // Check to make sure that all global value forward references have been
82     // resolved!
83     //
84     if (!GlobalRefs.empty()) {
85       // TODO: Make this more detailed! Loop over each undef value and print
86       // info
87       ThrowException("TODO: Make better error - Unresolved forward constant "
88                      "references exist!");
89     }
90
91     Values.clear();         // Clear out method local definitions
92     Types.clear();
93     CurrentModule = 0;
94   }
95
96
97   // DeclareNewGlobalValue - Called every type a new GV has been defined.  This
98   // is used to remove things from the forward declaration map, resolving them
99   // to the correct thing as needed.
100   //
101   void DeclareNewGlobalValue(GlobalValue *GV, ValID D) {
102     // Check to see if there is a forward reference to this global variable...
103     // if there is, eliminate it and patch the reference to use the new def'n.
104     GlobalRefsType::iterator I = GlobalRefs.find(make_pair(GV->getType(), D));
105
106     if (I != GlobalRefs.end()) {
107       GlobalVariable *OldGV = I->second;   // Get the placeholder...
108       I->first.second.destroy();  // Free string memory if neccesary
109       
110       // Loop over all of the uses of the GlobalValue.  The only thing they are
111       // allowed to be at this point is ConstantPointerRef's.
112       assert(OldGV->use_size() == 1 && "Only one reference should exist!");
113       while (!OldGV->use_empty()) {
114         User *U = OldGV->use_back();  // Must be a ConstantPointerRef...
115         ConstantPointerRef *CPPR = cast<ConstantPointerRef>(U);
116         assert(CPPR->getValue() == OldGV && "Something isn't happy");
117         
118         // Change the const pool reference to point to the real global variable
119         // now.  This should drop a use from the OldGV.
120         CPPR->mutateReference(GV);
121       }
122     
123       // Remove GV from the module...
124       CurrentModule->getGlobalList().remove(OldGV);
125       delete OldGV;                        // Delete the old placeholder
126
127       // Remove the map entry for the global now that it has been created...
128       GlobalRefs.erase(I);
129     }
130   }
131
132 } CurModule;
133
134 static struct PerMethodInfo {
135   Method *CurrentMethod;         // Pointer to current method being created
136
137   vector<ValueList> Values;      // Keep track of numbered definitions
138   vector<ValueList> LateResolveValues;
139   vector<PATypeHolder<Type> > Types;
140   map<ValID, PATypeHolder<Type> > LateResolveTypes;
141   bool isDeclare;                // Is this method a forward declararation?
142
143   inline PerMethodInfo() {
144     CurrentMethod = 0;
145     isDeclare = false;
146   }
147
148   inline ~PerMethodInfo() {}
149
150   inline void MethodStart(Method *M) {
151     CurrentMethod = M;
152   }
153
154   void MethodDone() {
155     // If we could not resolve some blocks at parsing time (forward branches)
156     // resolve the branches now...
157     ResolveDefinitions(LateResolveValues, &CurModule.LateResolveValues);
158
159     Values.clear();         // Clear out method local definitions
160     Types.clear();
161     CurrentMethod = 0;
162     isDeclare = false;
163   }
164 } CurMeth;  // Info for the current method...
165
166 static bool inMethodScope() { return CurMeth.CurrentMethod != 0; }
167
168
169 //===----------------------------------------------------------------------===//
170 //               Code to handle definitions of all the types
171 //===----------------------------------------------------------------------===//
172
173 static int InsertValue(Value *D, vector<ValueList> &ValueTab = CurMeth.Values) {
174   if (D->hasName()) return -1;           // Is this a numbered definition?
175
176   // Yes, insert the value into the value table...
177   unsigned type = D->getType()->getUniqueID();
178   if (ValueTab.size() <= type)
179     ValueTab.resize(type+1, ValueList());
180   //printf("Values[%d][%d] = %d\n", type, ValueTab[type].size(), D);
181   ValueTab[type].push_back(D);
182   return ValueTab[type].size()-1;
183 }
184
185 // TODO: FIXME when Type are not const
186 static void InsertType(const Type *Ty, vector<PATypeHolder<Type> > &Types) {
187   Types.push_back(Ty);
188 }
189
190 static const Type *getTypeVal(const ValID &D, bool DoNotImprovise = false) {
191   switch (D.Type) {
192   case 0: {                 // Is it a numbered definition?
193     unsigned Num = (unsigned)D.Num;
194
195     // Module constants occupy the lowest numbered slots...
196     if (Num < CurModule.Types.size()) 
197       return CurModule.Types[Num];
198
199     Num -= CurModule.Types.size();
200
201     // Check that the number is within bounds...
202     if (Num <= CurMeth.Types.size())
203       return CurMeth.Types[Num];
204     break;
205   }
206   case 1: {                // Is it a named definition?
207     string Name(D.Name);
208     SymbolTable *SymTab = 0;
209     if (inMethodScope()) SymTab = CurMeth.CurrentMethod->getSymbolTable();
210     Value *N = SymTab ? SymTab->lookup(Type::TypeTy, Name) : 0;
211
212     if (N == 0) {
213       // Symbol table doesn't automatically chain yet... because the method
214       // hasn't been added to the module...
215       //
216       SymTab = CurModule.CurrentModule->getSymbolTable();
217       if (SymTab)
218         N = SymTab->lookup(Type::TypeTy, Name);
219       if (N == 0) break;
220     }
221
222     D.destroy();  // Free old strdup'd memory...
223     return cast<const Type>(N);
224   }
225   default:
226     ThrowException("Invalid symbol type reference!");
227   }
228
229   // If we reached here, we referenced either a symbol that we don't know about
230   // or an id number that hasn't been read yet.  We may be referencing something
231   // forward, so just create an entry to be resolved later and get to it...
232   //
233   if (DoNotImprovise) return 0;  // Do we just want a null to be returned?
234
235   map<ValID, PATypeHolder<Type> > &LateResolver = inMethodScope() ? 
236     CurMeth.LateResolveTypes : CurModule.LateResolveTypes;
237   
238   map<ValID, PATypeHolder<Type> >::iterator I = LateResolver.find(D);
239   if (I != LateResolver.end()) {
240     return I->second;
241   }
242
243   Type *Typ = OpaqueType::get();
244   LateResolver.insert(make_pair(D, Typ));
245   return Typ;
246 }
247
248 static Value *lookupInSymbolTable(const Type *Ty, const string &Name) {
249   SymbolTable *SymTab = 
250     inMethodScope() ? CurMeth.CurrentMethod->getSymbolTable() : 0;
251   Value *N = SymTab ? SymTab->lookup(Ty, Name) : 0;
252
253   if (N == 0) {
254     // Symbol table doesn't automatically chain yet... because the method
255     // hasn't been added to the module...
256     //
257     SymTab = CurModule.CurrentModule->getSymbolTable();
258     if (SymTab)
259       N = SymTab->lookup(Ty, Name);
260   }
261
262   return N;
263 }
264
265 // getValNonImprovising - Look up the value specified by the provided type and
266 // the provided ValID.  If the value exists and has already been defined, return
267 // it.  Otherwise return null.
268 //
269 static Value *getValNonImprovising(const Type *Ty, const ValID &D) {
270   if (isa<MethodType>(Ty))
271     ThrowException("Methods are not values and must be referenced as pointers");
272
273   switch (D.Type) {
274   case ValID::NumberVal: {                 // Is it a numbered definition?
275     unsigned type = Ty->getUniqueID();
276     unsigned Num = (unsigned)D.Num;
277
278     // Module constants occupy the lowest numbered slots...
279     if (type < CurModule.Values.size()) {
280       if (Num < CurModule.Values[type].size()) 
281         return CurModule.Values[type][Num];
282
283       Num -= CurModule.Values[type].size();
284     }
285
286     // Make sure that our type is within bounds
287     if (CurMeth.Values.size() <= type) return 0;
288
289     // Check that the number is within bounds...
290     if (CurMeth.Values[type].size() <= Num) return 0;
291   
292     return CurMeth.Values[type][Num];
293   }
294
295   case ValID::NameVal: {                // Is it a named definition?
296     Value *N = lookupInSymbolTable(Ty, string(D.Name));
297     if (N == 0) return 0;
298
299     D.destroy();  // Free old strdup'd memory...
300     return N;
301   }
302
303   // Check to make sure that "Ty" is an integral type, and that our 
304   // value will fit into the specified type...
305   case ValID::ConstSIntVal:    // Is it a constant pool reference??
306     if (Ty == Type::BoolTy) {  // Special handling for boolean data
307       return ConstantBool::get(D.ConstPool64 != 0);
308     } else {
309       if (!ConstantSInt::isValueValidForType(Ty, D.ConstPool64))
310         ThrowException("Symbolic constant pool value '" +
311                        itostr(D.ConstPool64) + "' is invalid for type '" + 
312                        Ty->getDescription() + "'!");
313       return ConstantSInt::get(Ty, D.ConstPool64);
314     }
315
316   case ValID::ConstUIntVal:     // Is it an unsigned const pool reference?
317     if (!ConstantUInt::isValueValidForType(Ty, D.UConstPool64)) {
318       if (!ConstantSInt::isValueValidForType(Ty, D.ConstPool64)) {
319         ThrowException("Integral constant pool reference is invalid!");
320       } else {     // This is really a signed reference.  Transmogrify.
321         return ConstantSInt::get(Ty, D.ConstPool64);
322       }
323     } else {
324       return ConstantUInt::get(Ty, D.UConstPool64);
325     }
326
327   case ValID::ConstStringVal:    // Is it a string const pool reference?
328     cerr << "FIXME: TODO: String constants [sbyte] not implemented yet!\n";
329     abort();
330     return 0;
331
332   case ValID::ConstFPVal:        // Is it a floating point const pool reference?
333     if (!ConstantFP::isValueValidForType(Ty, D.ConstPoolFP))
334       ThrowException("FP constant invalid for type!!");
335     return ConstantFP::get(Ty, D.ConstPoolFP);
336     
337   case ValID::ConstNullVal:      // Is it a null value?
338     if (!Ty->isPointerType())
339       ThrowException("Cannot create a a non pointer null!");
340     return ConstantPointerNull::get(cast<PointerType>(Ty));
341     
342   default:
343     assert(0 && "Unhandled case!");
344     return 0;
345   }   // End of switch
346
347   assert(0 && "Unhandled case!");
348   return 0;
349 }
350
351
352 // getVal - This function is identical to getValNonImprovising, except that if a
353 // value is not already defined, it "improvises" by creating a placeholder var
354 // that looks and acts just like the requested variable.  When the value is
355 // defined later, all uses of the placeholder variable are replaced with the
356 // real thing.
357 //
358 static Value *getVal(const Type *Ty, const ValID &D) {
359   assert(Ty != Type::TypeTy && "Should use getTypeVal for types!");
360
361   // See if the value has already been defined...
362   Value *V = getValNonImprovising(Ty, D);
363   if (V) return V;
364
365   // If we reached here, we referenced either a symbol that we don't know about
366   // or an id number that hasn't been read yet.  We may be referencing something
367   // forward, so just create an entry to be resolved later and get to it...
368   //
369   Value *d = 0;
370   switch (Ty->getPrimitiveID()) {
371   case Type::LabelTyID:  d = new   BBPlaceHolder(Ty, D); break;
372   default:               d = new ValuePlaceHolder(Ty, D); break;
373   }
374
375   assert(d != 0 && "How did we not make something?");
376   if (inMethodScope())
377     InsertValue(d, CurMeth.LateResolveValues);
378   else 
379     InsertValue(d, CurModule.LateResolveValues);
380   return d;
381 }
382
383
384 //===----------------------------------------------------------------------===//
385 //              Code to handle forward references in instructions
386 //===----------------------------------------------------------------------===//
387 //
388 // This code handles the late binding needed with statements that reference
389 // values not defined yet... for example, a forward branch, or the PHI node for
390 // a loop body.
391 //
392 // This keeps a table (CurMeth.LateResolveValues) of all such forward references
393 // and back patchs after we are done.
394 //
395
396 // ResolveDefinitions - If we could not resolve some defs at parsing 
397 // time (forward branches, phi functions for loops, etc...) resolve the 
398 // defs now...
399 //
400 static void ResolveDefinitions(vector<ValueList> &LateResolvers,
401                                vector<ValueList> *FutureLateResolvers = 0) {
402   // Loop over LateResolveDefs fixing up stuff that couldn't be resolved
403   for (unsigned ty = 0; ty < LateResolvers.size(); ty++) {
404     while (!LateResolvers[ty].empty()) {
405       Value *V = LateResolvers[ty].back();
406       assert(!isa<Type>(V) && "Types should be in LateResolveTypes!");
407
408       LateResolvers[ty].pop_back();
409       ValID &DID = getValIDFromPlaceHolder(V);
410
411       Value *TheRealValue = getValNonImprovising(Type::getUniqueIDType(ty),DID);
412       if (TheRealValue) {
413         V->replaceAllUsesWith(TheRealValue);
414         delete V;
415       } else if (FutureLateResolvers) {
416         // Methods have their unresolved items forwarded to the module late
417         // resolver table
418         InsertValue(V, *FutureLateResolvers);
419       } else {
420         if (DID.Type == 1)
421           ThrowException("Reference to an invalid definition: '" +DID.getName()+
422                          "' of type '" + V->getType()->getDescription() + "'",
423                          getLineNumFromPlaceHolder(V));
424         else
425           ThrowException("Reference to an invalid definition: #" +
426                          itostr(DID.Num) + " of type '" + 
427                          V->getType()->getDescription() + "'",
428                          getLineNumFromPlaceHolder(V));
429       }
430     }
431   }
432
433   LateResolvers.clear();
434 }
435
436 // ResolveTypeTo - A brand new type was just declared.  This means that (if
437 // name is not null) things referencing Name can be resolved.  Otherwise, things
438 // refering to the number can be resolved.  Do this now.
439 //
440 static void ResolveTypeTo(char *Name, const Type *ToTy) {
441   vector<PATypeHolder<Type> > &Types = inMethodScope() ? 
442      CurMeth.Types : CurModule.Types;
443
444    ValID D;
445    if (Name) D = ValID::create(Name);
446    else      D = ValID::create((int)Types.size());
447
448    map<ValID, PATypeHolder<Type> > &LateResolver = inMethodScope() ? 
449      CurMeth.LateResolveTypes : CurModule.LateResolveTypes;
450   
451    map<ValID, PATypeHolder<Type> >::iterator I = LateResolver.find(D);
452    if (I != LateResolver.end()) {
453      cast<DerivedType>(I->second.get())->refineAbstractTypeTo(ToTy);
454      LateResolver.erase(I);
455    }
456 }
457
458 // ResolveTypes - At this point, all types should be resolved.  Any that aren't
459 // are errors.
460 //
461 static void ResolveTypes(map<ValID, PATypeHolder<Type> > &LateResolveTypes) {
462   if (!LateResolveTypes.empty()) {
463     const ValID &DID = LateResolveTypes.begin()->first;
464
465     if (DID.Type == ValID::NameVal)
466       ThrowException("Reference to an invalid type: '" +DID.getName() + "'");
467     else
468       ThrowException("Reference to an invalid type: #" + itostr(DID.Num));
469   }
470 }
471
472
473 // setValueName - Set the specified value to the name given.  The name may be
474 // null potentially, in which case this is a noop.  The string passed in is
475 // assumed to be a malloc'd string buffer, and is freed by this function.
476 //
477 // This function returns true if the value has already been defined, but is
478 // allowed to be redefined in the specified context.  If the name is a new name
479 // for the typeplane, false is returned.
480 //
481 static bool setValueName(Value *V, char *NameStr) {
482   if (NameStr == 0) return false;
483   
484   string Name(NameStr);           // Copy string
485   free(NameStr);                  // Free old string
486
487   if (V->getType() == Type::VoidTy) 
488     ThrowException("Can't assign name '" + Name + 
489                    "' to a null valued instruction!");
490
491   SymbolTable *ST = inMethodScope() ? 
492     CurMeth.CurrentMethod->getSymbolTableSure() : 
493     CurModule.CurrentModule->getSymbolTableSure();
494
495   Value *Existing = ST->lookup(V->getType(), Name);
496   if (Existing) {    // Inserting a name that is already defined???
497     // There is only one case where this is allowed: when we are refining an
498     // opaque type.  In this case, Existing will be an opaque type.
499     if (const Type *Ty = dyn_cast<const Type>(Existing)) {
500       if (OpaqueType *OpTy = dyn_cast<OpaqueType>(Ty)) {
501         // We ARE replacing an opaque type!
502         OpTy->refineAbstractTypeTo(cast<Type>(V));
503         return true;
504       }
505     }
506
507     // Otherwise, we are a simple redefinition of a value, check to see if it
508     // is defined the same as the old one...
509     if (const Type *Ty = dyn_cast<const Type>(Existing)) {
510       if (Ty == cast<const Type>(V)) return true;  // Yes, it's equal.
511       // cerr << "Type: " << Ty->getDescription() << " != "
512       //      << cast<const Type>(V)->getDescription() << "!\n";
513     } else if (GlobalVariable *EGV = dyn_cast<GlobalVariable>(Existing)) {
514       // We are allowed to redefine a global variable in two circumstances:
515       // 1. If at least one of the globals is uninitialized or 
516       // 2. If both initializers have the same value.
517       //
518       // This can only be done if the const'ness of the vars is the same.
519       //
520       if (GlobalVariable *GV = dyn_cast<GlobalVariable>(V)) {
521         if (EGV->isConstant() == GV->isConstant() &&
522             (!EGV->hasInitializer() || !GV->hasInitializer() ||
523              EGV->getInitializer() == GV->getInitializer())) {
524
525           // Make sure the existing global version gets the initializer!
526           if (GV->hasInitializer() && !EGV->hasInitializer())
527             EGV->setInitializer(GV->getInitializer());
528           
529           delete GV;     // Destroy the duplicate!
530           return true;   // They are equivalent!
531         }
532       }
533     }
534     ThrowException("Redefinition of value named '" + Name + "' in the '" +
535                    V->getType()->getDescription() + "' type plane!");
536   }
537
538   V->setName(Name, ST);
539   return false;
540 }
541
542
543 //===----------------------------------------------------------------------===//
544 // Code for handling upreferences in type names...
545 //
546
547 // TypeContains - Returns true if Ty contains E in it.
548 //
549 static bool TypeContains(const Type *Ty, const Type *E) {
550   return find(df_begin(Ty), df_end(Ty), E) != df_end(Ty);
551 }
552
553
554 static vector<pair<unsigned, OpaqueType *> > UpRefs;
555
556 static PATypeHolder<Type> HandleUpRefs(const Type *ty) {
557   PATypeHolder<Type> Ty(ty);
558   UR_OUT("Type '" << ty->getDescription() << 
559          "' newly formed.  Resolving upreferences.\n" <<
560          UpRefs.size() << " upreferences active!\n");
561   for (unsigned i = 0; i < UpRefs.size(); ) {
562     UR_OUT("  UR#" << i << " - TypeContains(" << Ty->getDescription() << ", " 
563            << UpRefs[i].second->getDescription() << ") = " 
564            << (TypeContains(Ty, UpRefs[i].second) ? "true" : "false") << endl);
565     if (TypeContains(Ty, UpRefs[i].second)) {
566       unsigned Level = --UpRefs[i].first;   // Decrement level of upreference
567       UR_OUT("  Uplevel Ref Level = " << Level << endl);
568       if (Level == 0) {                     // Upreference should be resolved! 
569         UR_OUT("  * Resolving upreference for "
570                << UpRefs[i].second->getDescription() << endl;
571                string OldName = UpRefs[i].second->getDescription());
572         UpRefs[i].second->refineAbstractTypeTo(Ty);
573         UpRefs.erase(UpRefs.begin()+i);     // Remove from upreference list...
574         UR_OUT("  * Type '" << OldName << "' refined upreference to: "
575                << (const void*)Ty << ", " << Ty->getDescription() << endl);
576         continue;
577       }
578     }
579
580     ++i;                                  // Otherwise, no resolve, move on...
581   }
582   // FIXME: TODO: this should return the updated type
583   return Ty;
584 }
585
586 template <class TypeTy>
587 inline static void TypeDone(PATypeHolder<TypeTy> *Ty) {
588   if (UpRefs.size())
589     ThrowException("Invalid upreference in type: " + (*Ty)->getDescription());
590 }
591
592 // newTH - Allocate a new type holder for the specified type
593 template <class TypeTy>
594 inline static PATypeHolder<TypeTy> *newTH(const TypeTy *Ty) {
595   return new PATypeHolder<TypeTy>(Ty);
596 }
597 template <class TypeTy>
598 inline static PATypeHolder<TypeTy> *newTH(const PATypeHolder<TypeTy> &TH) {
599   return new PATypeHolder<TypeTy>(TH);
600 }
601
602
603 //===----------------------------------------------------------------------===//
604 //            RunVMAsmParser - Define an interface to this parser
605 //===----------------------------------------------------------------------===//
606 //
607 Module *RunVMAsmParser(const string &Filename, FILE *F) {
608   llvmAsmin = F;
609   CurFilename = Filename;
610   llvmAsmlineno = 1;      // Reset the current line number...
611
612   CurModule.CurrentModule = new Module();  // Allocate a new module to read
613   yyparse();       // Parse the file.
614   Module *Result = ParserResult;
615   llvmAsmin = stdin;    // F is about to go away, don't use it anymore...
616   ParserResult = 0;
617
618   return Result;
619 }
620
621 %}
622
623 %union {
624   Module                           *ModuleVal;
625   Method                           *MethodVal;
626   std::pair<MethodArgument*,char*> *MethArgVal;
627   BasicBlock                       *BasicBlockVal;
628   TerminatorInst                   *TermInstVal;
629   Instruction                      *InstVal;
630   Constant                         *ConstVal;
631
632   const Type                       *PrimType;
633   PATypeHolder<Type>               *TypeVal;
634   Value                            *ValueVal;
635
636   std::list<std::pair<MethodArgument*,char*> > *MethodArgList;
637   std::vector<Value*>              *ValueList;
638   std::list<PATypeHolder<Type> >   *TypeList;
639   std::list<std::pair<Value*,
640                       BasicBlock*> > *PHIList; // Represent the RHS of PHI node
641   std::list<std::pair<Constant*, BasicBlock*> > *JumpTable;
642   std::vector<Constant*>           *ConstVector;
643
644   int64_t                           SInt64Val;
645   uint64_t                          UInt64Val;
646   int                               SIntVal;
647   unsigned                          UIntVal;
648   double                            FPVal;
649   bool                              BoolVal;
650
651   char                             *StrVal;   // This memory is strdup'd!
652   ValID                             ValIDVal; // strdup'd memory maybe!
653
654   Instruction::UnaryOps             UnaryOpVal;
655   Instruction::BinaryOps            BinaryOpVal;
656   Instruction::TermOps              TermOpVal;
657   Instruction::MemoryOps            MemOpVal;
658   Instruction::OtherOps             OtherOpVal;
659 }
660
661 %type <ModuleVal>     Module MethodList
662 %type <MethodVal>     Method MethodProto MethodHeader BasicBlockList
663 %type <BasicBlockVal> BasicBlock InstructionList
664 %type <TermInstVal>   BBTerminatorInst
665 %type <InstVal>       Inst InstVal MemoryInst
666 %type <ConstVal>      ConstVal
667 %type <ConstVector>   ConstVector
668 %type <MethodArgList> ArgList ArgListH
669 %type <MethArgVal>    ArgVal
670 %type <PHIList>       PHIList
671 %type <ValueList>     ValueRefList ValueRefListE  // For call param lists
672 %type <ValueList>     IndexList                   // For GEP derived indices
673 %type <TypeList>      TypeListI ArgTypeListI
674 %type <JumpTable>     JumpTable
675 %type <BoolVal>       GlobalType OptInternal      // GLOBAL or CONSTANT? Intern?
676
677 // ValueRef - Unresolved reference to a definition or BB
678 %type <ValIDVal>      ValueRef ConstValueRef SymbolicValueRef
679 %type <ValueVal>      ResolvedVal            // <type> <valref> pair
680 // Tokens and types for handling constant integer values
681 //
682 // ESINT64VAL - A negative number within long long range
683 %token <SInt64Val> ESINT64VAL
684
685 // EUINT64VAL - A positive number within uns. long long range
686 %token <UInt64Val> EUINT64VAL
687 %type  <SInt64Val> EINT64VAL
688
689 %token  <SIntVal>   SINTVAL   // Signed 32 bit ints...
690 %token  <UIntVal>   UINTVAL   // Unsigned 32 bit ints...
691 %type   <SIntVal>   INTVAL
692 %token  <FPVal>     FPVAL     // Float or Double constant
693
694 // Built in types...
695 %type  <TypeVal> Types TypesV UpRTypes UpRTypesV
696 %type  <PrimType> SIntType UIntType IntType FPType PrimType   // Classifications
697 %token <TypeVal>  OPAQUE
698 %token <PrimType> VOID BOOL SBYTE UBYTE SHORT USHORT INT UINT LONG ULONG
699 %token <PrimType> FLOAT DOUBLE TYPE LABEL
700
701 %token <StrVal>     VAR_ID LABELSTR STRINGCONSTANT
702 %type  <StrVal>  OptVAR_ID OptAssign
703
704
705 %token IMPLEMENTATION TRUE FALSE BEGINTOK END DECLARE GLOBAL CONSTANT UNINIT
706 %token TO EXCEPT DOTDOTDOT STRING NULL_TOK CONST INTERNAL
707
708 // Basic Block Terminating Operators 
709 %token <TermOpVal> RET BR SWITCH
710
711 // Unary Operators 
712 %type  <UnaryOpVal> UnaryOps  // all the unary operators
713 %token <UnaryOpVal> NOT
714
715 // Binary Operators 
716 %type  <BinaryOpVal> BinaryOps  // all the binary operators
717 %token <BinaryOpVal> ADD SUB MUL DIV REM AND OR XOR
718 %token <BinaryOpVal> SETLE SETGE SETLT SETGT SETEQ SETNE  // Binary Comarators
719
720 // Memory Instructions
721 %token <MemoryOpVal> MALLOC ALLOCA FREE LOAD STORE GETELEMENTPTR
722
723 // Other Operators
724 %type  <OtherOpVal> ShiftOps
725 %token <OtherOpVal> PHI CALL INVOKE CAST SHL SHR
726
727 %start Module
728 %%
729
730 // Handle constant integer size restriction and conversion...
731 //
732
733 INTVAL : SINTVAL
734 INTVAL : UINTVAL {
735   if ($1 > (uint32_t)INT32_MAX)     // Outside of my range!
736     ThrowException("Value too large for type!");
737   $$ = (int32_t)$1;
738 }
739
740
741 EINT64VAL : ESINT64VAL       // These have same type and can't cause problems...
742 EINT64VAL : EUINT64VAL {
743   if ($1 > (uint64_t)INT64_MAX)     // Outside of my range!
744     ThrowException("Value too large for type!");
745   $$ = (int64_t)$1;
746 }
747
748 // Operations that are notably excluded from this list include: 
749 // RET, BR, & SWITCH because they end basic blocks and are treated specially.
750 //
751 UnaryOps  : NOT
752 BinaryOps : ADD | SUB | MUL | DIV | REM | AND | OR | XOR
753 BinaryOps : SETLE | SETGE | SETLT | SETGT | SETEQ | SETNE
754 ShiftOps  : SHL | SHR
755
756 // These are some types that allow classification if we only want a particular 
757 // thing... for example, only a signed, unsigned, or integral type.
758 SIntType :  LONG |  INT |  SHORT | SBYTE
759 UIntType : ULONG | UINT | USHORT | UBYTE
760 IntType  : SIntType | UIntType
761 FPType   : FLOAT | DOUBLE
762
763 // OptAssign - Value producing statements have an optional assignment component
764 OptAssign : VAR_ID '=' {
765     $$ = $1;
766   }
767   | /*empty*/ { 
768     $$ = 0; 
769   }
770
771 OptInternal : INTERNAL { $$ = true; } | /*empty*/ { $$ = false; }
772
773 //===----------------------------------------------------------------------===//
774 // Types includes all predefined types... except void, because it can only be
775 // used in specific contexts (method returning void for example).  To have
776 // access to it, a user must explicitly use TypesV.
777 //
778
779 // TypesV includes all of 'Types', but it also includes the void type.
780 TypesV    : Types    | VOID { $$ = newTH($1); }
781 UpRTypesV : UpRTypes | VOID { $$ = newTH($1); }
782
783 Types     : UpRTypes {
784     TypeDone($$ = $1);
785   }
786
787
788 // Derived types are added later...
789 //
790 PrimType : BOOL | SBYTE | UBYTE | SHORT  | USHORT | INT   | UINT 
791 PrimType : LONG | ULONG | FLOAT | DOUBLE | TYPE   | LABEL
792 UpRTypes : OPAQUE | PrimType { $$ = newTH($1); }
793 UpRTypes : ValueRef {                    // Named types are also simple types...
794   $$ = newTH(getTypeVal($1));
795 }
796
797 // Include derived types in the Types production.
798 //
799 UpRTypes : '\\' EUINT64VAL {                   // Type UpReference
800     if ($2 > (uint64_t)INT64_MAX) ThrowException("Value out of range!");
801     OpaqueType *OT = OpaqueType::get();        // Use temporary placeholder
802     UpRefs.push_back(make_pair((unsigned)$2, OT));  // Add to vector...
803     $$ = newTH<Type>(OT);
804     UR_OUT("New Upreference!\n");
805   }
806   | UpRTypesV '(' ArgTypeListI ')' {           // Method derived type?
807     vector<const Type*> Params;
808     mapto($3->begin(), $3->end(), std::back_inserter(Params), 
809           std::mem_fun_ref(&PATypeHandle<Type>::get));
810     bool isVarArg = Params.size() && Params.back() == Type::VoidTy;
811     if (isVarArg) Params.pop_back();
812
813     $$ = newTH(HandleUpRefs(MethodType::get(*$1, Params, isVarArg)));
814     delete $3;      // Delete the argument list
815     delete $1;      // Delete the old type handle
816   }
817   | '[' EUINT64VAL 'x' UpRTypes ']' {          // Sized array type?
818     $$ = newTH<Type>(HandleUpRefs(ArrayType::get(*$4, (unsigned)$2)));
819     delete $4;
820   }
821   | '{' TypeListI '}' {                        // Structure type?
822     vector<const Type*> Elements;
823     mapto($2->begin(), $2->end(), std::back_inserter(Elements), 
824         std::mem_fun_ref(&PATypeHandle<Type>::get));
825
826     $$ = newTH<Type>(HandleUpRefs(StructType::get(Elements)));
827     delete $2;
828   }
829   | '{' '}' {                                  // Empty structure type?
830     $$ = newTH<Type>(StructType::get(vector<const Type*>()));
831   }
832   | UpRTypes '*' {                             // Pointer type?
833     $$ = newTH<Type>(HandleUpRefs(PointerType::get(*$1)));
834     delete $1;
835   }
836
837 // TypeList - Used for struct declarations and as a basis for method type 
838 // declaration type lists
839 //
840 TypeListI : UpRTypes {
841     $$ = new list<PATypeHolder<Type> >();
842     $$->push_back(*$1); delete $1;
843   }
844   | TypeListI ',' UpRTypes {
845     ($$=$1)->push_back(*$3); delete $3;
846   }
847
848 // ArgTypeList - List of types for a method type declaration...
849 ArgTypeListI : TypeListI
850   | TypeListI ',' DOTDOTDOT {
851     ($$=$1)->push_back(Type::VoidTy);
852   }
853   | DOTDOTDOT {
854     ($$ = new list<PATypeHolder<Type> >())->push_back(Type::VoidTy);
855   }
856   | /*empty*/ {
857     $$ = new list<PATypeHolder<Type> >();
858   }
859
860
861 // ConstVal - The various declarations that go into the constant pool.  This
862 // includes all forward declarations of types, constants, and functions.
863 //
864 ConstVal: Types '[' ConstVector ']' { // Nonempty unsized arr
865     const ArrayType *ATy = dyn_cast<const ArrayType>($1->get());
866     if (ATy == 0)
867       ThrowException("Cannot make array constant with type: '" + 
868                      (*$1)->getDescription() + "'!");
869     const Type *ETy = ATy->getElementType();
870     int NumElements = ATy->getNumElements();
871
872     // Verify that we have the correct size...
873     if (NumElements != -1 && NumElements != (int)$3->size())
874       ThrowException("Type mismatch: constant sized array initialized with " +
875                      utostr($3->size()) +  " arguments, but has size of " + 
876                      itostr(NumElements) + "!");
877
878     // Verify all elements are correct type!
879     for (unsigned i = 0; i < $3->size(); i++) {
880       if (ETy != (*$3)[i]->getType())
881         ThrowException("Element #" + utostr(i) + " is not of type '" + 
882                        ETy->getDescription() +"' as required!\nIt is of type '"+
883                        (*$3)[i]->getType()->getDescription() + "'.");
884     }
885
886     $$ = ConstantArray::get(ATy, *$3);
887     delete $1; delete $3;
888   }
889   | Types '[' ']' {
890     const ArrayType *ATy = dyn_cast<const ArrayType>($1->get());
891     if (ATy == 0)
892       ThrowException("Cannot make array constant with type: '" + 
893                      (*$1)->getDescription() + "'!");
894
895     int NumElements = ATy->getNumElements();
896     if (NumElements != -1 && NumElements != 0) 
897       ThrowException("Type mismatch: constant sized array initialized with 0"
898                      " arguments, but has size of " + itostr(NumElements) +"!");
899     $$ = ConstantArray::get(ATy, vector<Constant*>());
900     delete $1;
901   }
902   | Types 'c' STRINGCONSTANT {
903     const ArrayType *ATy = dyn_cast<const ArrayType>($1->get());
904     if (ATy == 0)
905       ThrowException("Cannot make array constant with type: '" + 
906                      (*$1)->getDescription() + "'!");
907
908     int NumElements = ATy->getNumElements();
909     const Type *ETy = ATy->getElementType();
910     char *EndStr = UnEscapeLexed($3, true);
911     if (NumElements != -1 && NumElements != (EndStr-$3))
912       ThrowException("Can't build string constant of size " + 
913                      itostr((int)(EndStr-$3)) +
914                      " when array has size " + itostr(NumElements) + "!");
915     vector<Constant*> Vals;
916     if (ETy == Type::SByteTy) {
917       for (char *C = $3; C != EndStr; ++C)
918         Vals.push_back(ConstantSInt::get(ETy, *C));
919     } else if (ETy == Type::UByteTy) {
920       for (char *C = $3; C != EndStr; ++C)
921         Vals.push_back(ConstantUInt::get(ETy, *C));
922     } else {
923       free($3);
924       ThrowException("Cannot build string arrays of non byte sized elements!");
925     }
926     free($3);
927     $$ = ConstantArray::get(ATy, Vals);
928     delete $1;
929   }
930   | Types '{' ConstVector '}' {
931     const StructType *STy = dyn_cast<const StructType>($1->get());
932     if (STy == 0)
933       ThrowException("Cannot make struct constant with type: '" + 
934                      (*$1)->getDescription() + "'!");
935     // FIXME: TODO: Check to see that the constants are compatible with the type
936     // initializer!
937     $$ = ConstantStruct::get(STy, *$3);
938     delete $1; delete $3;
939   }
940   | Types NULL_TOK {
941     const PointerType *PTy = dyn_cast<const PointerType>($1->get());
942     if (PTy == 0)
943       ThrowException("Cannot make null pointer constant with type: '" + 
944                      (*$1)->getDescription() + "'!");
945
946     $$ = ConstantPointerNull::get(PTy);
947     delete $1;
948   }
949   | Types SymbolicValueRef {
950     const PointerType *Ty = dyn_cast<const PointerType>($1->get());
951     if (Ty == 0)
952       ThrowException("Global const reference must be a pointer type!");
953
954     Value *V = getValNonImprovising(Ty, $2);
955
956     // If this is an initializer for a constant pointer, which is referencing a
957     // (currently) undefined variable, create a stub now that shall be replaced
958     // in the future with the right type of variable.
959     //
960     if (V == 0) {
961       assert(isa<PointerType>(Ty) && "Globals may only be used as pointers!");
962       const PointerType *PT = cast<PointerType>(Ty);
963
964       // First check to see if the forward references value is already created!
965       PerModuleInfo::GlobalRefsType::iterator I =
966         CurModule.GlobalRefs.find(make_pair(PT, $2));
967     
968       if (I != CurModule.GlobalRefs.end()) {
969         V = I->second;             // Placeholder already exists, use it...
970       } else {
971         // TODO: Include line number info by creating a subclass of
972         // TODO: GlobalVariable here that includes the said information!
973         
974         // Create a placeholder for the global variable reference...
975         GlobalVariable *GV = new GlobalVariable(PT->getElementType(),
976                                                 false, true);
977         // Keep track of the fact that we have a forward ref to recycle it
978         CurModule.GlobalRefs.insert(make_pair(make_pair(PT, $2), GV));
979
980         // Must temporarily push this value into the module table...
981         CurModule.CurrentModule->getGlobalList().push_back(GV);
982         V = GV;
983       }
984     }
985
986     GlobalValue *GV = cast<GlobalValue>(V);
987     $$ = ConstantPointerRef::get(GV);
988     delete $1;            // Free the type handle
989   }
990
991
992 ConstVal : SIntType EINT64VAL {     // integral constants
993     if (!ConstantSInt::isValueValidForType($1, $2))
994       ThrowException("Constant value doesn't fit in type!");
995     $$ = ConstantSInt::get($1, $2);
996   } 
997   | UIntType EUINT64VAL {           // integral constants
998     if (!ConstantUInt::isValueValidForType($1, $2))
999       ThrowException("Constant value doesn't fit in type!");
1000     $$ = ConstantUInt::get($1, $2);
1001   } 
1002   | BOOL TRUE {                     // Boolean constants
1003     $$ = ConstantBool::True;
1004   }
1005   | BOOL FALSE {                    // Boolean constants
1006     $$ = ConstantBool::False;
1007   }
1008   | FPType FPVAL {                   // Float & Double constants
1009     $$ = ConstantFP::get($1, $2);
1010   }
1011
1012 // ConstVector - A list of comma seperated constants.
1013 ConstVector : ConstVector ',' ConstVal {
1014     ($$ = $1)->push_back($3);
1015   }
1016   | ConstVal {
1017     $$ = new vector<Constant*>();
1018     $$->push_back($1);
1019   }
1020
1021
1022 // GlobalType - Match either GLOBAL or CONSTANT for global declarations...
1023 GlobalType : GLOBAL { $$ = false; } | CONSTANT { $$ = true; }
1024
1025
1026 // ConstPool - Constants with optional names assigned to them.
1027 ConstPool : ConstPool OptAssign CONST ConstVal { 
1028     if (setValueName($4, $2)) { assert(0 && "No redefinitions allowed!"); }
1029     InsertValue($4);
1030   }
1031   | ConstPool OptAssign TYPE TypesV {  // Types can be defined in the const pool
1032     // Eagerly resolve types.  This is not an optimization, this is a
1033     // requirement that is due to the fact that we could have this:
1034     //
1035     // %list = type { %list * }
1036     // %list = type { %list * }    ; repeated type decl
1037     //
1038     // If types are not resolved eagerly, then the two types will not be
1039     // determined to be the same type!
1040     //
1041     ResolveTypeTo($2, $4->get());
1042
1043     // TODO: FIXME when Type are not const
1044     if (!setValueName(const_cast<Type*>($4->get()), $2)) {
1045       // If this is not a redefinition of a type...
1046       if (!$2) {
1047         InsertType($4->get(),
1048                    inMethodScope() ? CurMeth.Types : CurModule.Types);
1049       }
1050     }
1051
1052     delete $4;
1053   }
1054   | ConstPool MethodProto {            // Method prototypes can be in const pool
1055   }
1056   | ConstPool OptAssign OptInternal GlobalType ConstVal {
1057     const Type *Ty = $5->getType();
1058     // Global declarations appear in Constant Pool
1059     Constant *Initializer = $5;
1060     if (Initializer == 0)
1061       ThrowException("Global value initializer is not a constant!");
1062          
1063     GlobalVariable *GV = new GlobalVariable(Ty, $4, $3, Initializer);
1064     if (!setValueName(GV, $2)) {   // If not redefining...
1065       CurModule.CurrentModule->getGlobalList().push_back(GV);
1066       int Slot = InsertValue(GV, CurModule.Values);
1067
1068       if (Slot != -1) {
1069         CurModule.DeclareNewGlobalValue(GV, ValID::create(Slot));
1070       } else {
1071         CurModule.DeclareNewGlobalValue(GV, ValID::create(
1072                                                 (char*)GV->getName().c_str()));
1073       }
1074     }
1075   }
1076   | ConstPool OptAssign OptInternal UNINIT GlobalType Types {
1077     const Type *Ty = *$6;
1078     // Global declarations appear in Constant Pool
1079     GlobalVariable *GV = new GlobalVariable(Ty, $5, $3);
1080     if (!setValueName(GV, $2)) {   // If not redefining...
1081       CurModule.CurrentModule->getGlobalList().push_back(GV);
1082       int Slot = InsertValue(GV, CurModule.Values);
1083
1084       if (Slot != -1) {
1085         CurModule.DeclareNewGlobalValue(GV, ValID::create(Slot));
1086       } else {
1087         assert(GV->hasName() && "Not named and not numbered!?");
1088         CurModule.DeclareNewGlobalValue(GV, ValID::create(
1089                                                 (char*)GV->getName().c_str()));
1090       }
1091     }
1092   }
1093   | /* empty: end of list */ { 
1094   }
1095
1096
1097 //===----------------------------------------------------------------------===//
1098 //                             Rules to match Modules
1099 //===----------------------------------------------------------------------===//
1100
1101 // Module rule: Capture the result of parsing the whole file into a result
1102 // variable...
1103 //
1104 Module : MethodList {
1105   $$ = ParserResult = $1;
1106   CurModule.ModuleDone();
1107 }
1108
1109 // MethodList - A list of methods, preceeded by a constant pool.
1110 //
1111 MethodList : MethodList Method {
1112     $$ = $1;
1113     if (!$2->getParent())
1114       $1->getMethodList().push_back($2);
1115     CurMeth.MethodDone();
1116   } 
1117   | MethodList MethodProto {
1118     $$ = $1;
1119   }
1120   | ConstPool IMPLEMENTATION {
1121     $$ = CurModule.CurrentModule;
1122     // Resolve circular types before we parse the body of the module
1123     ResolveTypes(CurModule.LateResolveTypes);
1124   }
1125
1126
1127 //===----------------------------------------------------------------------===//
1128 //                       Rules to match Method Headers
1129 //===----------------------------------------------------------------------===//
1130
1131 OptVAR_ID : VAR_ID | /*empty*/ { $$ = 0; }
1132
1133 ArgVal : Types OptVAR_ID {
1134   $$ = new pair<MethodArgument*,char*>(new MethodArgument(*$1), $2);
1135   delete $1;  // Delete the type handle..
1136 }
1137
1138 ArgListH : ArgVal ',' ArgListH {
1139     $$ = $3;
1140     $3->push_front(*$1);
1141     delete $1;
1142   }
1143   | ArgVal {
1144     $$ = new list<pair<MethodArgument*,char*> >();
1145     $$->push_front(*$1);
1146     delete $1;
1147   }
1148   | DOTDOTDOT {
1149     $$ = new list<pair<MethodArgument*, char*> >();
1150     $$->push_front(pair<MethodArgument*,char*>(
1151                             new MethodArgument(Type::VoidTy), 0));
1152   }
1153
1154 ArgList : ArgListH {
1155     $$ = $1;
1156   }
1157   | /* empty */ {
1158     $$ = 0;
1159   }
1160
1161 MethodHeaderH : OptInternal TypesV STRINGCONSTANT '(' ArgList ')' {
1162   UnEscapeLexed($3);
1163   string MethodName($3);
1164   
1165   vector<const Type*> ParamTypeList;
1166   if ($5)
1167     for (list<pair<MethodArgument*,char*> >::iterator I = $5->begin();
1168          I != $5->end(); ++I)
1169       ParamTypeList.push_back(I->first->getType());
1170
1171   bool isVarArg = ParamTypeList.size() && ParamTypeList.back() == Type::VoidTy;
1172   if (isVarArg) ParamTypeList.pop_back();
1173
1174   const MethodType  *MT  = MethodType::get(*$2, ParamTypeList, isVarArg);
1175   const PointerType *PMT = PointerType::get(MT);
1176   delete $2;
1177
1178   Method *M = 0;
1179   if (SymbolTable *ST = CurModule.CurrentModule->getSymbolTable()) {
1180     if (Value *V = ST->lookup(PMT, MethodName)) {  // Method already in symtab?
1181       M = cast<Method>(V);
1182
1183       // Yes it is.  If this is the case, either we need to be a forward decl,
1184       // or it needs to be.
1185       if (!CurMeth.isDeclare && !M->isExternal())
1186         ThrowException("Redefinition of method '" + MethodName + "'!");      
1187     }
1188   }
1189
1190   if (M == 0) {  // Not already defined?
1191     M = new Method(MT, $1, MethodName);
1192     InsertValue(M, CurModule.Values);
1193     CurModule.DeclareNewGlobalValue(M, ValID::create($3));
1194   }
1195   free($3);  // Free strdup'd memory!
1196
1197   CurMeth.MethodStart(M);
1198
1199   // Add all of the arguments we parsed to the method...
1200   if ($5 && !CurMeth.isDeclare) {        // Is null if empty...
1201     Method::ArgumentListType &ArgList = M->getArgumentList();
1202
1203     for (list<pair<MethodArgument*, char*> >::iterator I = $5->begin();
1204          I != $5->end(); ++I) {
1205       if (setValueName(I->first, I->second)) {  // Insert into symtab...
1206         assert(0 && "No arg redef allowed!");
1207       }
1208       
1209       InsertValue(I->first);
1210       ArgList.push_back(I->first);
1211     }
1212     delete $5;                     // We're now done with the argument list
1213   } else if ($5) {
1214     // If we are a declaration, we should free the memory for the argument list!
1215     for (list<pair<MethodArgument*, char*> >::iterator I = $5->begin();
1216          I != $5->end(); ++I)
1217       if (I->second) free(I->second);   // Free the memory for the name...
1218     delete $5;                          // Free the memory for the list itself
1219   }
1220 }
1221
1222 MethodHeader : MethodHeaderH ConstPool BEGINTOK {
1223   $$ = CurMeth.CurrentMethod;
1224
1225   // Resolve circular types before we parse the body of the method.
1226   ResolveTypes(CurMeth.LateResolveTypes);
1227 }
1228
1229 Method : BasicBlockList END {
1230   $$ = $1;
1231 }
1232
1233 MethodProto : DECLARE { CurMeth.isDeclare = true; } MethodHeaderH {
1234   $$ = CurMeth.CurrentMethod;
1235   if (!$$->getParent())
1236     CurModule.CurrentModule->getMethodList().push_back($$);
1237   CurMeth.MethodDone();
1238 }
1239
1240 //===----------------------------------------------------------------------===//
1241 //                        Rules to match Basic Blocks
1242 //===----------------------------------------------------------------------===//
1243
1244 ConstValueRef : ESINT64VAL {    // A reference to a direct constant
1245     $$ = ValID::create($1);
1246   }
1247   | EUINT64VAL {
1248     $$ = ValID::create($1);
1249   }
1250   | FPVAL {                     // Perhaps it's an FP constant?
1251     $$ = ValID::create($1);
1252   }
1253   | TRUE {
1254     $$ = ValID::create((int64_t)1);
1255   } 
1256   | FALSE {
1257     $$ = ValID::create((int64_t)0);
1258   }
1259   | NULL_TOK {
1260     $$ = ValID::createNull();
1261   }
1262
1263 /*
1264   | STRINGCONSTANT {        // Quoted strings work too... especially for methods
1265     $$ = ValID::create_conststr($1);
1266   }
1267 */
1268
1269 // SymbolicValueRef - Reference to one of two ways of symbolically refering to
1270 // another value.
1271 //
1272 SymbolicValueRef : INTVAL {  // Is it an integer reference...?
1273     $$ = ValID::create($1);
1274   }
1275   | VAR_ID {                 // Is it a named reference...?
1276     $$ = ValID::create($1);
1277   }
1278
1279 // ValueRef - A reference to a definition... either constant or symbolic
1280 ValueRef : SymbolicValueRef | ConstValueRef
1281
1282
1283 // ResolvedVal - a <type> <value> pair.  This is used only in cases where the
1284 // type immediately preceeds the value reference, and allows complex constant
1285 // pool references (for things like: 'ret [2 x int] [ int 12, int 42]')
1286 ResolvedVal : Types ValueRef {
1287     $$ = getVal(*$1, $2); delete $1;
1288   }
1289
1290
1291 BasicBlockList : BasicBlockList BasicBlock {
1292     ($$ = $1)->getBasicBlocks().push_back($2);
1293   }
1294   | MethodHeader BasicBlock { // Do not allow methods with 0 basic blocks   
1295     ($$ = $1)->getBasicBlocks().push_back($2);
1296   }
1297
1298
1299 // Basic blocks are terminated by branching instructions: 
1300 // br, br/cc, switch, ret
1301 //
1302 BasicBlock : InstructionList OptAssign BBTerminatorInst  {
1303     if (setValueName($3, $2)) { assert(0 && "No redefn allowed!"); }
1304     InsertValue($3);
1305
1306     $1->getInstList().push_back($3);
1307     InsertValue($1);
1308     $$ = $1;
1309   }
1310   | LABELSTR InstructionList OptAssign BBTerminatorInst  {
1311     if (setValueName($4, $3)) { assert(0 && "No redefn allowed!"); }
1312     InsertValue($4);
1313
1314     $2->getInstList().push_back($4);
1315     if (setValueName($2, $1)) { assert(0 && "No label redef allowed!"); }
1316
1317     InsertValue($2);
1318     $$ = $2;
1319   }
1320
1321 InstructionList : InstructionList Inst {
1322     $1->getInstList().push_back($2);
1323     $$ = $1;
1324   }
1325   | /* empty */ {
1326     $$ = new BasicBlock();
1327   }
1328
1329 BBTerminatorInst : RET ResolvedVal {              // Return with a result...
1330     $$ = new ReturnInst($2);
1331   }
1332   | RET VOID {                                       // Return with no result...
1333     $$ = new ReturnInst();
1334   }
1335   | BR LABEL ValueRef {                         // Unconditional Branch...
1336     $$ = new BranchInst(cast<BasicBlock>(getVal(Type::LabelTy, $3)));
1337   }                                                  // Conditional Branch...
1338   | BR BOOL ValueRef ',' LABEL ValueRef ',' LABEL ValueRef {  
1339     $$ = new BranchInst(cast<BasicBlock>(getVal(Type::LabelTy, $6)), 
1340                         cast<BasicBlock>(getVal(Type::LabelTy, $9)),
1341                         getVal(Type::BoolTy, $3));
1342   }
1343   | SWITCH IntType ValueRef ',' LABEL ValueRef '[' JumpTable ']' {
1344     SwitchInst *S = new SwitchInst(getVal($2, $3), 
1345                                    cast<BasicBlock>(getVal(Type::LabelTy, $6)));
1346     $$ = S;
1347
1348     list<pair<Constant*, BasicBlock*> >::iterator I = $8->begin(), 
1349                                                       end = $8->end();
1350     for (; I != end; ++I)
1351       S->dest_push_back(I->first, I->second);
1352   }
1353   | INVOKE TypesV ValueRef '(' ValueRefListE ')' TO ResolvedVal 
1354     EXCEPT ResolvedVal {
1355     const PointerType *PMTy;
1356     const MethodType *Ty;
1357
1358     if (!(PMTy = dyn_cast<PointerType>($2->get())) ||
1359         !(Ty = dyn_cast<MethodType>(PMTy->getElementType()))) {
1360       // Pull out the types of all of the arguments...
1361       vector<const Type*> ParamTypes;
1362       if ($5) {
1363         for (vector<Value*>::iterator I = $5->begin(), E = $5->end(); I!=E; ++I)
1364           ParamTypes.push_back((*I)->getType());
1365       }
1366
1367       bool isVarArg = ParamTypes.size() && ParamTypes.back() == Type::VoidTy;
1368       if (isVarArg) ParamTypes.pop_back();
1369
1370       Ty = MethodType::get($2->get(), ParamTypes, isVarArg);
1371       PMTy = PointerType::get(Ty);
1372     }
1373     delete $2;
1374
1375     Value *V = getVal(PMTy, $3);   // Get the method we're calling...
1376
1377     BasicBlock *Normal = dyn_cast<BasicBlock>($8);
1378     BasicBlock *Except = dyn_cast<BasicBlock>($10);
1379
1380     if (Normal == 0 || Except == 0)
1381       ThrowException("Invoke instruction without label destinations!");
1382
1383     // Create the call node...
1384     if (!$5) {                                   // Has no arguments?
1385       $$ = new InvokeInst(V, Normal, Except, vector<Value*>());
1386     } else {                                     // Has arguments?
1387       // Loop through MethodType's arguments and ensure they are specified
1388       // correctly!
1389       //
1390       MethodType::ParamTypes::const_iterator I = Ty->getParamTypes().begin();
1391       MethodType::ParamTypes::const_iterator E = Ty->getParamTypes().end();
1392       vector<Value*>::iterator ArgI = $5->begin(), ArgE = $5->end();
1393
1394       for (; ArgI != ArgE && I != E; ++ArgI, ++I)
1395         if ((*ArgI)->getType() != *I)
1396           ThrowException("Parameter " +(*ArgI)->getName()+ " is not of type '" +
1397                          (*I)->getDescription() + "'!");
1398
1399       if (I != E || (ArgI != ArgE && !Ty->isVarArg()))
1400         ThrowException("Invalid number of parameters detected!");
1401
1402       $$ = new InvokeInst(V, Normal, Except, *$5);
1403     }
1404     delete $5;
1405   }
1406
1407
1408
1409 JumpTable : JumpTable IntType ConstValueRef ',' LABEL ValueRef {
1410     $$ = $1;
1411     Constant *V = cast<Constant>(getValNonImprovising($2, $3));
1412     if (V == 0)
1413       ThrowException("May only switch on a constant pool value!");
1414
1415     $$->push_back(make_pair(V, cast<BasicBlock>(getVal($5, $6))));
1416   }
1417   | IntType ConstValueRef ',' LABEL ValueRef {
1418     $$ = new list<pair<Constant*, BasicBlock*> >();
1419     Constant *V = cast<Constant>(getValNonImprovising($1, $2));
1420
1421     if (V == 0)
1422       ThrowException("May only switch on a constant pool value!");
1423
1424     $$->push_back(make_pair(V, cast<BasicBlock>(getVal($4, $5))));
1425   }
1426
1427 Inst : OptAssign InstVal {
1428   // Is this definition named?? if so, assign the name...
1429   if (setValueName($2, $1)) { assert(0 && "No redefin allowed!"); }
1430   InsertValue($2);
1431   $$ = $2;
1432 }
1433
1434 PHIList : Types '[' ValueRef ',' ValueRef ']' {    // Used for PHI nodes
1435     $$ = new list<pair<Value*, BasicBlock*> >();
1436     $$->push_back(make_pair(getVal(*$1, $3), 
1437                             cast<BasicBlock>(getVal(Type::LabelTy, $5))));
1438     delete $1;
1439   }
1440   | PHIList ',' '[' ValueRef ',' ValueRef ']' {
1441     $$ = $1;
1442     $1->push_back(make_pair(getVal($1->front().first->getType(), $4),
1443                             cast<BasicBlock>(getVal(Type::LabelTy, $6))));
1444   }
1445
1446
1447 ValueRefList : ResolvedVal {    // Used for call statements, and memory insts...
1448     $$ = new vector<Value*>();
1449     $$->push_back($1);
1450   }
1451   | ValueRefList ',' ResolvedVal {
1452     $$ = $1;
1453     $1->push_back($3);
1454   }
1455
1456 // ValueRefListE - Just like ValueRefList, except that it may also be empty!
1457 ValueRefListE : ValueRefList | /*empty*/ { $$ = 0; }
1458
1459 InstVal : BinaryOps Types ValueRef ',' ValueRef {
1460     $$ = BinaryOperator::create($1, getVal(*$2, $3), getVal(*$2, $5));
1461     if ($$ == 0)
1462       ThrowException("binary operator returned null!");
1463     delete $2;
1464   }
1465   | UnaryOps ResolvedVal {
1466     $$ = UnaryOperator::create($1, $2);
1467     if ($$ == 0)
1468       ThrowException("unary operator returned null!");
1469   }
1470   | ShiftOps ResolvedVal ',' ResolvedVal {
1471     if ($4->getType() != Type::UByteTy)
1472       ThrowException("Shift amount must be ubyte!");
1473     $$ = new ShiftInst($1, $2, $4);
1474   }
1475   | CAST ResolvedVal TO Types {
1476     $$ = new CastInst($2, *$4);
1477     delete $4;
1478   }
1479   | PHI PHIList {
1480     const Type *Ty = $2->front().first->getType();
1481     $$ = new PHINode(Ty);
1482     while ($2->begin() != $2->end()) {
1483       if ($2->front().first->getType() != Ty) 
1484         ThrowException("All elements of a PHI node must be of the same type!");
1485       cast<PHINode>($$)->addIncoming($2->front().first, $2->front().second);
1486       $2->pop_front();
1487     }
1488     delete $2;  // Free the list...
1489   } 
1490   | CALL TypesV ValueRef '(' ValueRefListE ')' {
1491     const PointerType *PMTy;
1492     const MethodType *Ty;
1493
1494     if (!(PMTy = dyn_cast<PointerType>($2->get())) ||
1495         !(Ty = dyn_cast<MethodType>(PMTy->getElementType()))) {
1496       // Pull out the types of all of the arguments...
1497       vector<const Type*> ParamTypes;
1498       if ($5) {
1499         for (vector<Value*>::iterator I = $5->begin(), E = $5->end(); I!=E; ++I)
1500           ParamTypes.push_back((*I)->getType());
1501       }
1502
1503       bool isVarArg = ParamTypes.size() && ParamTypes.back() == Type::VoidTy;
1504       if (isVarArg) ParamTypes.pop_back();
1505
1506       Ty = MethodType::get($2->get(), ParamTypes, isVarArg);
1507       PMTy = PointerType::get(Ty);
1508     }
1509     delete $2;
1510
1511     Value *V = getVal(PMTy, $3);   // Get the method we're calling...
1512
1513     // Create the call node...
1514     if (!$5) {                                   // Has no arguments?
1515       $$ = new CallInst(V, vector<Value*>());
1516     } else {                                     // Has arguments?
1517       // Loop through MethodType's arguments and ensure they are specified
1518       // correctly!
1519       //
1520       MethodType::ParamTypes::const_iterator I = Ty->getParamTypes().begin();
1521       MethodType::ParamTypes::const_iterator E = Ty->getParamTypes().end();
1522       vector<Value*>::iterator ArgI = $5->begin(), ArgE = $5->end();
1523
1524       for (; ArgI != ArgE && I != E; ++ArgI, ++I)
1525         if ((*ArgI)->getType() != *I)
1526           ThrowException("Parameter " +(*ArgI)->getName()+ " is not of type '" +
1527                          (*I)->getDescription() + "'!");
1528
1529       if (I != E || (ArgI != ArgE && !Ty->isVarArg()))
1530         ThrowException("Invalid number of parameters detected!");
1531
1532       $$ = new CallInst(V, *$5);
1533     }
1534     delete $5;
1535   }
1536   | MemoryInst {
1537     $$ = $1;
1538   }
1539
1540
1541 // IndexList - List of indices for GEP based instructions...
1542 IndexList : ',' ValueRefList { 
1543   $$ = $2; 
1544 } | /* empty */ { 
1545   $$ = new vector<Value*>(); 
1546 }
1547
1548 MemoryInst : MALLOC Types {
1549     $$ = new MallocInst(PointerType::get(*$2));
1550     delete $2;
1551   }
1552   | MALLOC Types ',' UINT ValueRef {
1553     const Type *Ty = PointerType::get(*$2);
1554     $$ = new MallocInst(Ty, getVal($4, $5));
1555     delete $2;
1556   }
1557   | ALLOCA Types {
1558     $$ = new AllocaInst(PointerType::get(*$2));
1559     delete $2;
1560   }
1561   | ALLOCA Types ',' UINT ValueRef {
1562     const Type *Ty = PointerType::get(*$2);
1563     Value *ArrSize = getVal($4, $5);
1564     $$ = new AllocaInst(Ty, ArrSize);
1565     delete $2;
1566   }
1567   | FREE ResolvedVal {
1568     if (!$2->getType()->isPointerType())
1569       ThrowException("Trying to free nonpointer type " + 
1570                      $2->getType()->getDescription() + "!");
1571     $$ = new FreeInst($2);
1572   }
1573
1574   | LOAD Types ValueRef IndexList {
1575     if (!(*$2)->isPointerType())
1576       ThrowException("Can't load from nonpointer type: " +
1577                      (*$2)->getDescription());
1578     if (LoadInst::getIndexedType(*$2, *$4) == 0)
1579       ThrowException("Invalid indices for load instruction!");
1580
1581     $$ = new LoadInst(getVal(*$2, $3), *$4);
1582     delete $4;   // Free the vector...
1583     delete $2;
1584   }
1585   | STORE ResolvedVal ',' Types ValueRef IndexList {
1586     if (!(*$4)->isPointerType())
1587       ThrowException("Can't store to a nonpointer type: " +
1588                      (*$4)->getDescription());
1589     const Type *ElTy = StoreInst::getIndexedType(*$4, *$6);
1590     if (ElTy == 0)
1591       ThrowException("Can't store into that field list!");
1592     if (ElTy != $2->getType())
1593       ThrowException("Can't store '" + $2->getType()->getDescription() +
1594                      "' into space of type '" + ElTy->getDescription() + "'!");
1595     $$ = new StoreInst($2, getVal(*$4, $5), *$6);
1596     delete $4; delete $6;
1597   }
1598   | GETELEMENTPTR Types ValueRef IndexList {
1599     if (!(*$2)->isPointerType())
1600       ThrowException("getelementptr insn requires pointer operand!");
1601     if (!GetElementPtrInst::getIndexedType(*$2, *$4, true))
1602       ThrowException("Can't get element ptr '" + (*$2)->getDescription()+ "'!");
1603     $$ = new GetElementPtrInst(getVal(*$2, $3), *$4);
1604     delete $2; delete $4;
1605   }
1606
1607 %%
1608 int yyerror(const char *ErrorMsg) {
1609   ThrowException(string("Parse error: ") + ErrorMsg);
1610   return 0;
1611 }