Added the -h option for compatibility with other linkers.
[oota-llvm.git] / tools / gccld / gccld.cpp
1 //===- gccld.cpp - LLVM 'ld' compatible linker ----------------------------===//
2 // 
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file was developed by the LLVM research group and is distributed under
6 // the University of Illinois Open Source License. See LICENSE.TXT for details.
7 // 
8 //===----------------------------------------------------------------------===//
9 //
10 // This utility is intended to be compatible with GCC, and follows standard
11 // system 'ld' conventions.  As such, the default output file is ./a.out.
12 // Additionally, this program outputs a shell script that is used to invoke LLI
13 // to execute the program.  In this manner, the generated executable (a.out for
14 // example), is directly executable, whereas the bytecode file actually lives in
15 // the a.out.bc file generated by this program.  Also, Force is on by default.
16 //
17 // Note that if someone (or a script) deletes the executable program generated,
18 // the .bc file will be left around.  Considering that this is a temporary hack,
19 // I'm not too worried about this.
20 //
21 //===----------------------------------------------------------------------===//
22
23 #include "gccld.h"
24 #include "llvm/Module.h"
25 #include "llvm/PassManager.h"
26 #include "llvm/Bytecode/Reader.h"
27 #include "llvm/Bytecode/WriteBytecodePass.h"
28 #include "llvm/Target/TargetData.h"
29 #include "llvm/Transforms/IPO.h"
30 #include "llvm/Transforms/Scalar.h"
31 #include "llvm/Transforms/Utils/Linker.h"
32 #include "Support/CommandLine.h"
33 #include "Support/FileUtilities.h"
34 #include "Support/Signals.h"
35 #include "Support/SystemUtils.h"
36 #include <fstream>
37 #include <memory>
38
39 using namespace llvm;
40
41 namespace {
42   cl::list<std::string> 
43   InputFilenames(cl::Positional, cl::desc("<input bytecode files>"),
44                  cl::OneOrMore);
45
46   cl::opt<std::string> 
47   OutputFilename("o", cl::desc("Override output filename"), cl::init("a.out"),
48                  cl::value_desc("filename"));
49
50   cl::opt<bool>    
51   Verbose("v", cl::desc("Print information about actions taken"));
52   
53   cl::list<std::string> 
54   LibPaths("L", cl::desc("Specify a library search path"), cl::Prefix,
55            cl::value_desc("directory"));
56
57   cl::list<std::string> 
58   Libraries("l", cl::desc("Specify libraries to link to"), cl::Prefix,
59             cl::value_desc("library prefix"));
60
61   cl::opt<bool>
62   Strip("s", cl::desc("Strip symbol info from executable"));
63
64   cl::opt<bool>
65   NoInternalize("disable-internalize",
66                 cl::desc("Do not mark all symbols as internal"));
67   cl::alias
68   ExportDynamic("export-dynamic", cl::desc("Alias for -disable-internalize"),
69                 cl::aliasopt(NoInternalize));
70
71   cl::opt<bool>
72   LinkAsLibrary("link-as-library", cl::desc("Link the .bc files together as a"
73                                             " library, not an executable"));
74   cl::alias
75   Relink("r", cl::desc("Alias for -link-as-library"),
76          cl::aliasopt(LinkAsLibrary));
77
78   cl::opt<bool>    
79   Native("native",
80          cl::desc("Generate a native binary instead of a shell script"));
81   
82   // Compatibility options that are ignored but supported by LD
83   cl::opt<std::string>
84   CO3("soname", cl::Hidden, cl::desc("Compatibility option: ignored"));
85   cl::opt<std::string>
86   CO4("version-script", cl::Hidden, cl::desc("Compatibility option: ignored"));
87   cl::opt<bool>
88   CO5("eh-frame-hdr", cl::Hidden, cl::desc("Compatibility option: ignored"));
89   cl::opt<std::string>
90   CO6("h", cl::Hidden, cl::desc("Compatibility option: ignored"));
91 }
92
93 namespace llvm {
94
95 /// PrintAndReturn - Prints a message to standard error and returns a value
96 /// usable for an exit status.
97 ///
98 /// Inputs:
99 ///  progname - The name of the program (i.e. argv[0]).
100 ///  Message  - The message to print to standard error.
101 ///  Extra    - Extra information to print between the program name and thei
102 ///             message.  It is optional.
103 ///
104 /// Return value:
105 ///  Returns a value that can be used as the exit status (i.e. for exit()).
106 ///
107 int
108 PrintAndReturn(const char *progname,
109                const std::string &Message,
110                const std::string &Extra)
111 {
112   std::cerr << progname << Extra << ": " << Message << "\n";
113   return 1;
114 }
115
116 /// CopyEnv - This function takes an array of environment variables and makes a
117 /// copy of it.  This copy can then be manipulated any way the caller likes
118 /// without affecting the process's real environment.
119 ///
120 /// Inputs:
121 ///  envp - An array of C strings containing an environment.
122 ///
123 /// Return value:
124 ///  NULL - An error occurred.
125 ///
126 ///  Otherwise, a pointer to a new array of C strings is returned.  Every string
127 ///  in the array is a duplicate of the one in the original array (i.e. we do
128 ///  not copy the char *'s from one array to another).
129 ///
130 char ** CopyEnv(char ** const envp) {
131   // Count the number of entries in the old list;
132   unsigned entries;   // The number of entries in the old environment list
133   for (entries = 0; envp[entries] != NULL; entries++)
134     /*empty*/;
135
136   // Add one more entry for the NULL pointer that ends the list.
137   ++entries;
138
139   // If there are no entries at all, just return NULL.
140   if (entries == 0)
141     return NULL;
142
143   // Allocate a new environment list.
144   char **newenv = new char* [entries];
145   if ((newenv = new char* [entries]) == NULL)
146     return NULL;
147
148   // Make a copy of the list.  Don't forget the NULL that ends the list.
149   entries = 0;
150   while (envp[entries] != NULL) {
151     newenv[entries] = new char[strlen (envp[entries]) + 1];
152     strcpy (newenv[entries], envp[entries]);
153     ++entries;
154   }
155   newenv[entries] = NULL;
156
157   return newenv;
158 }
159
160
161 /// RemoveEnv - Remove the specified environment variable from the environment
162 /// array.
163 ///
164 /// Inputs:
165 ///  name - The name of the variable to remove.  It cannot be NULL.
166 ///  envp - The array of environment variables.  It cannot be NULL.
167 ///
168 /// Notes:
169 ///  This is mainly done because functions to remove items from the environment
170 ///  are not available across all platforms.  In particular, Solaris does not
171 ///  seem to have an unsetenv() function or a setenv() function (or they are
172 ///  undocumented if they do exist).
173 ///
174 void RemoveEnv(const char * name, char ** const envp) {
175   for (unsigned index=0; envp[index] != NULL; index++) {
176     // Find the first equals sign in the array and make it an EOS character.
177     char *p = strchr (envp[index], '=');
178     if (p == NULL)
179       continue;
180     else
181       *p = '\0';
182
183     // Compare the two strings.  If they are equal, zap this string.
184     // Otherwise, restore it.
185     if (!strcmp(name, envp[index]))
186       *envp[index] = '\0';
187     else
188       *p = '=';
189   }
190
191   return;
192 }
193
194 } // End llvm namespace
195
196 int main(int argc, char **argv, char **envp) {
197   cl::ParseCommandLineOptions(argc, argv, " llvm linker for GCC\n");
198
199   std::string ModuleID("gccld-output");
200   std::auto_ptr<Module> Composite(new Module(ModuleID));
201
202   // We always look first in the current directory when searching for libraries.
203   LibPaths.insert(LibPaths.begin(), ".");
204
205   // If the user specified an extra search path in their environment, respect
206   // it.
207   if (char *SearchPath = getenv("LLVM_LIB_SEARCH_PATH"))
208     LibPaths.push_back(SearchPath);
209
210   // Remove any consecutive duplicates of the same library...
211   Libraries.erase(std::unique(Libraries.begin(), Libraries.end()),
212                   Libraries.end());
213
214   // Link in all of the files
215   if (LinkFiles(argv[0], Composite.get(), InputFilenames, Verbose))
216     return 1; // Error already printed
217
218   if (!LinkAsLibrary)
219     LinkLibraries(argv[0], Composite.get(), Libraries, LibPaths,
220                   Verbose, Native);
221
222   // Link in all of the libraries next...
223
224   // Create the output file.
225   std::string RealBytecodeOutput = OutputFilename;
226   if (!LinkAsLibrary) RealBytecodeOutput += ".bc";
227   std::ofstream Out(RealBytecodeOutput.c_str());
228   if (!Out.good())
229     return PrintAndReturn(argv[0], "error opening '" + RealBytecodeOutput +
230                                    "' for writing!");
231
232   // Ensure that the bytecode file gets removed from the disk if we get a
233   // SIGINT signal.
234   RemoveFileOnSignal(RealBytecodeOutput);
235
236   // Generate the bytecode file.
237   if (GenerateBytecode(Composite.get(), Strip, !NoInternalize, &Out)) {
238     Out.close();
239     return PrintAndReturn(argv[0], "error generating bytecode");
240   }
241
242   // Close the bytecode file.
243   Out.close();
244
245   // If we are not linking a library, generate either a native executable
246   // or a JIT shell script, depending upon what the user wants.
247   if (!LinkAsLibrary) {
248     // If the user wants to generate a native executable, compile it from the
249     // bytecode file.
250     //
251     // Otherwise, create a script that will run the bytecode through the JIT.
252     if (Native) {
253       // Name of the Assembly Language output file
254       std::string AssemblyFile = OutputFilename + ".s";
255
256       // Mark the output files for removal if we get an interrupt.
257       RemoveFileOnSignal(AssemblyFile);
258       RemoveFileOnSignal(OutputFilename);
259
260       // Determine the locations of the llc and gcc programs.
261       std::string llc = FindExecutable("llc", argv[0]);
262       std::string gcc = FindExecutable("gcc", argv[0]);
263       if (llc.empty())
264         return PrintAndReturn(argv[0], "Failed to find llc");
265
266       if (gcc.empty())
267         return PrintAndReturn(argv[0], "Failed to find gcc");
268
269       // Generate an assembly language file for the bytecode.
270       if (Verbose) std::cout << "Generating Assembly Code\n";
271       GenerateAssembly(AssemblyFile, RealBytecodeOutput, llc, envp);
272       if (Verbose) std::cout << "Generating Native Code\n";
273       GenerateNative(OutputFilename, AssemblyFile, Libraries, LibPaths,
274                      gcc, envp);
275
276       // Remove the assembly language file.
277       removeFile (AssemblyFile);
278     } else {
279       // Output the script to start the program...
280       std::ofstream Out2(OutputFilename.c_str());
281       if (!Out2.good())
282         return PrintAndReturn(argv[0], "error opening '" + OutputFilename +
283                                        "' for writing!");
284       Out2 << "#!/bin/sh\nlli \\\n";
285       // gcc accepts -l<lib> and implicitly searches /lib and /usr/lib.
286       LibPaths.push_back("/lib");
287       LibPaths.push_back("/usr/lib");
288       LibPaths.push_back("/usr/X11R6/lib");
289       // We don't need to link in libc! In fact, /usr/lib/libc.so may not be a
290       // shared object at all! See RH 8: plain text.
291       std::vector<std::string>::iterator libc = 
292         std::find(Libraries.begin(), Libraries.end(), "c");
293       if (libc != Libraries.end()) Libraries.erase(libc);
294       // List all the shared object (native) libraries this executable will need
295       // on the command line, so that we don't have to do this manually!
296       for (std::vector<std::string>::iterator i = Libraries.begin(), 
297              e = Libraries.end(); i != e; ++i) {
298         std::string FullLibraryPath = FindLib(*i, LibPaths, true);
299         if (!FullLibraryPath.empty() && IsSharedObject(FullLibraryPath))
300           Out2 << "    -load=" << FullLibraryPath << " \\\n";
301       }
302       Out2 << "    $0.bc $*\n";
303       Out2.close();
304     }
305   
306     // Make the script executable...
307     MakeFileExecutable(OutputFilename);
308
309     // Make the bytecode file readable and directly executable in LLEE as well
310     MakeFileExecutable(RealBytecodeOutput);
311     MakeFileReadable(RealBytecodeOutput);
312   }
313
314   return 0;
315 }