Document OptionPreprocessor.
[oota-llvm.git] / tools / llvmc / doc / LLVMC-Reference.rst
1 ===================================
2 Customizing LLVMC: Reference Manual
3 ===================================
4 ..
5    This file was automatically generated by rst2html.
6    Please do not edit directly!
7    The ReST source lives in the directory 'tools/llvmc/doc'.
8
9 .. contents::
10
11 .. raw:: html
12
13    <div class="doc_author">
14    <p>Written by <a href="mailto:foldr@codedgers.com">Mikhail Glushenkov</a></p>
15    </div>
16
17 Introduction
18 ============
19
20 LLVMC is a generic compiler driver, designed to be customizable and
21 extensible. It plays the same role for LLVM as the ``gcc`` program
22 does for GCC - LLVMC's job is essentially to transform a set of input
23 files into a set of targets depending on configuration rules and user
24 options. What makes LLVMC different is that these transformation rules
25 are completely customizable - in fact, LLVMC knows nothing about the
26 specifics of transformation (even the command-line options are mostly
27 not hard-coded) and regards the transformation structure as an
28 abstract graph. The structure of this graph is completely determined
29 by plugins, which can be either statically or dynamically linked. This
30 makes it possible to easily adapt LLVMC for other purposes - for
31 example, as a build tool for game resources.
32
33 Because LLVMC employs TableGen_ as its configuration language, you
34 need to be familiar with it to customize LLVMC.
35
36 .. _TableGen: http://llvm.org/docs/TableGenFundamentals.html
37
38
39 Compiling with LLVMC
40 ====================
41
42 LLVMC tries hard to be as compatible with ``gcc`` as possible,
43 although there are some small differences. Most of the time, however,
44 you shouldn't be able to notice them::
45
46      $ # This works as expected:
47      $ llvmc -O3 -Wall hello.cpp
48      $ ./a.out
49      hello
50
51 One nice feature of LLVMC is that one doesn't have to distinguish between
52 different compilers for different languages (think ``g++`` vs.  ``gcc``) - the
53 right toolchain is chosen automatically based on input language names (which
54 are, in turn, determined from file extensions). If you want to force files
55 ending with ".c" to compile as C++, use the ``-x`` option, just like you would
56 do it with ``gcc``::
57
58       $ # hello.c is really a C++ file
59       $ llvmc -x c++ hello.c
60       $ ./a.out
61       hello
62
63 On the other hand, when using LLVMC as a linker to combine several C++
64 object files you should provide the ``--linker`` option since it's
65 impossible for LLVMC to choose the right linker in that case::
66
67     $ llvmc -c hello.cpp
68     $ llvmc hello.o
69     [A lot of link-time errors skipped]
70     $ llvmc --linker=c++ hello.o
71     $ ./a.out
72     hello
73
74 By default, LLVMC uses ``llvm-gcc`` to compile the source code. It is also
75 possible to choose the ``clang`` compiler with the ``-clang`` option.
76
77
78 Predefined options
79 ==================
80
81 LLVMC has some built-in options that can't be overridden in the
82 configuration libraries:
83
84 * ``-o FILE`` - Output file name.
85
86 * ``-x LANGUAGE`` - Specify the language of the following input files
87   until the next -x option.
88
89 * ``-load PLUGIN_NAME`` - Load the specified plugin DLL. Example:
90   ``-load $LLVM_DIR/Release/lib/LLVMCSimple.so``.
91
92 * ``-v`` - Enable verbose mode, i.e. print out all executed commands.
93
94 * ``--save-temps`` - Write temporary files to the current directory and do not
95   delete them on exit. This option can also take an argument: the
96   ``--save-temps=obj`` switch will write files into the directory specified with
97   the ``-o`` option. The ``--save-temps=cwd`` and ``--save-temps`` switches are
98   both synonyms for the default behaviour.
99
100 * ``--temp-dir DIRECTORY`` - Store temporary files in the given directory. This
101   directory is deleted on exit unless ``--save-temps`` is specified. If
102   ``--save-temps=obj`` is also specified, ``--temp-dir`` is given the
103   precedence.
104
105 * ``--check-graph`` - Check the compilation for common errors like mismatched
106   output/input language names, multiple default edges and cycles. Because of
107   plugins, these checks can't be performed at compile-time. Exit with code zero
108   if no errors were found, and return the number of found errors
109   otherwise. Hidden option, useful for debugging LLVMC plugins.
110
111 * ``--view-graph`` - Show a graphical representation of the compilation graph
112   and exit. Requires that you have ``dot`` and ``gv`` programs installed. Hidden
113   option, useful for debugging LLVMC plugins.
114
115 * ``--write-graph`` - Write a ``compilation-graph.dot`` file in the current
116   directory with the compilation graph description in Graphviz format (identical
117   to the file used by the ``--view-graph`` option). The ``-o`` option can be
118   used to set the output file name. Hidden option, useful for debugging LLVMC
119   plugins.
120
121 * ``--help``, ``--help-hidden``, ``--version`` - These options have
122   their standard meaning.
123
124 Compiling LLVMC plugins
125 =======================
126
127 It's easiest to start working on your own LLVMC plugin by copying the
128 skeleton project which lives under ``$LLVMC_DIR/plugins/Simple``::
129
130    $ cd $LLVMC_DIR/plugins
131    $ cp -r Simple MyPlugin
132    $ cd MyPlugin
133    $ ls
134    Makefile PluginMain.cpp Simple.td
135
136 As you can see, our basic plugin consists of only two files (not
137 counting the build script). ``Simple.td`` contains TableGen
138 description of the compilation graph; its format is documented in the
139 following sections. ``PluginMain.cpp`` is just a helper file used to
140 compile the auto-generated C++ code produced from TableGen source. It
141 can also contain hook definitions (see `below`__).
142
143 __ hooks_
144
145 The first thing that you should do is to change the ``LLVMC_PLUGIN``
146 variable in the ``Makefile`` to avoid conflicts (since this variable
147 is used to name the resulting library)::
148
149    LLVMC_PLUGIN=MyPlugin
150
151 It is also a good idea to rename ``Simple.td`` to something less
152 generic::
153
154    $ mv Simple.td MyPlugin.td
155
156 To build your plugin as a dynamic library, just ``cd`` to its source
157 directory and run ``make``. The resulting file will be called
158 ``plugin_llvmc_$(LLVMC_PLUGIN).$(DLL_EXTENSION)`` (in our case,
159 ``plugin_llvmc_MyPlugin.so``). This library can be then loaded in with the
160 ``-load`` option. Example::
161
162     $ cd $LLVMC_DIR/plugins/Simple
163     $ make
164     $ llvmc -load $LLVM_DIR/Release/lib/plugin_llvmc_Simple.so
165
166 Compiling standalone LLVMC-based drivers
167 ========================================
168
169 By default, the ``llvmc`` executable consists of a driver core plus several
170 statically linked plugins (``Base`` and ``Clang`` at the moment). You can
171 produce a standalone LLVMC-based driver executable by linking the core with your
172 own plugins. The recommended way to do this is by starting with the provided
173 ``Skeleton`` example (``$LLVMC_DIR/example/Skeleton``)::
174
175     $ cd $LLVMC_DIR/example/
176     $ cp -r Skeleton mydriver
177     $ cd mydriver
178     $ vim Makefile
179     [...]
180     $ make
181
182 If you're compiling LLVM with different source and object directories, then you
183 must perform the following additional steps before running ``make``::
184
185     # LLVMC_SRC_DIR = $LLVM_SRC_DIR/tools/llvmc/
186     # LLVMC_OBJ_DIR = $LLVM_OBJ_DIR/tools/llvmc/
187     $ cp $LLVMC_SRC_DIR/example/mydriver/Makefile \
188       $LLVMC_OBJ_DIR/example/mydriver/
189     $ cd $LLVMC_OBJ_DIR/example/mydriver
190     $ make
191
192 Another way to do the same thing is by using the following command::
193
194     $ cd $LLVMC_DIR
195     $ make LLVMC_BUILTIN_PLUGINS=MyPlugin LLVMC_BASED_DRIVER_NAME=mydriver
196
197 This works with both srcdir == objdir and srcdir != objdir, but assumes that the
198 plugin source directory was placed under ``$LLVMC_DIR/plugins``.
199
200 Sometimes, you will want a 'bare-bones' version of LLVMC that has no
201 built-in plugins. It can be compiled with the following command::
202
203     $ cd $LLVMC_DIR
204     $ make LLVMC_BUILTIN_PLUGINS=""
205
206
207 Customizing LLVMC: the compilation graph
208 ========================================
209
210 Each TableGen configuration file should include the common
211 definitions::
212
213    include "llvm/CompilerDriver/Common.td"
214
215 Internally, LLVMC stores information about possible source
216 transformations in form of a graph. Nodes in this graph represent
217 tools, and edges between two nodes represent a transformation path. A
218 special "root" node is used to mark entry points for the
219 transformations. LLVMC also assigns a weight to each edge (more on
220 this later) to choose between several alternative edges.
221
222 The definition of the compilation graph (see file
223 ``plugins/Base/Base.td`` for an example) is just a list of edges::
224
225     def CompilationGraph : CompilationGraph<[
226         Edge<"root", "llvm_gcc_c">,
227         Edge<"root", "llvm_gcc_assembler">,
228         ...
229
230         Edge<"llvm_gcc_c", "llc">,
231         Edge<"llvm_gcc_cpp", "llc">,
232         ...
233
234         OptionalEdge<"llvm_gcc_c", "opt", (case (switch_on "opt"),
235                                           (inc_weight))>,
236         OptionalEdge<"llvm_gcc_cpp", "opt", (case (switch_on "opt"),
237                                                   (inc_weight))>,
238         ...
239
240         OptionalEdge<"llvm_gcc_assembler", "llvm_gcc_cpp_linker",
241             (case (input_languages_contain "c++"), (inc_weight),
242                   (or (parameter_equals "linker", "g++"),
243                       (parameter_equals "linker", "c++")), (inc_weight))>,
244         ...
245
246         ]>;
247
248 As you can see, the edges can be either default or optional, where
249 optional edges are differentiated by an additional ``case`` expression
250 used to calculate the weight of this edge. Notice also that we refer
251 to tools via their names (as strings). This makes it possible to add
252 edges to an existing compilation graph in plugins without having to
253 know about all tool definitions used in the graph.
254
255 The default edges are assigned a weight of 1, and optional edges get a
256 weight of 0 + 2*N where N is the number of tests that evaluated to
257 true in the ``case`` expression. It is also possible to provide an
258 integer parameter to ``inc_weight`` and ``dec_weight`` - in this case,
259 the weight is increased (or decreased) by the provided value instead
260 of the default 2. It is also possible to change the default weight of
261 an optional edge by using the ``default`` clause of the ``case``
262 construct.
263
264 When passing an input file through the graph, LLVMC picks the edge
265 with the maximum weight. To avoid ambiguity, there should be only one
266 default edge between two nodes (with the exception of the root node,
267 which gets a special treatment - there you are allowed to specify one
268 default edge *per language*).
269
270 When multiple plugins are loaded, their compilation graphs are merged
271 together. Since multiple edges that have the same end nodes are not
272 allowed (i.e. the graph is not a multigraph), an edge defined in
273 several plugins will be replaced by the definition from the plugin
274 that was loaded last. Plugin load order can be controlled by using the
275 plugin priority feature described above.
276
277 To get a visual representation of the compilation graph (useful for
278 debugging), run ``llvmc --view-graph``. You will need ``dot`` and
279 ``gsview`` installed for this to work properly.
280
281 Describing options
282 ==================
283
284 Command-line options that the plugin supports are defined by using an
285 ``OptionList``::
286
287     def Options : OptionList<[
288     (switch_option "E", (help "Help string")),
289     (alias_option "quiet", "q")
290     ...
291     ]>;
292
293 As you can see, the option list is just a list of DAGs, where each DAG
294 is an option description consisting of the option name and some
295 properties. A plugin can define more than one option list (they are
296 all merged together in the end), which can be handy if one wants to
297 separate option groups syntactically.
298
299 * Possible option types:
300
301    - ``switch_option`` - a simple boolean switch without arguments, for example
302      ``-O2`` or ``-time``. At most one occurrence is allowed.
303
304    - ``parameter_option`` - option that takes one argument, for example
305      ``-std=c99``. It is also allowed to use spaces instead of the equality
306      sign: ``-std c99``. At most one occurrence is allowed.
307
308    - ``parameter_list_option`` - same as the above, but more than one option
309      occurence is allowed.
310
311    - ``prefix_option`` - same as the parameter_option, but the option name and
312      argument do not have to be separated. Example: ``-ofile``. This can be also
313      specified as ``-o file``; however, ``-o=file`` will be parsed incorrectly
314      (``=file`` will be interpreted as option value). At most one occurrence is
315      allowed.
316
317    - ``prefix_list_option`` - same as the above, but more than one occurence of
318      the option is allowed; example: ``-lm -lpthread``.
319
320    - ``alias_option`` - a special option type for creating aliases. Unlike other
321      option types, aliases are not allowed to have any properties besides the
322      aliased option name. Usage example: ``(alias_option "preprocess", "E")``
323
324
325 * Possible option properties:
326
327    - ``help`` - help string associated with this option. Used for ``--help``
328      output.
329
330    - ``required`` - this option must be specified exactly once (or, in case of
331      the list options without the ``multi_val`` property, at least
332      once). Incompatible with ``zero_or_one`` and ``one_or_more``.
333
334    - ``one_or_more`` - the option must be specified at least one time. Useful
335      only for list options in conjunction with ``multi_val``; for ordinary lists
336      it is synonymous with ``required``. Incompatible with ``required`` and
337      ``zero_or_one``.
338
339    - ``zero_or_one`` - the option can be specified zero or one times. Useful
340      only for list options in conjunction with ``multi_val``. Incompatible with
341      ``required`` and ``one_or_more``.
342
343    - ``hidden`` - the description of this option will not appear in
344      the ``--help`` output (but will appear in the ``--help-hidden``
345      output).
346
347    - ``really_hidden`` - the option will not be mentioned in any help
348      output.
349
350    - ``multi_val n`` - this option takes *n* arguments (can be useful in some
351      special cases). Usage example: ``(parameter_list_option "foo", (multi_val
352      3))``; the command-line syntax is '-foo a b c'. Only list options can have
353      this attribute; you can, however, use the ``one_or_more``, ``zero_or_one``
354      and ``required`` properties.
355
356    - ``init`` - this option has a default value, either a string (if it is a
357      parameter), or a boolean (if it is a switch; boolean constants are called
358      ``true`` and ``false``). List options can't have this attribute. Usage
359      examples: ``(switch_option "foo", (init true))``; ``(prefix_option "bar",
360      (init "baz"))``.
361
362    - ``extern`` - this option is defined in some other plugin, see below.
363
364 External options
365 ----------------
366
367 Sometimes, when linking several plugins together, one plugin needs to
368 access options defined in some other plugin. Because of the way
369 options are implemented, such options must be marked as
370 ``extern``. This is what the ``extern`` option property is
371 for. Example::
372
373      ...
374      (switch_option "E", (extern))
375      ...
376
377 If an external option has additional attributes besides 'extern', they are
378 ignored. See also the section on plugin `priorities`__.
379
380 __ priorities_
381
382 .. _case:
383
384 Conditional evaluation
385 ======================
386
387 The 'case' construct is the main means by which programmability is
388 achieved in LLVMC. It can be used to calculate edge weights, program
389 actions and modify the shell commands to be executed. The 'case'
390 expression is designed after the similarly-named construct in
391 functional languages and takes the form ``(case (test_1), statement_1,
392 (test_2), statement_2, ... (test_N), statement_N)``. The statements
393 are evaluated only if the corresponding tests evaluate to true.
394
395 Examples::
396
397     // Edge weight calculation
398
399     // Increases edge weight by 5 if "-A" is provided on the
400     // command-line, and by 5 more if "-B" is also provided.
401     (case
402         (switch_on "A"), (inc_weight 5),
403         (switch_on "B"), (inc_weight 5))
404
405
406     // Tool command line specification
407
408     // Evaluates to "cmdline1" if the option "-A" is provided on the
409     // command line; to "cmdline2" if "-B" is provided;
410     // otherwise to "cmdline3".
411
412     (case
413         (switch_on "A"), "cmdline1",
414         (switch_on "B"), "cmdline2",
415         (default), "cmdline3")
416
417 Note the slight difference in 'case' expression handling in contexts
418 of edge weights and command line specification - in the second example
419 the value of the ``"B"`` switch is never checked when switch ``"A"`` is
420 enabled, and the whole expression always evaluates to ``"cmdline1"`` in
421 that case.
422
423 Case expressions can also be nested, i.e. the following is legal::
424
425     (case (switch_on "E"), (case (switch_on "o"), ..., (default), ...)
426           (default), ...)
427
428 You should, however, try to avoid doing that because it hurts
429 readability. It is usually better to split tool descriptions and/or
430 use TableGen inheritance instead.
431
432 * Possible tests are:
433
434   - ``switch_on`` - Returns true if a given command-line switch is provided by
435     the user. Can be given a list as argument, in that case ``(switch_on ["foo",
436     "bar", "baz"])`` is equivalent to ``(and (switch_on "foo"), (switch_on
437     "bar"), (switch_on "baz"))``.
438     Example: ``(switch_on "opt")``.
439
440   - ``any_switch_on`` - Given a list of switch options, returns true if any of
441     the switches is turned on.
442     Example: ``(any_switch_on ["foo", "bar", "baz"])`` is equivalent to ``(or
443     (switch_on "foo"), (switch_on "bar"), (switch_on "baz"))``.
444
445   - ``parameter_equals`` - Returns true if a command-line parameter equals
446     a given value.
447     Example: ``(parameter_equals "W", "all")``.
448
449   - ``element_in_list`` - Returns true if a command-line parameter
450     list contains a given value.
451     Example: ``(parameter_in_list "l", "pthread")``.
452
453   - ``input_languages_contain`` - Returns true if a given language
454     belongs to the current input language set.
455     Example: ``(input_languages_contain "c++")``.
456
457   - ``in_language`` - Evaluates to true if the input file language is equal to
458     the argument. At the moment works only with ``cmd_line`` and ``actions`` (on
459     non-join nodes).
460     Example: ``(in_language "c++")``.
461
462   - ``not_empty`` - Returns true if a given option (which should be either a
463     parameter or a parameter list) is set by the user. Like ``switch_on``, can
464     be also given a list as argument.
465     Example: ``(not_empty "o")``.
466
467   - ``any_not_empty`` - Returns true if ``not_empty`` returns true for any of
468     the options in the list.
469     Example: ``(any_not_empty ["foo", "bar", "baz"])`` is equivalent to ``(or
470     (not_empty "foo"), (not_empty "bar"), (not_empty "baz"))``.
471
472   - ``empty`` - The opposite of ``not_empty``. Equivalent to ``(not (not_empty
473     X))``. Provided for convenience. Can be given a list as argument.
474
475   - ``any_not_empty`` - Returns true if ``not_empty`` returns true for any of
476     the options in the list.
477     Example: ``(any_empty ["foo", "bar", "baz"])`` is equivalent to ``(not (and
478     (not_empty "foo"), (not_empty "bar"), (not_empty "baz")))``.
479
480   - ``single_input_file`` - Returns true if there was only one input file
481     provided on the command-line. Used without arguments:
482     ``(single_input_file)``.
483
484   - ``multiple_input_files`` - Equivalent to ``(not (single_input_file))`` (the
485     case of zero input files is considered an error).
486
487   - ``default`` - Always evaluates to true. Should always be the last
488     test in the ``case`` expression.
489
490   - ``and`` - A standard binary logical combinator that returns true iff all of
491     its arguments return true. Used like this: ``(and (test1), (test2),
492     ... (testN))``. Nesting of ``and`` and ``or`` is allowed, but not
493     encouraged.
494
495   - ``or`` - A binary logical combinator that returns true iff any of its
496     arguments returns true. Example: ``(or (test1), (test2), ... (testN))``.
497
498   - ``not`` - Standard unary logical combinator that negates its
499     argument. Example: ``(not (or (test1), (test2), ... (testN)))``.
500
501
502
503 Writing a tool description
504 ==========================
505
506 As was said earlier, nodes in the compilation graph represent tools,
507 which are described separately. A tool definition looks like this
508 (taken from the ``include/llvm/CompilerDriver/Tools.td`` file)::
509
510   def llvm_gcc_cpp : Tool<[
511       (in_language "c++"),
512       (out_language "llvm-assembler"),
513       (output_suffix "bc"),
514       (cmd_line "llvm-g++ -c $INFILE -o $OUTFILE -emit-llvm"),
515       (sink)
516       ]>;
517
518 This defines a new tool called ``llvm_gcc_cpp``, which is an alias for
519 ``llvm-g++``. As you can see, a tool definition is just a list of
520 properties; most of them should be self-explanatory. The ``sink``
521 property means that this tool should be passed all command-line
522 options that aren't mentioned in the option list.
523
524 The complete list of all currently implemented tool properties follows.
525
526 * Possible tool properties:
527
528   - ``in_language`` - input language name. Can be either a string or a
529     list, in case the tool supports multiple input languages.
530
531   - ``out_language`` - output language name. Multiple output languages are not
532     allowed.
533
534   - ``output_suffix`` - output file suffix. Can also be changed
535     dynamically, see documentation on actions.
536
537   - ``cmd_line`` - the actual command used to run the tool. You can
538     use ``$INFILE`` and ``$OUTFILE`` variables, output redirection
539     with ``>``, hook invocations (``$CALL``), environment variables
540     (via ``$ENV``) and the ``case`` construct.
541
542   - ``join`` - this tool is a "join node" in the graph, i.e. it gets a
543     list of input files and joins them together. Used for linkers.
544
545   - ``sink`` - all command-line options that are not handled by other
546     tools are passed to this tool.
547
548   - ``actions`` - A single big ``case`` expression that specifies how
549     this tool reacts on command-line options (described in more detail
550     below).
551
552 Actions
553 -------
554
555 A tool often needs to react to command-line options, and this is
556 precisely what the ``actions`` property is for. The next example
557 illustrates this feature::
558
559   def llvm_gcc_linker : Tool<[
560       (in_language "object-code"),
561       (out_language "executable"),
562       (output_suffix "out"),
563       (cmd_line "llvm-gcc $INFILE -o $OUTFILE"),
564       (join),
565       (actions (case (not_empty "L"), (forward "L"),
566                      (not_empty "l"), (forward "l"),
567                      (not_empty "dummy"),
568                                [(append_cmd "-dummy1"), (append_cmd "-dummy2")])
569       ]>;
570
571 The ``actions`` tool property is implemented on top of the omnipresent
572 ``case`` expression. It associates one or more different *actions*
573 with given conditions - in the example, the actions are ``forward``,
574 which forwards a given option unchanged, and ``append_cmd``, which
575 appends a given string to the tool execution command. Multiple actions
576 can be associated with a single condition by using a list of actions
577 (used in the example to append some dummy options). The same ``case``
578 construct can also be used in the ``cmd_line`` property to modify the
579 tool command line.
580
581 The "join" property used in the example means that this tool behaves
582 like a linker.
583
584 The list of all possible actions follows.
585
586 * Possible actions:
587
588    - ``append_cmd`` - append a string to the tool invocation
589      command.
590      Example: ``(case (switch_on "pthread"), (append_cmd
591      "-lpthread"))``
592
593    - ``error`` - exit with error.
594      Example: ``(error "Mixing -c and -S is not allowed!")``.
595
596    - ``warning`` - print a warning.
597      Example: ``(warning "Specifying both -O1 and -O2 is meaningless!")``.
598
599    - ``forward`` - forward an option unchanged.  Example: ``(forward "Wall")``.
600
601    - ``forward_as`` - Change the name of an option, but forward the
602      argument unchanged.
603      Example: ``(forward_as "O0", "--disable-optimization")``.
604
605    - ``output_suffix`` - modify the output suffix of this
606      tool.
607      Example: ``(output_suffix "i")``.
608
609    - ``stop_compilation`` - stop compilation after this tool processes
610      its input. Used without arguments.
611
612    - ``unpack_values`` - used for for splitting and forwarding
613      comma-separated lists of options, e.g. ``-Wa,-foo=bar,-baz`` is
614      converted to ``-foo=bar -baz`` and appended to the tool invocation
615      command.
616      Example: ``(unpack_values "Wa,")``.
617
618 Language map
619 ============
620
621 If you are adding support for a new language to LLVMC, you'll need to
622 modify the language map, which defines mappings from file extensions
623 to language names. It is used to choose the proper toolchain(s) for a
624 given input file set. Language map definition looks like this::
625
626     def LanguageMap : LanguageMap<
627         [LangToSuffixes<"c++", ["cc", "cp", "cxx", "cpp", "CPP", "c++", "C"]>,
628          LangToSuffixes<"c", ["c"]>,
629          ...
630         ]>;
631
632 For example, without those definitions the following command wouldn't work::
633
634     $ llvmc hello.cpp
635     llvmc: Unknown suffix: cpp
636
637 The language map entries should be added only for tools that are
638 linked with the root node. Since tools are not allowed to have
639 multiple output languages, for nodes "inside" the graph the input and
640 output languages should match. This is enforced at compile-time.
641
642 Option preprocessor
643 ===================
644
645 It is sometimes useful to run error-checking code before processing the
646 compilation graph. For example, if optimization options "-O1" and "-O2" are
647 implemented as switches, we might want to output a warning if the user invokes
648 the driver with both of these options enabled.
649
650 The ``OptionPreprocessor`` feature is reserved specially for these
651 occasions. Example (adapted from the built-in Base plugin)::
652
653    def Preprocess : OptionPreprocessor<
654    (case (and (switch_on "O3"), (any_switch_on ["O0", "O1", "O2"])),
655               [(unset_option ["O0", "O1", "O2"]),
656                (warning "Multiple -O options specified, defaulted to -O3.")],
657          (and (switch_on "O2"), (any_switch_on ["O0", "O1"])),
658               (unset_option ["O0", "O1"]),
659          (and (switch_on "O1"), (switch_on "O0")),
660               (unset_option "O0"))
661    >;
662
663 Here, ``OptionPreprocessor`` is used to unset all spurious optimization options
664 (so that they are not forwarded to the compiler).
665
666 ``OptionPreprocessor`` is basically a single big ``case`` expression, which is
667 evaluated only once right after the plugin is loaded. The only allowed actions
668 in ``OptionPreprocessor`` are ``error``, ``warning`` and a special action
669 ``unset_option``, which, as the name suggests, unsets a given option. For
670 convenience, ``unset_option`` also works on lists.
671
672
673 More advanced topics
674 ====================
675
676 .. _hooks:
677
678 Hooks and environment variables
679 -------------------------------
680
681 Normally, LLVMC executes programs from the system ``PATH``. Sometimes,
682 this is not sufficient: for example, we may want to specify tool paths
683 or names in the configuration file. This can be easily achieved via
684 the hooks mechanism. To write your own hooks, just add their
685 definitions to the ``PluginMain.cpp`` or drop a ``.cpp`` file into the
686 your plugin directory. Hooks should live in the ``hooks`` namespace
687 and have the signature ``std::string hooks::MyHookName ([const char*
688 Arg0 [ const char* Arg2 [, ...]]])``. They can be used from the
689 ``cmd_line`` tool property::
690
691     (cmd_line "$CALL(MyHook)/path/to/file -o $CALL(AnotherHook)")
692
693 To pass arguments to hooks, use the following syntax::
694
695     (cmd_line "$CALL(MyHook, 'Arg1', 'Arg2', 'Arg # 3')/path/to/file -o1 -o2")
696
697 It is also possible to use environment variables in the same manner::
698
699    (cmd_line "$ENV(VAR1)/path/to/file -o $ENV(VAR2)")
700
701 To change the command line string based on user-provided options use
702 the ``case`` expression (documented `above`__)::
703
704     (cmd_line
705       (case
706         (switch_on "E"),
707            "llvm-g++ -E -x c $INFILE -o $OUTFILE",
708         (default),
709            "llvm-g++ -c -x c $INFILE -o $OUTFILE -emit-llvm"))
710
711 __ case_
712
713 .. _priorities:
714
715 How plugins are loaded
716 ----------------------
717
718 It is possible for LLVMC plugins to depend on each other. For example,
719 one can create edges between nodes defined in some other plugin. To
720 make this work, however, that plugin should be loaded first. To
721 achieve this, the concept of plugin priority was introduced. By
722 default, every plugin has priority zero; to specify the priority
723 explicitly, put the following line in your plugin's TableGen file::
724
725     def Priority : PluginPriority<$PRIORITY_VALUE>;
726     # Where PRIORITY_VALUE is some integer > 0
727
728 Plugins are loaded in order of their (increasing) priority, starting
729 with 0. Therefore, the plugin with the highest priority value will be
730 loaded last.
731
732 Debugging
733 ---------
734
735 When writing LLVMC plugins, it can be useful to get a visual view of
736 the resulting compilation graph. This can be achieved via the command
737 line option ``--view-graph``. This command assumes that Graphviz_ and
738 Ghostview_ are installed. There is also a ``--write-graph`` option that
739 creates a Graphviz source file (``compilation-graph.dot``) in the
740 current directory.
741
742 Another useful ``llvmc`` option is ``--check-graph``. It checks the
743 compilation graph for common errors like mismatched output/input
744 language names, multiple default edges and cycles. These checks can't
745 be performed at compile-time because the plugins can load code
746 dynamically. When invoked with ``--check-graph``, ``llvmc`` doesn't
747 perform any compilation tasks and returns the number of encountered
748 errors as its status code.
749
750 .. _Graphviz: http://www.graphviz.org/
751 .. _Ghostview: http://pages.cs.wisc.edu/~ghost/
752
753 Conditioning on the executable name
754 -----------------------------------
755
756 For now, the executable name (the value passed to the driver in ``argv[0]``) is
757 accessible only in the C++ code (i.e. hooks). Use the following code::
758
759     namespace llvmc {
760     extern const char* ProgramName;
761     }
762
763     std::string MyHook() {
764     //...
765     if (strcmp(ProgramName, "mydriver") == 0) {
766        //...
767
768     }
769
770 In general, you're encouraged not to make the behaviour dependent on the
771 executable file name, and use command-line switches instead. See for example how
772 the ``Base`` plugin behaves when it needs to choose the correct linker options
773 (think ``g++`` vs. ``gcc``).
774
775 .. raw:: html
776
777    <hr />
778    <address>
779    <a href="http://jigsaw.w3.org/css-validator/check/referer">
780    <img src="http://jigsaw.w3.org/css-validator/images/vcss-blue"
781       alt="Valid CSS" /></a>
782    <a href="http://validator.w3.org/check?uri=referer">
783    <img src="http://www.w3.org/Icons/valid-xhtml10-blue"
784       alt="Valid XHTML 1.0 Transitional"/></a>
785
786    <a href="mailto:foldr@codedgers.com">Mikhail Glushenkov</a><br />
787    <a href="http://llvm.org">LLVM Compiler Infrastructure</a><br />
788
789    Last modified: $Date: 2008-12-11 11:34:48 -0600 (Thu, 11 Dec 2008) $
790    </address>