cf1ceab1f1c6b736080289be4f3bff3cbd07b102
[oota-llvm.git] / docs / LangRef.rst
1 ==============================
2 LLVM Language Reference Manual
3 ==============================
4
5 .. contents::
6    :local:
7    :depth: 4
8
9 Abstract
10 ========
11
12 This document is a reference manual for the LLVM assembly language. LLVM
13 is a Static Single Assignment (SSA) based representation that provides
14 type safety, low-level operations, flexibility, and the capability of
15 representing 'all' high-level languages cleanly. It is the common code
16 representation used throughout all phases of the LLVM compilation
17 strategy.
18
19 Introduction
20 ============
21
22 The LLVM code representation is designed to be used in three different
23 forms: as an in-memory compiler IR, as an on-disk bitcode representation
24 (suitable for fast loading by a Just-In-Time compiler), and as a human
25 readable assembly language representation. This allows LLVM to provide a
26 powerful intermediate representation for efficient compiler
27 transformations and analysis, while providing a natural means to debug
28 and visualize the transformations. The three different forms of LLVM are
29 all equivalent. This document describes the human readable
30 representation and notation.
31
32 The LLVM representation aims to be light-weight and low-level while
33 being expressive, typed, and extensible at the same time. It aims to be
34 a "universal IR" of sorts, by being at a low enough level that
35 high-level ideas may be cleanly mapped to it (similar to how
36 microprocessors are "universal IR's", allowing many source languages to
37 be mapped to them). By providing type information, LLVM can be used as
38 the target of optimizations: for example, through pointer analysis, it
39 can be proven that a C automatic variable is never accessed outside of
40 the current function, allowing it to be promoted to a simple SSA value
41 instead of a memory location.
42
43 .. _wellformed:
44
45 Well-Formedness
46 ---------------
47
48 It is important to note that this document describes 'well formed' LLVM
49 assembly language. There is a difference between what the parser accepts
50 and what is considered 'well formed'. For example, the following
51 instruction is syntactically okay, but not well formed:
52
53 .. code-block:: llvm
54
55     %x = add i32 1, %x
56
57 because the definition of ``%x`` does not dominate all of its uses. The
58 LLVM infrastructure provides a verification pass that may be used to
59 verify that an LLVM module is well formed. This pass is automatically
60 run by the parser after parsing input assembly and by the optimizer
61 before it outputs bitcode. The violations pointed out by the verifier
62 pass indicate bugs in transformation passes or input to the parser.
63
64 .. _identifiers:
65
66 Identifiers
67 ===========
68
69 LLVM identifiers come in two basic types: global and local. Global
70 identifiers (functions, global variables) begin with the ``'@'``
71 character. Local identifiers (register names, types) begin with the
72 ``'%'`` character. Additionally, there are three different formats for
73 identifiers, for different purposes:
74
75 #. Named values are represented as a string of characters with their
76    prefix. For example, ``%foo``, ``@DivisionByZero``,
77    ``%a.really.long.identifier``. The actual regular expression used is
78    '``[%@][-a-zA-Z$._][-a-zA-Z$._0-9]*``'. Identifiers that require other
79    characters in their names can be surrounded with quotes. Special
80    characters may be escaped using ``"\xx"`` where ``xx`` is the ASCII
81    code for the character in hexadecimal. In this way, any character can
82    be used in a name value, even quotes themselves. The ``"\01"`` prefix
83    can be used on global variables to suppress mangling.
84 #. Unnamed values are represented as an unsigned numeric value with
85    their prefix. For example, ``%12``, ``@2``, ``%44``.
86 #. Constants, which are described in the section Constants_ below.
87
88 LLVM requires that values start with a prefix for two reasons: Compilers
89 don't need to worry about name clashes with reserved words, and the set
90 of reserved words may be expanded in the future without penalty.
91 Additionally, unnamed identifiers allow a compiler to quickly come up
92 with a temporary variable without having to avoid symbol table
93 conflicts.
94
95 Reserved words in LLVM are very similar to reserved words in other
96 languages. There are keywords for different opcodes ('``add``',
97 '``bitcast``', '``ret``', etc...), for primitive type names ('``void``',
98 '``i32``', etc...), and others. These reserved words cannot conflict
99 with variable names, because none of them start with a prefix character
100 (``'%'`` or ``'@'``).
101
102 Here is an example of LLVM code to multiply the integer variable
103 '``%X``' by 8:
104
105 The easy way:
106
107 .. code-block:: llvm
108
109     %result = mul i32 %X, 8
110
111 After strength reduction:
112
113 .. code-block:: llvm
114
115     %result = shl i32 %X, 3
116
117 And the hard way:
118
119 .. code-block:: llvm
120
121     %0 = add i32 %X, %X           ; yields i32:%0
122     %1 = add i32 %0, %0           ; yields i32:%1
123     %result = add i32 %1, %1
124
125 This last way of multiplying ``%X`` by 8 illustrates several important
126 lexical features of LLVM:
127
128 #. Comments are delimited with a '``;``' and go until the end of line.
129 #. Unnamed temporaries are created when the result of a computation is
130    not assigned to a named value.
131 #. Unnamed temporaries are numbered sequentially (using a per-function
132    incrementing counter, starting with 0). Note that basic blocks and unnamed
133    function parameters are included in this numbering. For example, if the
134    entry basic block is not given a label name and all function parameters are
135    named, then it will get number 0.
136
137 It also shows a convention that we follow in this document. When
138 demonstrating instructions, we will follow an instruction with a comment
139 that defines the type and name of value produced.
140
141 High Level Structure
142 ====================
143
144 Module Structure
145 ----------------
146
147 LLVM programs are composed of ``Module``'s, each of which is a
148 translation unit of the input programs. Each module consists of
149 functions, global variables, and symbol table entries. Modules may be
150 combined together with the LLVM linker, which merges function (and
151 global variable) definitions, resolves forward declarations, and merges
152 symbol table entries. Here is an example of the "hello world" module:
153
154 .. code-block:: llvm
155
156     ; Declare the string constant as a global constant.
157     @.str = private unnamed_addr constant [13 x i8] c"hello world\0A\00"
158
159     ; External declaration of the puts function
160     declare i32 @puts(i8* nocapture) nounwind
161
162     ; Definition of main function
163     define i32 @main() {   ; i32()*
164       ; Convert [13 x i8]* to i8  *...
165       %cast210 = getelementptr [13 x i8], [13 x i8]* @.str, i64 0, i64 0
166
167       ; Call puts function to write out the string to stdout.
168       call i32 @puts(i8* %cast210)
169       ret i32 0
170     }
171
172     ; Named metadata
173     !0 = !{i32 42, null, !"string"}
174     !foo = !{!0}
175
176 This example is made up of a :ref:`global variable <globalvars>` named
177 "``.str``", an external declaration of the "``puts``" function, a
178 :ref:`function definition <functionstructure>` for "``main``" and
179 :ref:`named metadata <namedmetadatastructure>` "``foo``".
180
181 In general, a module is made up of a list of global values (where both
182 functions and global variables are global values). Global values are
183 represented by a pointer to a memory location (in this case, a pointer
184 to an array of char, and a pointer to a function), and have one of the
185 following :ref:`linkage types <linkage>`.
186
187 .. _linkage:
188
189 Linkage Types
190 -------------
191
192 All Global Variables and Functions have one of the following types of
193 linkage:
194
195 ``private``
196     Global values with "``private``" linkage are only directly
197     accessible by objects in the current module. In particular, linking
198     code into a module with an private global value may cause the
199     private to be renamed as necessary to avoid collisions. Because the
200     symbol is private to the module, all references can be updated. This
201     doesn't show up in any symbol table in the object file.
202 ``internal``
203     Similar to private, but the value shows as a local symbol
204     (``STB_LOCAL`` in the case of ELF) in the object file. This
205     corresponds to the notion of the '``static``' keyword in C.
206 ``available_externally``
207     Globals with "``available_externally``" linkage are never emitted
208     into the object file corresponding to the LLVM module. They exist to
209     allow inlining and other optimizations to take place given knowledge
210     of the definition of the global, which is known to be somewhere
211     outside the module. Globals with ``available_externally`` linkage
212     are allowed to be discarded at will, and are otherwise the same as
213     ``linkonce_odr``. This linkage type is only allowed on definitions,
214     not declarations.
215 ``linkonce``
216     Globals with "``linkonce``" linkage are merged with other globals of
217     the same name when linkage occurs. This can be used to implement
218     some forms of inline functions, templates, or other code which must
219     be generated in each translation unit that uses it, but where the
220     body may be overridden with a more definitive definition later.
221     Unreferenced ``linkonce`` globals are allowed to be discarded. Note
222     that ``linkonce`` linkage does not actually allow the optimizer to
223     inline the body of this function into callers because it doesn't
224     know if this definition of the function is the definitive definition
225     within the program or whether it will be overridden by a stronger
226     definition. To enable inlining and other optimizations, use
227     "``linkonce_odr``" linkage.
228 ``weak``
229     "``weak``" linkage has the same merging semantics as ``linkonce``
230     linkage, except that unreferenced globals with ``weak`` linkage may
231     not be discarded. This is used for globals that are declared "weak"
232     in C source code.
233 ``common``
234     "``common``" linkage is most similar to "``weak``" linkage, but they
235     are used for tentative definitions in C, such as "``int X;``" at
236     global scope. Symbols with "``common``" linkage are merged in the
237     same way as ``weak symbols``, and they may not be deleted if
238     unreferenced. ``common`` symbols may not have an explicit section,
239     must have a zero initializer, and may not be marked
240     ':ref:`constant <globalvars>`'. Functions and aliases may not have
241     common linkage.
242
243 .. _linkage_appending:
244
245 ``appending``
246     "``appending``" linkage may only be applied to global variables of
247     pointer to array type. When two global variables with appending
248     linkage are linked together, the two global arrays are appended
249     together. This is the LLVM, typesafe, equivalent of having the
250     system linker append together "sections" with identical names when
251     .o files are linked.
252 ``extern_weak``
253     The semantics of this linkage follow the ELF object file model: the
254     symbol is weak until linked, if not linked, the symbol becomes null
255     instead of being an undefined reference.
256 ``linkonce_odr``, ``weak_odr``
257     Some languages allow differing globals to be merged, such as two
258     functions with different semantics. Other languages, such as
259     ``C++``, ensure that only equivalent globals are ever merged (the
260     "one definition rule" --- "ODR"). Such languages can use the
261     ``linkonce_odr`` and ``weak_odr`` linkage types to indicate that the
262     global will only be merged with equivalent globals. These linkage
263     types are otherwise the same as their non-``odr`` versions.
264 ``external``
265     If none of the above identifiers are used, the global is externally
266     visible, meaning that it participates in linkage and can be used to
267     resolve external symbol references.
268
269 It is illegal for a function *declaration* to have any linkage type
270 other than ``external`` or ``extern_weak``.
271
272 .. _callingconv:
273
274 Calling Conventions
275 -------------------
276
277 LLVM :ref:`functions <functionstructure>`, :ref:`calls <i_call>` and
278 :ref:`invokes <i_invoke>` can all have an optional calling convention
279 specified for the call. The calling convention of any pair of dynamic
280 caller/callee must match, or the behavior of the program is undefined.
281 The following calling conventions are supported by LLVM, and more may be
282 added in the future:
283
284 "``ccc``" - The C calling convention
285     This calling convention (the default if no other calling convention
286     is specified) matches the target C calling conventions. This calling
287     convention supports varargs function calls and tolerates some
288     mismatch in the declared prototype and implemented declaration of
289     the function (as does normal C).
290 "``fastcc``" - The fast calling convention
291     This calling convention attempts to make calls as fast as possible
292     (e.g. by passing things in registers). This calling convention
293     allows the target to use whatever tricks it wants to produce fast
294     code for the target, without having to conform to an externally
295     specified ABI (Application Binary Interface). `Tail calls can only
296     be optimized when this, the GHC or the HiPE convention is
297     used. <CodeGenerator.html#id80>`_ This calling convention does not
298     support varargs and requires the prototype of all callees to exactly
299     match the prototype of the function definition.
300 "``coldcc``" - The cold calling convention
301     This calling convention attempts to make code in the caller as
302     efficient as possible under the assumption that the call is not
303     commonly executed. As such, these calls often preserve all registers
304     so that the call does not break any live ranges in the caller side.
305     This calling convention does not support varargs and requires the
306     prototype of all callees to exactly match the prototype of the
307     function definition. Furthermore the inliner doesn't consider such function
308     calls for inlining.
309 "``cc 10``" - GHC convention
310     This calling convention has been implemented specifically for use by
311     the `Glasgow Haskell Compiler (GHC) <http://www.haskell.org/ghc>`_.
312     It passes everything in registers, going to extremes to achieve this
313     by disabling callee save registers. This calling convention should
314     not be used lightly but only for specific situations such as an
315     alternative to the *register pinning* performance technique often
316     used when implementing functional programming languages. At the
317     moment only X86 supports this convention and it has the following
318     limitations:
319
320     -  On *X86-32* only supports up to 4 bit type parameters. No
321        floating point types are supported.
322     -  On *X86-64* only supports up to 10 bit type parameters and 6
323        floating point parameters.
324
325     This calling convention supports `tail call
326     optimization <CodeGenerator.html#id80>`_ but requires both the
327     caller and callee are using it.
328 "``cc 11``" - The HiPE calling convention
329     This calling convention has been implemented specifically for use by
330     the `High-Performance Erlang
331     (HiPE) <http://www.it.uu.se/research/group/hipe/>`_ compiler, *the*
332     native code compiler of the `Ericsson's Open Source Erlang/OTP
333     system <http://www.erlang.org/download.shtml>`_. It uses more
334     registers for argument passing than the ordinary C calling
335     convention and defines no callee-saved registers. The calling
336     convention properly supports `tail call
337     optimization <CodeGenerator.html#id80>`_ but requires that both the
338     caller and the callee use it. It uses a *register pinning*
339     mechanism, similar to GHC's convention, for keeping frequently
340     accessed runtime components pinned to specific hardware registers.
341     At the moment only X86 supports this convention (both 32 and 64
342     bit).
343 "``webkit_jscc``" - WebKit's JavaScript calling convention
344     This calling convention has been implemented for `WebKit FTL JIT
345     <https://trac.webkit.org/wiki/FTLJIT>`_. It passes arguments on the
346     stack right to left (as cdecl does), and returns a value in the
347     platform's customary return register.
348 "``anyregcc``" - Dynamic calling convention for code patching
349     This is a special convention that supports patching an arbitrary code
350     sequence in place of a call site. This convention forces the call
351     arguments into registers but allows them to be dynamically
352     allocated. This can currently only be used with calls to
353     llvm.experimental.patchpoint because only this intrinsic records
354     the location of its arguments in a side table. See :doc:`StackMaps`.
355 "``preserve_mostcc``" - The `PreserveMost` calling convention
356     This calling convention attempts to make the code in the caller as
357     unintrusive as possible. This convention behaves identically to the `C`
358     calling convention on how arguments and return values are passed, but it
359     uses a different set of caller/callee-saved registers. This alleviates the
360     burden of saving and recovering a large register set before and after the
361     call in the caller. If the arguments are passed in callee-saved registers,
362     then they will be preserved by the callee across the call. This doesn't
363     apply for values returned in callee-saved registers.
364
365     - On X86-64 the callee preserves all general purpose registers, except for
366       R11. R11 can be used as a scratch register. Floating-point registers
367       (XMMs/YMMs) are not preserved and need to be saved by the caller.
368
369     The idea behind this convention is to support calls to runtime functions
370     that have a hot path and a cold path. The hot path is usually a small piece
371     of code that doesn't use many registers. The cold path might need to call out to
372     another function and therefore only needs to preserve the caller-saved
373     registers, which haven't already been saved by the caller. The
374     `PreserveMost` calling convention is very similar to the `cold` calling
375     convention in terms of caller/callee-saved registers, but they are used for
376     different types of function calls. `coldcc` is for function calls that are
377     rarely executed, whereas `preserve_mostcc` function calls are intended to be
378     on the hot path and definitely executed a lot. Furthermore `preserve_mostcc`
379     doesn't prevent the inliner from inlining the function call.
380
381     This calling convention will be used by a future version of the ObjectiveC
382     runtime and should therefore still be considered experimental at this time.
383     Although this convention was created to optimize certain runtime calls to
384     the ObjectiveC runtime, it is not limited to this runtime and might be used
385     by other runtimes in the future too. The current implementation only
386     supports X86-64, but the intention is to support more architectures in the
387     future.
388 "``preserve_allcc``" - The `PreserveAll` calling convention
389     This calling convention attempts to make the code in the caller even less
390     intrusive than the `PreserveMost` calling convention. This calling
391     convention also behaves identical to the `C` calling convention on how
392     arguments and return values are passed, but it uses a different set of
393     caller/callee-saved registers. This removes the burden of saving and
394     recovering a large register set before and after the call in the caller. If
395     the arguments are passed in callee-saved registers, then they will be
396     preserved by the callee across the call. This doesn't apply for values
397     returned in callee-saved registers.
398
399     - On X86-64 the callee preserves all general purpose registers, except for
400       R11. R11 can be used as a scratch register. Furthermore it also preserves
401       all floating-point registers (XMMs/YMMs).
402
403     The idea behind this convention is to support calls to runtime functions
404     that don't need to call out to any other functions.
405
406     This calling convention, like the `PreserveMost` calling convention, will be
407     used by a future version of the ObjectiveC runtime and should be considered
408     experimental at this time.
409 "``cc <n>``" - Numbered convention
410     Any calling convention may be specified by number, allowing
411     target-specific calling conventions to be used. Target specific
412     calling conventions start at 64.
413
414 More calling conventions can be added/defined on an as-needed basis, to
415 support Pascal conventions or any other well-known target-independent
416 convention.
417
418 .. _visibilitystyles:
419
420 Visibility Styles
421 -----------------
422
423 All Global Variables and Functions have one of the following visibility
424 styles:
425
426 "``default``" - Default style
427     On targets that use the ELF object file format, default visibility
428     means that the declaration is visible to other modules and, in
429     shared libraries, means that the declared entity may be overridden.
430     On Darwin, default visibility means that the declaration is visible
431     to other modules. Default visibility corresponds to "external
432     linkage" in the language.
433 "``hidden``" - Hidden style
434     Two declarations of an object with hidden visibility refer to the
435     same object if they are in the same shared object. Usually, hidden
436     visibility indicates that the symbol will not be placed into the
437     dynamic symbol table, so no other module (executable or shared
438     library) can reference it directly.
439 "``protected``" - Protected style
440     On ELF, protected visibility indicates that the symbol will be
441     placed in the dynamic symbol table, but that references within the
442     defining module will bind to the local symbol. That is, the symbol
443     cannot be overridden by another module.
444
445 A symbol with ``internal`` or ``private`` linkage must have ``default``
446 visibility.
447
448 .. _dllstorageclass:
449
450 DLL Storage Classes
451 -------------------
452
453 All Global Variables, Functions and Aliases can have one of the following
454 DLL storage class:
455
456 ``dllimport``
457     "``dllimport``" causes the compiler to reference a function or variable via
458     a global pointer to a pointer that is set up by the DLL exporting the
459     symbol. On Microsoft Windows targets, the pointer name is formed by
460     combining ``__imp_`` and the function or variable name.
461 ``dllexport``
462     "``dllexport``" causes the compiler to provide a global pointer to a pointer
463     in a DLL, so that it can be referenced with the ``dllimport`` attribute. On
464     Microsoft Windows targets, the pointer name is formed by combining
465     ``__imp_`` and the function or variable name. Since this storage class
466     exists for defining a dll interface, the compiler, assembler and linker know
467     it is externally referenced and must refrain from deleting the symbol.
468
469 .. _tls_model:
470
471 Thread Local Storage Models
472 ---------------------------
473
474 A variable may be defined as ``thread_local``, which means that it will
475 not be shared by threads (each thread will have a separated copy of the
476 variable). Not all targets support thread-local variables. Optionally, a
477 TLS model may be specified:
478
479 ``localdynamic``
480     For variables that are only used within the current shared library.
481 ``initialexec``
482     For variables in modules that will not be loaded dynamically.
483 ``localexec``
484     For variables defined in the executable and only used within it.
485
486 If no explicit model is given, the "general dynamic" model is used.
487
488 The models correspond to the ELF TLS models; see `ELF Handling For
489 Thread-Local Storage <http://people.redhat.com/drepper/tls.pdf>`_ for
490 more information on under which circumstances the different models may
491 be used. The target may choose a different TLS model if the specified
492 model is not supported, or if a better choice of model can be made.
493
494 A model can also be specified in an alias, but then it only governs how
495 the alias is accessed. It will not have any effect in the aliasee.
496
497 For platforms without linker support of ELF TLS model, the -femulated-tls
498 flag can be used to generate GCC compatible emulated TLS code.
499
500 .. _namedtypes:
501
502 Structure Types
503 ---------------
504
505 LLVM IR allows you to specify both "identified" and "literal" :ref:`structure
506 types <t_struct>`. Literal types are uniqued structurally, but identified types
507 are never uniqued. An :ref:`opaque structural type <t_opaque>` can also be used
508 to forward declare a type that is not yet available.
509
510 An example of an identified structure specification is:
511
512 .. code-block:: llvm
513
514     %mytype = type { %mytype*, i32 }
515
516 Prior to the LLVM 3.0 release, identified types were structurally uniqued. Only
517 literal types are uniqued in recent versions of LLVM.
518
519 .. _globalvars:
520
521 Global Variables
522 ----------------
523
524 Global variables define regions of memory allocated at compilation time
525 instead of run-time.
526
527 Global variable definitions must be initialized.
528
529 Global variables in other translation units can also be declared, in which
530 case they don't have an initializer.
531
532 Either global variable definitions or declarations may have an explicit section
533 to be placed in and may have an optional explicit alignment specified.
534
535 A variable may be defined as a global ``constant``, which indicates that
536 the contents of the variable will **never** be modified (enabling better
537 optimization, allowing the global data to be placed in the read-only
538 section of an executable, etc). Note that variables that need runtime
539 initialization cannot be marked ``constant`` as there is a store to the
540 variable.
541
542 LLVM explicitly allows *declarations* of global variables to be marked
543 constant, even if the final definition of the global is not. This
544 capability can be used to enable slightly better optimization of the
545 program, but requires the language definition to guarantee that
546 optimizations based on the 'constantness' are valid for the translation
547 units that do not include the definition.
548
549 As SSA values, global variables define pointer values that are in scope
550 (i.e. they dominate) all basic blocks in the program. Global variables
551 always define a pointer to their "content" type because they describe a
552 region of memory, and all memory objects in LLVM are accessed through
553 pointers.
554
555 Global variables can be marked with ``unnamed_addr`` which indicates
556 that the address is not significant, only the content. Constants marked
557 like this can be merged with other constants if they have the same
558 initializer. Note that a constant with significant address *can* be
559 merged with a ``unnamed_addr`` constant, the result being a constant
560 whose address is significant.
561
562 A global variable may be declared to reside in a target-specific
563 numbered address space. For targets that support them, address spaces
564 may affect how optimizations are performed and/or what target
565 instructions are used to access the variable. The default address space
566 is zero. The address space qualifier must precede any other attributes.
567
568 LLVM allows an explicit section to be specified for globals. If the
569 target supports it, it will emit globals to the section specified.
570 Additionally, the global can placed in a comdat if the target has the necessary
571 support.
572
573 By default, global initializers are optimized by assuming that global
574 variables defined within the module are not modified from their
575 initial values before the start of the global initializer. This is
576 true even for variables potentially accessible from outside the
577 module, including those with external linkage or appearing in
578 ``@llvm.used`` or dllexported variables. This assumption may be suppressed
579 by marking the variable with ``externally_initialized``.
580
581 An explicit alignment may be specified for a global, which must be a
582 power of 2. If not present, or if the alignment is set to zero, the
583 alignment of the global is set by the target to whatever it feels
584 convenient. If an explicit alignment is specified, the global is forced
585 to have exactly that alignment. Targets and optimizers are not allowed
586 to over-align the global if the global has an assigned section. In this
587 case, the extra alignment could be observable: for example, code could
588 assume that the globals are densely packed in their section and try to
589 iterate over them as an array, alignment padding would break this
590 iteration. The maximum alignment is ``1 << 29``.
591
592 Globals can also have a :ref:`DLL storage class <dllstorageclass>`.
593
594 Variables and aliases can have a
595 :ref:`Thread Local Storage Model <tls_model>`.
596
597 Syntax::
598
599     [@<GlobalVarName> =] [Linkage] [Visibility] [DLLStorageClass] [ThreadLocal]
600                          [unnamed_addr] [AddrSpace] [ExternallyInitialized]
601                          <global | constant> <Type> [<InitializerConstant>]
602                          [, section "name"] [, comdat [($name)]]
603                          [, align <Alignment>]
604
605 For example, the following defines a global in a numbered address space
606 with an initializer, section, and alignment:
607
608 .. code-block:: llvm
609
610     @G = addrspace(5) constant float 1.0, section "foo", align 4
611
612 The following example just declares a global variable
613
614 .. code-block:: llvm
615
616    @G = external global i32
617
618 The following example defines a thread-local global with the
619 ``initialexec`` TLS model:
620
621 .. code-block:: llvm
622
623     @G = thread_local(initialexec) global i32 0, align 4
624
625 .. _functionstructure:
626
627 Functions
628 ---------
629
630 LLVM function definitions consist of the "``define``" keyword, an
631 optional :ref:`linkage type <linkage>`, an optional :ref:`visibility
632 style <visibility>`, an optional :ref:`DLL storage class <dllstorageclass>`,
633 an optional :ref:`calling convention <callingconv>`,
634 an optional ``unnamed_addr`` attribute, a return type, an optional
635 :ref:`parameter attribute <paramattrs>` for the return type, a function
636 name, a (possibly empty) argument list (each with optional :ref:`parameter
637 attributes <paramattrs>`), optional :ref:`function attributes <fnattrs>`,
638 an optional section, an optional alignment,
639 an optional :ref:`comdat <langref_comdats>`,
640 an optional :ref:`garbage collector name <gc>`, an optional :ref:`prefix <prefixdata>`,
641 an optional :ref:`prologue <prologuedata>`,
642 an optional :ref:`personality <personalityfn>`,
643 an optional list of attached :ref:`metadata <metadata>`,
644 an opening curly brace, a list of basic blocks, and a closing curly brace.
645
646 LLVM function declarations consist of the "``declare``" keyword, an
647 optional :ref:`linkage type <linkage>`, an optional :ref:`visibility
648 style <visibility>`, an optional :ref:`DLL storage class <dllstorageclass>`,
649 an optional :ref:`calling convention <callingconv>`,
650 an optional ``unnamed_addr`` attribute, a return type, an optional
651 :ref:`parameter attribute <paramattrs>` for the return type, a function
652 name, a possibly empty list of arguments, an optional alignment, an optional
653 :ref:`garbage collector name <gc>`, an optional :ref:`prefix <prefixdata>`,
654 and an optional :ref:`prologue <prologuedata>`.
655
656 A function definition contains a list of basic blocks, forming the CFG (Control
657 Flow Graph) for the function. Each basic block may optionally start with a label
658 (giving the basic block a symbol table entry), contains a list of instructions,
659 and ends with a :ref:`terminator <terminators>` instruction (such as a branch or
660 function return). If an explicit label is not provided, a block is assigned an
661 implicit numbered label, using the next value from the same counter as used for
662 unnamed temporaries (:ref:`see above<identifiers>`). For example, if a function
663 entry block does not have an explicit label, it will be assigned label "%0",
664 then the first unnamed temporary in that block will be "%1", etc.
665
666 The first basic block in a function is special in two ways: it is
667 immediately executed on entrance to the function, and it is not allowed
668 to have predecessor basic blocks (i.e. there can not be any branches to
669 the entry block of a function). Because the block can have no
670 predecessors, it also cannot have any :ref:`PHI nodes <i_phi>`.
671
672 LLVM allows an explicit section to be specified for functions. If the
673 target supports it, it will emit functions to the section specified.
674 Additionally, the function can be placed in a COMDAT.
675
676 An explicit alignment may be specified for a function. If not present,
677 or if the alignment is set to zero, the alignment of the function is set
678 by the target to whatever it feels convenient. If an explicit alignment
679 is specified, the function is forced to have at least that much
680 alignment. All alignments must be a power of 2.
681
682 If the ``unnamed_addr`` attribute is given, the address is known to not
683 be significant and two identical functions can be merged.
684
685 Syntax::
686
687     define [linkage] [visibility] [DLLStorageClass]
688            [cconv] [ret attrs]
689            <ResultType> @<FunctionName> ([argument list])
690            [unnamed_addr] [fn Attrs] [section "name"] [comdat [($name)]]
691            [align N] [gc] [prefix Constant] [prologue Constant]
692            [personality Constant] (!name !N)* { ... }
693
694 The argument list is a comma separated sequence of arguments where each
695 argument is of the following form:
696
697 Syntax::
698
699    <type> [parameter Attrs] [name]
700
701
702 .. _langref_aliases:
703
704 Aliases
705 -------
706
707 Aliases, unlike function or variables, don't create any new data. They
708 are just a new symbol and metadata for an existing position.
709
710 Aliases have a name and an aliasee that is either a global value or a
711 constant expression.
712
713 Aliases may have an optional :ref:`linkage type <linkage>`, an optional
714 :ref:`visibility style <visibility>`, an optional :ref:`DLL storage class
715 <dllstorageclass>` and an optional :ref:`tls model <tls_model>`.
716
717 Syntax::
718
719     @<Name> = [Linkage] [Visibility] [DLLStorageClass] [ThreadLocal] [unnamed_addr] alias <AliaseeTy>, <AliaseeTy>* @<Aliasee>
720
721 The linkage must be one of ``private``, ``internal``, ``linkonce``, ``weak``,
722 ``linkonce_odr``, ``weak_odr``, ``external``. Note that some system linkers
723 might not correctly handle dropping a weak symbol that is aliased.
724
725 Aliases that are not ``unnamed_addr`` are guaranteed to have the same address as
726 the aliasee expression. ``unnamed_addr`` ones are only guaranteed to point
727 to the same content.
728
729 Since aliases are only a second name, some restrictions apply, of which
730 some can only be checked when producing an object file:
731
732 * The expression defining the aliasee must be computable at assembly
733   time. Since it is just a name, no relocations can be used.
734
735 * No alias in the expression can be weak as the possibility of the
736   intermediate alias being overridden cannot be represented in an
737   object file.
738
739 * No global value in the expression can be a declaration, since that
740   would require a relocation, which is not possible.
741
742 .. _langref_comdats:
743
744 Comdats
745 -------
746
747 Comdat IR provides access to COFF and ELF object file COMDAT functionality.
748
749 Comdats have a name which represents the COMDAT key. All global objects that
750 specify this key will only end up in the final object file if the linker chooses
751 that key over some other key. Aliases are placed in the same COMDAT that their
752 aliasee computes to, if any.
753
754 Comdats have a selection kind to provide input on how the linker should
755 choose between keys in two different object files.
756
757 Syntax::
758
759     $<Name> = comdat SelectionKind
760
761 The selection kind must be one of the following:
762
763 ``any``
764     The linker may choose any COMDAT key, the choice is arbitrary.
765 ``exactmatch``
766     The linker may choose any COMDAT key but the sections must contain the
767     same data.
768 ``largest``
769     The linker will choose the section containing the largest COMDAT key.
770 ``noduplicates``
771     The linker requires that only section with this COMDAT key exist.
772 ``samesize``
773     The linker may choose any COMDAT key but the sections must contain the
774     same amount of data.
775
776 Note that the Mach-O platform doesn't support COMDATs and ELF only supports
777 ``any`` as a selection kind.
778
779 Here is an example of a COMDAT group where a function will only be selected if
780 the COMDAT key's section is the largest:
781
782 .. code-block:: llvm
783
784    $foo = comdat largest
785    @foo = global i32 2, comdat($foo)
786
787    define void @bar() comdat($foo) {
788      ret void
789    }
790
791 As a syntactic sugar the ``$name`` can be omitted if the name is the same as
792 the global name:
793
794 .. code-block:: llvm
795
796   $foo = comdat any
797   @foo = global i32 2, comdat
798
799
800 In a COFF object file, this will create a COMDAT section with selection kind
801 ``IMAGE_COMDAT_SELECT_LARGEST`` containing the contents of the ``@foo`` symbol
802 and another COMDAT section with selection kind
803 ``IMAGE_COMDAT_SELECT_ASSOCIATIVE`` which is associated with the first COMDAT
804 section and contains the contents of the ``@bar`` symbol.
805
806 There are some restrictions on the properties of the global object.
807 It, or an alias to it, must have the same name as the COMDAT group when
808 targeting COFF.
809 The contents and size of this object may be used during link-time to determine
810 which COMDAT groups get selected depending on the selection kind.
811 Because the name of the object must match the name of the COMDAT group, the
812 linkage of the global object must not be local; local symbols can get renamed
813 if a collision occurs in the symbol table.
814
815 The combined use of COMDATS and section attributes may yield surprising results.
816 For example:
817
818 .. code-block:: llvm
819
820    $foo = comdat any
821    $bar = comdat any
822    @g1 = global i32 42, section "sec", comdat($foo)
823    @g2 = global i32 42, section "sec", comdat($bar)
824
825 From the object file perspective, this requires the creation of two sections
826 with the same name. This is necessary because both globals belong to different
827 COMDAT groups and COMDATs, at the object file level, are represented by
828 sections.
829
830 Note that certain IR constructs like global variables and functions may
831 create COMDATs in the object file in addition to any which are specified using
832 COMDAT IR. This arises when the code generator is configured to emit globals
833 in individual sections (e.g. when `-data-sections` or `-function-sections`
834 is supplied to `llc`).
835
836 .. _namedmetadatastructure:
837
838 Named Metadata
839 --------------
840
841 Named metadata is a collection of metadata. :ref:`Metadata
842 nodes <metadata>` (but not metadata strings) are the only valid
843 operands for a named metadata.
844
845 #. Named metadata are represented as a string of characters with the
846    metadata prefix. The rules for metadata names are the same as for
847    identifiers, but quoted names are not allowed. ``"\xx"`` type escapes
848    are still valid, which allows any character to be part of a name.
849
850 Syntax::
851
852     ; Some unnamed metadata nodes, which are referenced by the named metadata.
853     !0 = !{!"zero"}
854     !1 = !{!"one"}
855     !2 = !{!"two"}
856     ; A named metadata.
857     !name = !{!0, !1, !2}
858
859 .. _paramattrs:
860
861 Parameter Attributes
862 --------------------
863
864 The return type and each parameter of a function type may have a set of
865 *parameter attributes* associated with them. Parameter attributes are
866 used to communicate additional information about the result or
867 parameters of a function. Parameter attributes are considered to be part
868 of the function, not of the function type, so functions with different
869 parameter attributes can have the same function type.
870
871 Parameter attributes are simple keywords that follow the type specified.
872 If multiple parameter attributes are needed, they are space separated.
873 For example:
874
875 .. code-block:: llvm
876
877     declare i32 @printf(i8* noalias nocapture, ...)
878     declare i32 @atoi(i8 zeroext)
879     declare signext i8 @returns_signed_char()
880
881 Note that any attributes for the function result (``nounwind``,
882 ``readonly``) come immediately after the argument list.
883
884 Currently, only the following parameter attributes are defined:
885
886 ``zeroext``
887     This indicates to the code generator that the parameter or return
888     value should be zero-extended to the extent required by the target's
889     ABI (which is usually 32-bits, but is 8-bits for a i1 on x86-64) by
890     the caller (for a parameter) or the callee (for a return value).
891 ``signext``
892     This indicates to the code generator that the parameter or return
893     value should be sign-extended to the extent required by the target's
894     ABI (which is usually 32-bits) by the caller (for a parameter) or
895     the callee (for a return value).
896 ``inreg``
897     This indicates that this parameter or return value should be treated
898     in a special target-dependent fashion while emitting code for
899     a function call or return (usually, by putting it in a register as
900     opposed to memory, though some targets use it to distinguish between
901     two different kinds of registers). Use of this attribute is
902     target-specific.
903 ``byval``
904     This indicates that the pointer parameter should really be passed by
905     value to the function. The attribute implies that a hidden copy of
906     the pointee is made between the caller and the callee, so the callee
907     is unable to modify the value in the caller. This attribute is only
908     valid on LLVM pointer arguments. It is generally used to pass
909     structs and arrays by value, but is also valid on pointers to
910     scalars. The copy is considered to belong to the caller not the
911     callee (for example, ``readonly`` functions should not write to
912     ``byval`` parameters). This is not a valid attribute for return
913     values.
914
915     The byval attribute also supports specifying an alignment with the
916     align attribute. It indicates the alignment of the stack slot to
917     form and the known alignment of the pointer specified to the call
918     site. If the alignment is not specified, then the code generator
919     makes a target-specific assumption.
920
921 .. _attr_inalloca:
922
923 ``inalloca``
924
925     The ``inalloca`` argument attribute allows the caller to take the
926     address of outgoing stack arguments. An ``inalloca`` argument must
927     be a pointer to stack memory produced by an ``alloca`` instruction.
928     The alloca, or argument allocation, must also be tagged with the
929     inalloca keyword. Only the last argument may have the ``inalloca``
930     attribute, and that argument is guaranteed to be passed in memory.
931
932     An argument allocation may be used by a call at most once because
933     the call may deallocate it. The ``inalloca`` attribute cannot be
934     used in conjunction with other attributes that affect argument
935     storage, like ``inreg``, ``nest``, ``sret``, or ``byval``. The
936     ``inalloca`` attribute also disables LLVM's implicit lowering of
937     large aggregate return values, which means that frontend authors
938     must lower them with ``sret`` pointers.
939
940     When the call site is reached, the argument allocation must have
941     been the most recent stack allocation that is still live, or the
942     results are undefined. It is possible to allocate additional stack
943     space after an argument allocation and before its call site, but it
944     must be cleared off with :ref:`llvm.stackrestore
945     <int_stackrestore>`.
946
947     See :doc:`InAlloca` for more information on how to use this
948     attribute.
949
950 ``sret``
951     This indicates that the pointer parameter specifies the address of a
952     structure that is the return value of the function in the source
953     program. This pointer must be guaranteed by the caller to be valid:
954     loads and stores to the structure may be assumed by the callee
955     not to trap and to be properly aligned. This may only be applied to
956     the first parameter. This is not a valid attribute for return
957     values.
958
959 ``align <n>``
960     This indicates that the pointer value may be assumed by the optimizer to
961     have the specified alignment.
962
963     Note that this attribute has additional semantics when combined with the
964     ``byval`` attribute.
965
966 .. _noalias:
967
968 ``noalias``
969     This indicates that objects accessed via pointer values
970     :ref:`based <pointeraliasing>` on the argument or return value are not also
971     accessed, during the execution of the function, via pointer values not
972     *based* on the argument or return value. The attribute on a return value
973     also has additional semantics described below. The caller shares the
974     responsibility with the callee for ensuring that these requirements are met.
975     For further details, please see the discussion of the NoAlias response in
976     :ref:`alias analysis <Must, May, or No>`.
977
978     Note that this definition of ``noalias`` is intentionally similar
979     to the definition of ``restrict`` in C99 for function arguments.
980
981     For function return values, C99's ``restrict`` is not meaningful,
982     while LLVM's ``noalias`` is. Furthermore, the semantics of the ``noalias``
983     attribute on return values are stronger than the semantics of the attribute
984     when used on function arguments. On function return values, the ``noalias``
985     attribute indicates that the function acts like a system memory allocation
986     function, returning a pointer to allocated storage disjoint from the
987     storage for any other object accessible to the caller.
988
989 ``nocapture``
990     This indicates that the callee does not make any copies of the
991     pointer that outlive the callee itself. This is not a valid
992     attribute for return values.
993
994 .. _nest:
995
996 ``nest``
997     This indicates that the pointer parameter can be excised using the
998     :ref:`trampoline intrinsics <int_trampoline>`. This is not a valid
999     attribute for return values and can only be applied to one parameter.
1000
1001 ``returned``
1002     This indicates that the function always returns the argument as its return
1003     value. This is an optimization hint to the code generator when generating
1004     the caller, allowing tail call optimization and omission of register saves
1005     and restores in some cases; it is not checked or enforced when generating
1006     the callee. The parameter and the function return type must be valid
1007     operands for the :ref:`bitcast instruction <i_bitcast>`. This is not a
1008     valid attribute for return values and can only be applied to one parameter.
1009
1010 ``nonnull``
1011     This indicates that the parameter or return pointer is not null. This
1012     attribute may only be applied to pointer typed parameters. This is not
1013     checked or enforced by LLVM, the caller must ensure that the pointer
1014     passed in is non-null, or the callee must ensure that the returned pointer
1015     is non-null.
1016
1017 ``dereferenceable(<n>)``
1018     This indicates that the parameter or return pointer is dereferenceable. This
1019     attribute may only be applied to pointer typed parameters. A pointer that
1020     is dereferenceable can be loaded from speculatively without a risk of
1021     trapping. The number of bytes known to be dereferenceable must be provided
1022     in parentheses. It is legal for the number of bytes to be less than the
1023     size of the pointee type. The ``nonnull`` attribute does not imply
1024     dereferenceability (consider a pointer to one element past the end of an
1025     array), however ``dereferenceable(<n>)`` does imply ``nonnull`` in
1026     ``addrspace(0)`` (which is the default address space).
1027
1028 ``dereferenceable_or_null(<n>)``
1029     This indicates that the parameter or return value isn't both
1030     non-null and non-dereferenceable (up to ``<n>`` bytes) at the same
1031     time. All non-null pointers tagged with
1032     ``dereferenceable_or_null(<n>)`` are ``dereferenceable(<n>)``.
1033     For address space 0 ``dereferenceable_or_null(<n>)`` implies that
1034     a pointer is exactly one of ``dereferenceable(<n>)`` or ``null``,
1035     and in other address spaces ``dereferenceable_or_null(<n>)``
1036     implies that a pointer is at least one of ``dereferenceable(<n>)``
1037     or ``null`` (i.e. it may be both ``null`` and
1038     ``dereferenceable(<n>)``). This attribute may only be applied to
1039     pointer typed parameters.
1040
1041 .. _gc:
1042
1043 Garbage Collector Strategy Names
1044 --------------------------------
1045
1046 Each function may specify a garbage collector strategy name, which is simply a
1047 string:
1048
1049 .. code-block:: llvm
1050
1051     define void @f() gc "name" { ... }
1052
1053 The supported values of *name* includes those :ref:`built in to LLVM
1054 <builtin-gc-strategies>` and any provided by loaded plugins. Specifying a GC
1055 strategy will cause the compiler to alter its output in order to support the
1056 named garbage collection algorithm. Note that LLVM itself does not contain a
1057 garbage collector, this functionality is restricted to generating machine code
1058 which can interoperate with a collector provided externally.
1059
1060 .. _prefixdata:
1061
1062 Prefix Data
1063 -----------
1064
1065 Prefix data is data associated with a function which the code
1066 generator will emit immediately before the function's entrypoint.
1067 The purpose of this feature is to allow frontends to associate
1068 language-specific runtime metadata with specific functions and make it
1069 available through the function pointer while still allowing the
1070 function pointer to be called.
1071
1072 To access the data for a given function, a program may bitcast the
1073 function pointer to a pointer to the constant's type and dereference
1074 index -1. This implies that the IR symbol points just past the end of
1075 the prefix data. For instance, take the example of a function annotated
1076 with a single ``i32``,
1077
1078 .. code-block:: llvm
1079
1080     define void @f() prefix i32 123 { ... }
1081
1082 The prefix data can be referenced as,
1083
1084 .. code-block:: llvm
1085
1086     %0 = bitcast void* () @f to i32*
1087     %a = getelementptr inbounds i32, i32* %0, i32 -1
1088     %b = load i32, i32* %a
1089
1090 Prefix data is laid out as if it were an initializer for a global variable
1091 of the prefix data's type. The function will be placed such that the
1092 beginning of the prefix data is aligned. This means that if the size
1093 of the prefix data is not a multiple of the alignment size, the
1094 function's entrypoint will not be aligned. If alignment of the
1095 function's entrypoint is desired, padding must be added to the prefix
1096 data.
1097
1098 A function may have prefix data but no body. This has similar semantics
1099 to the ``available_externally`` linkage in that the data may be used by the
1100 optimizers but will not be emitted in the object file.
1101
1102 .. _prologuedata:
1103
1104 Prologue Data
1105 -------------
1106
1107 The ``prologue`` attribute allows arbitrary code (encoded as bytes) to
1108 be inserted prior to the function body. This can be used for enabling
1109 function hot-patching and instrumentation.
1110
1111 To maintain the semantics of ordinary function calls, the prologue data must
1112 have a particular format. Specifically, it must begin with a sequence of
1113 bytes which decode to a sequence of machine instructions, valid for the
1114 module's target, which transfer control to the point immediately succeeding
1115 the prologue data, without performing any other visible action. This allows
1116 the inliner and other passes to reason about the semantics of the function
1117 definition without needing to reason about the prologue data. Obviously this
1118 makes the format of the prologue data highly target dependent.
1119
1120 A trivial example of valid prologue data for the x86 architecture is ``i8 144``,
1121 which encodes the ``nop`` instruction:
1122
1123 .. code-block:: llvm
1124
1125     define void @f() prologue i8 144 { ... }
1126
1127 Generally prologue data can be formed by encoding a relative branch instruction
1128 which skips the metadata, as in this example of valid prologue data for the
1129 x86_64 architecture, where the first two bytes encode ``jmp .+10``:
1130
1131 .. code-block:: llvm
1132
1133     %0 = type <{ i8, i8, i8* }>
1134
1135     define void @f() prologue %0 <{ i8 235, i8 8, i8* @md}> { ... }
1136
1137 A function may have prologue data but no body. This has similar semantics
1138 to the ``available_externally`` linkage in that the data may be used by the
1139 optimizers but will not be emitted in the object file.
1140
1141 .. _personalityfn:
1142
1143 Personality Function
1144 --------------------
1145
1146 The ``personality`` attribute permits functions to specify what function
1147 to use for exception handling.
1148
1149 .. _attrgrp:
1150
1151 Attribute Groups
1152 ----------------
1153
1154 Attribute groups are groups of attributes that are referenced by objects within
1155 the IR. They are important for keeping ``.ll`` files readable, because a lot of
1156 functions will use the same set of attributes. In the degenerative case of a
1157 ``.ll`` file that corresponds to a single ``.c`` file, the single attribute
1158 group will capture the important command line flags used to build that file.
1159
1160 An attribute group is a module-level object. To use an attribute group, an
1161 object references the attribute group's ID (e.g. ``#37``). An object may refer
1162 to more than one attribute group. In that situation, the attributes from the
1163 different groups are merged.
1164
1165 Here is an example of attribute groups for a function that should always be
1166 inlined, has a stack alignment of 4, and which shouldn't use SSE instructions:
1167
1168 .. code-block:: llvm
1169
1170    ; Target-independent attributes:
1171    attributes #0 = { alwaysinline alignstack=4 }
1172
1173    ; Target-dependent attributes:
1174    attributes #1 = { "no-sse" }
1175
1176    ; Function @f has attributes: alwaysinline, alignstack=4, and "no-sse".
1177    define void @f() #0 #1 { ... }
1178
1179 .. _fnattrs:
1180
1181 Function Attributes
1182 -------------------
1183
1184 Function attributes are set to communicate additional information about
1185 a function. Function attributes are considered to be part of the
1186 function, not of the function type, so functions with different function
1187 attributes can have the same function type.
1188
1189 Function attributes are simple keywords that follow the type specified.
1190 If multiple attributes are needed, they are space separated. For
1191 example:
1192
1193 .. code-block:: llvm
1194
1195     define void @f() noinline { ... }
1196     define void @f() alwaysinline { ... }
1197     define void @f() alwaysinline optsize { ... }
1198     define void @f() optsize { ... }
1199
1200 ``alignstack(<n>)``
1201     This attribute indicates that, when emitting the prologue and
1202     epilogue, the backend should forcibly align the stack pointer.
1203     Specify the desired alignment, which must be a power of two, in
1204     parentheses.
1205 ``alwaysinline``
1206     This attribute indicates that the inliner should attempt to inline
1207     this function into callers whenever possible, ignoring any active
1208     inlining size threshold for this caller.
1209 ``builtin``
1210     This indicates that the callee function at a call site should be
1211     recognized as a built-in function, even though the function's declaration
1212     uses the ``nobuiltin`` attribute. This is only valid at call sites for
1213     direct calls to functions that are declared with the ``nobuiltin``
1214     attribute.
1215 ``cold``
1216     This attribute indicates that this function is rarely called. When
1217     computing edge weights, basic blocks post-dominated by a cold
1218     function call are also considered to be cold; and, thus, given low
1219     weight.
1220 ``convergent``
1221     This attribute indicates that the callee is dependent on a convergent
1222     thread execution pattern under certain parallel execution models.
1223     Transformations that are execution model agnostic may not make the execution
1224     of a convergent operation control dependent on any additional values.
1225 ``inlinehint``
1226     This attribute indicates that the source code contained a hint that
1227     inlining this function is desirable (such as the "inline" keyword in
1228     C/C++). It is just a hint; it imposes no requirements on the
1229     inliner.
1230 ``jumptable``
1231     This attribute indicates that the function should be added to a
1232     jump-instruction table at code-generation time, and that all address-taken
1233     references to this function should be replaced with a reference to the
1234     appropriate jump-instruction-table function pointer. Note that this creates
1235     a new pointer for the original function, which means that code that depends
1236     on function-pointer identity can break. So, any function annotated with
1237     ``jumptable`` must also be ``unnamed_addr``.
1238 ``minsize``
1239     This attribute suggests that optimization passes and code generator
1240     passes make choices that keep the code size of this function as small
1241     as possible and perform optimizations that may sacrifice runtime
1242     performance in order to minimize the size of the generated code.
1243 ``naked``
1244     This attribute disables prologue / epilogue emission for the
1245     function. This can have very system-specific consequences.
1246 ``nobuiltin``
1247     This indicates that the callee function at a call site is not recognized as
1248     a built-in function. LLVM will retain the original call and not replace it
1249     with equivalent code based on the semantics of the built-in function, unless
1250     the call site uses the ``builtin`` attribute. This is valid at call sites
1251     and on function declarations and definitions.
1252 ``noduplicate``
1253     This attribute indicates that calls to the function cannot be
1254     duplicated. A call to a ``noduplicate`` function may be moved
1255     within its parent function, but may not be duplicated within
1256     its parent function.
1257
1258     A function containing a ``noduplicate`` call may still
1259     be an inlining candidate, provided that the call is not
1260     duplicated by inlining. That implies that the function has
1261     internal linkage and only has one call site, so the original
1262     call is dead after inlining.
1263 ``noimplicitfloat``
1264     This attributes disables implicit floating point instructions.
1265 ``noinline``
1266     This attribute indicates that the inliner should never inline this
1267     function in any situation. This attribute may not be used together
1268     with the ``alwaysinline`` attribute.
1269 ``nonlazybind``
1270     This attribute suppresses lazy symbol binding for the function. This
1271     may make calls to the function faster, at the cost of extra program
1272     startup time if the function is not called during program startup.
1273 ``noredzone``
1274     This attribute indicates that the code generator should not use a
1275     red zone, even if the target-specific ABI normally permits it.
1276 ``noreturn``
1277     This function attribute indicates that the function never returns
1278     normally. This produces undefined behavior at runtime if the
1279     function ever does dynamically return.
1280 ``norecurse``
1281     This function attribute indicates that the function does not call itself
1282     either directly or indirectly down any possible call path. This produces
1283     undefined behavior at runtime if the function ever does recurse.
1284 ``nounwind``
1285     This function attribute indicates that the function never raises an
1286     exception. If the function does raise an exception, its runtime
1287     behavior is undefined. However, functions marked nounwind may still
1288     trap or generate asynchronous exceptions. Exception handling schemes
1289     that are recognized by LLVM to handle asynchronous exceptions, such
1290     as SEH, will still provide their implementation defined semantics.
1291 ``optnone``
1292     This function attribute indicates that most optimization passes will skip
1293     this function, with the exception of interprocedural optimization passes.
1294     Code generation defaults to the "fast" instruction selector.
1295     This attribute cannot be used together with the ``alwaysinline``
1296     attribute; this attribute is also incompatible
1297     with the ``minsize`` attribute and the ``optsize`` attribute.
1298
1299     This attribute requires the ``noinline`` attribute to be specified on
1300     the function as well, so the function is never inlined into any caller.
1301     Only functions with the ``alwaysinline`` attribute are valid
1302     candidates for inlining into the body of this function.
1303 ``optsize``
1304     This attribute suggests that optimization passes and code generator
1305     passes make choices that keep the code size of this function low,
1306     and otherwise do optimizations specifically to reduce code size as
1307     long as they do not significantly impact runtime performance.
1308 ``readnone``
1309     On a function, this attribute indicates that the function computes its
1310     result (or decides to unwind an exception) based strictly on its arguments,
1311     without dereferencing any pointer arguments or otherwise accessing
1312     any mutable state (e.g. memory, control registers, etc) visible to
1313     caller functions. It does not write through any pointer arguments
1314     (including ``byval`` arguments) and never changes any state visible
1315     to callers. This means that it cannot unwind exceptions by calling
1316     the ``C++`` exception throwing methods.
1317
1318     On an argument, this attribute indicates that the function does not
1319     dereference that pointer argument, even though it may read or write the
1320     memory that the pointer points to if accessed through other pointers.
1321 ``readonly``
1322     On a function, this attribute indicates that the function does not write
1323     through any pointer arguments (including ``byval`` arguments) or otherwise
1324     modify any state (e.g. memory, control registers, etc) visible to
1325     caller functions. It may dereference pointer arguments and read
1326     state that may be set in the caller. A readonly function always
1327     returns the same value (or unwinds an exception identically) when
1328     called with the same set of arguments and global state. It cannot
1329     unwind an exception by calling the ``C++`` exception throwing
1330     methods.
1331
1332     On an argument, this attribute indicates that the function does not write
1333     through this pointer argument, even though it may write to the memory that
1334     the pointer points to.
1335 ``argmemonly``
1336     This attribute indicates that the only memory accesses inside function are
1337     loads and stores from objects pointed to by its pointer-typed arguments,
1338     with arbitrary offsets. Or in other words, all memory operations in the
1339     function can refer to memory only using pointers based on its function
1340     arguments.
1341     Note that ``argmemonly`` can be used together with ``readonly`` attribute
1342     in order to specify that function reads only from its arguments.
1343 ``returns_twice``
1344     This attribute indicates that this function can return twice. The C
1345     ``setjmp`` is an example of such a function. The compiler disables
1346     some optimizations (like tail calls) in the caller of these
1347     functions.
1348 ``safestack``
1349     This attribute indicates that
1350     `SafeStack <http://clang.llvm.org/docs/SafeStack.html>`_
1351     protection is enabled for this function.
1352
1353     If a function that has a ``safestack`` attribute is inlined into a
1354     function that doesn't have a ``safestack`` attribute or which has an
1355     ``ssp``, ``sspstrong`` or ``sspreq`` attribute, then the resulting
1356     function will have a ``safestack`` attribute.
1357 ``sanitize_address``
1358     This attribute indicates that AddressSanitizer checks
1359     (dynamic address safety analysis) are enabled for this function.
1360 ``sanitize_memory``
1361     This attribute indicates that MemorySanitizer checks (dynamic detection
1362     of accesses to uninitialized memory) are enabled for this function.
1363 ``sanitize_thread``
1364     This attribute indicates that ThreadSanitizer checks
1365     (dynamic thread safety analysis) are enabled for this function.
1366 ``ssp``
1367     This attribute indicates that the function should emit a stack
1368     smashing protector. It is in the form of a "canary" --- a random value
1369     placed on the stack before the local variables that's checked upon
1370     return from the function to see if it has been overwritten. A
1371     heuristic is used to determine if a function needs stack protectors
1372     or not. The heuristic used will enable protectors for functions with:
1373
1374     - Character arrays larger than ``ssp-buffer-size`` (default 8).
1375     - Aggregates containing character arrays larger than ``ssp-buffer-size``.
1376     - Calls to alloca() with variable sizes or constant sizes greater than
1377       ``ssp-buffer-size``.
1378
1379     Variables that are identified as requiring a protector will be arranged
1380     on the stack such that they are adjacent to the stack protector guard.
1381
1382     If a function that has an ``ssp`` attribute is inlined into a
1383     function that doesn't have an ``ssp`` attribute, then the resulting
1384     function will have an ``ssp`` attribute.
1385 ``sspreq``
1386     This attribute indicates that the function should *always* emit a
1387     stack smashing protector. This overrides the ``ssp`` function
1388     attribute.
1389
1390     Variables that are identified as requiring a protector will be arranged
1391     on the stack such that they are adjacent to the stack protector guard.
1392     The specific layout rules are:
1393
1394     #. Large arrays and structures containing large arrays
1395        (``>= ssp-buffer-size``) are closest to the stack protector.
1396     #. Small arrays and structures containing small arrays
1397        (``< ssp-buffer-size``) are 2nd closest to the protector.
1398     #. Variables that have had their address taken are 3rd closest to the
1399        protector.
1400
1401     If a function that has an ``sspreq`` attribute is inlined into a
1402     function that doesn't have an ``sspreq`` attribute or which has an
1403     ``ssp`` or ``sspstrong`` attribute, then the resulting function will have
1404     an ``sspreq`` attribute.
1405 ``sspstrong``
1406     This attribute indicates that the function should emit a stack smashing
1407     protector. This attribute causes a strong heuristic to be used when
1408     determining if a function needs stack protectors. The strong heuristic
1409     will enable protectors for functions with:
1410
1411     - Arrays of any size and type
1412     - Aggregates containing an array of any size and type.
1413     - Calls to alloca().
1414     - Local variables that have had their address taken.
1415
1416     Variables that are identified as requiring a protector will be arranged
1417     on the stack such that they are adjacent to the stack protector guard.
1418     The specific layout rules are:
1419
1420     #. Large arrays and structures containing large arrays
1421        (``>= ssp-buffer-size``) are closest to the stack protector.
1422     #. Small arrays and structures containing small arrays
1423        (``< ssp-buffer-size``) are 2nd closest to the protector.
1424     #. Variables that have had their address taken are 3rd closest to the
1425        protector.
1426
1427     This overrides the ``ssp`` function attribute.
1428
1429     If a function that has an ``sspstrong`` attribute is inlined into a
1430     function that doesn't have an ``sspstrong`` attribute, then the
1431     resulting function will have an ``sspstrong`` attribute.
1432 ``"thunk"``
1433     This attribute indicates that the function will delegate to some other
1434     function with a tail call. The prototype of a thunk should not be used for
1435     optimization purposes. The caller is expected to cast the thunk prototype to
1436     match the thunk target prototype.
1437 ``uwtable``
1438     This attribute indicates that the ABI being targeted requires that
1439     an unwind table entry be produced for this function even if we can
1440     show that no exceptions passes by it. This is normally the case for
1441     the ELF x86-64 abi, but it can be disabled for some compilation
1442     units.
1443
1444
1445 .. _opbundles:
1446
1447 Operand Bundles
1448 ---------------
1449
1450 Note: operand bundles are a work in progress, and they should be
1451 considered experimental at this time.
1452
1453 Operand bundles are tagged sets of SSA values that can be associated
1454 with certain LLVM instructions (currently only ``call`` s and
1455 ``invoke`` s).  In a way they are like metadata, but dropping them is
1456 incorrect and will change program semantics.
1457
1458 Syntax::
1459
1460     operand bundle set ::= '[' operand bundle (, operand bundle )* ']'
1461     operand bundle ::= tag '(' [ bundle operand ] (, bundle operand )* ')'
1462     bundle operand ::= SSA value
1463     tag ::= string constant
1464
1465 Operand bundles are **not** part of a function's signature, and a
1466 given function may be called from multiple places with different kinds
1467 of operand bundles.  This reflects the fact that the operand bundles
1468 are conceptually a part of the ``call`` (or ``invoke``), not the
1469 callee being dispatched to.
1470
1471 Operand bundles are a generic mechanism intended to support
1472 runtime-introspection-like functionality for managed languages.  While
1473 the exact semantics of an operand bundle depend on the bundle tag,
1474 there are certain limitations to how much the presence of an operand
1475 bundle can influence the semantics of a program.  These restrictions
1476 are described as the semantics of an "unknown" operand bundle.  As
1477 long as the behavior of an operand bundle is describable within these
1478 restrictions, LLVM does not need to have special knowledge of the
1479 operand bundle to not miscompile programs containing it.
1480
1481 - The bundle operands for an unknown operand bundle escape in unknown
1482   ways before control is transferred to the callee or invokee.
1483 - Calls and invokes with operand bundles have unknown read / write
1484   effect on the heap on entry and exit (even if the call target is
1485   ``readnone`` or ``readonly``), unless they're overriden with
1486   callsite specific attributes.
1487 - An operand bundle at a call site cannot change the implementation
1488   of the called function.  Inter-procedural optimizations work as
1489   usual as long as they take into account the first two properties.
1490
1491 More specific types of operand bundles are described below.
1492
1493 Deoptimization Operand Bundles
1494 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
1495
1496 Deoptimization operand bundles are characterized by the ``"deopt"``
1497 operand bundle tag.  These operand bundles represent an alternate
1498 "safe" continuation for the call site they're attached to, and can be
1499 used by a suitable runtime to deoptimize the compiled frame at the
1500 specified call site.  There can be at most one ``"deopt"`` operand
1501 bundle attached to a call site.  Exact details of deoptimization is
1502 out of scope for the language reference, but it usually involves
1503 rewriting a compiled frame into a set of interpreted frames.
1504
1505 From the compiler's perspective, deoptimization operand bundles make
1506 the call sites they're attached to at least ``readonly``.  They read
1507 through all of their pointer typed operands (even if they're not
1508 otherwise escaped) and the entire visible heap.  Deoptimization
1509 operand bundles do not capture their operands except during
1510 deoptimization, in which case control will not be returned to the
1511 compiled frame.
1512
1513 The inliner knows how to inline through calls that have deoptimization
1514 operand bundles.  Just like inlining through a normal call site
1515 involves composing the normal and exceptional continuations, inlining
1516 through a call site with a deoptimization operand bundle needs to
1517 appropriately compose the "safe" deoptimization continuation.  The
1518 inliner does this by prepending the parent's deoptimization
1519 continuation to every deoptimization continuation in the inlined body.
1520 E.g. inlining ``@f`` into ``@g`` in the following example
1521
1522 .. code-block:: llvm
1523
1524     define void @f() {
1525       call void @x()  ;; no deopt state
1526       call void @y() [ "deopt"(i32 10) ]
1527       call void @y() [ "deopt"(i32 10), "unknown"(i8* null) ]
1528       ret void
1529     }
1530
1531     define void @g() {
1532       call void @f() [ "deopt"(i32 20) ]
1533       ret void
1534     }
1535
1536 will result in
1537
1538 .. code-block:: llvm
1539
1540     define void @g() {
1541       call void @x()  ;; still no deopt state
1542       call void @y() [ "deopt"(i32 20, i32 10) ]
1543       call void @y() [ "deopt"(i32 20, i32 10), "unknown"(i8* null) ]
1544       ret void
1545     }
1546
1547 It is the frontend's responsibility to structure or encode the
1548 deoptimization state in a way that syntactically prepending the
1549 caller's deoptimization state to the callee's deoptimization state is
1550 semantically equivalent to composing the caller's deoptimization
1551 continuation after the callee's deoptimization continuation.
1552
1553 .. _moduleasm:
1554
1555 Module-Level Inline Assembly
1556 ----------------------------
1557
1558 Modules may contain "module-level inline asm" blocks, which corresponds
1559 to the GCC "file scope inline asm" blocks. These blocks are internally
1560 concatenated by LLVM and treated as a single unit, but may be separated
1561 in the ``.ll`` file if desired. The syntax is very simple:
1562
1563 .. code-block:: llvm
1564
1565     module asm "inline asm code goes here"
1566     module asm "more can go here"
1567
1568 The strings can contain any character by escaping non-printable
1569 characters. The escape sequence used is simply "\\xx" where "xx" is the
1570 two digit hex code for the number.
1571
1572 Note that the assembly string *must* be parseable by LLVM's integrated assembler
1573 (unless it is disabled), even when emitting a ``.s`` file.
1574
1575 .. _langref_datalayout:
1576
1577 Data Layout
1578 -----------
1579
1580 A module may specify a target specific data layout string that specifies
1581 how data is to be laid out in memory. The syntax for the data layout is
1582 simply:
1583
1584 .. code-block:: llvm
1585
1586     target datalayout = "layout specification"
1587
1588 The *layout specification* consists of a list of specifications
1589 separated by the minus sign character ('-'). Each specification starts
1590 with a letter and may include other information after the letter to
1591 define some aspect of the data layout. The specifications accepted are
1592 as follows:
1593
1594 ``E``
1595     Specifies that the target lays out data in big-endian form. That is,
1596     the bits with the most significance have the lowest address
1597     location.
1598 ``e``
1599     Specifies that the target lays out data in little-endian form. That
1600     is, the bits with the least significance have the lowest address
1601     location.
1602 ``S<size>``
1603     Specifies the natural alignment of the stack in bits. Alignment
1604     promotion of stack variables is limited to the natural stack
1605     alignment to avoid dynamic stack realignment. The stack alignment
1606     must be a multiple of 8-bits. If omitted, the natural stack
1607     alignment defaults to "unspecified", which does not prevent any
1608     alignment promotions.
1609 ``p[n]:<size>:<abi>:<pref>``
1610     This specifies the *size* of a pointer and its ``<abi>`` and
1611     ``<pref>``\erred alignments for address space ``n``. All sizes are in
1612     bits. The address space, ``n``, is optional, and if not specified,
1613     denotes the default address space 0. The value of ``n`` must be
1614     in the range [1,2^23).
1615 ``i<size>:<abi>:<pref>``
1616     This specifies the alignment for an integer type of a given bit
1617     ``<size>``. The value of ``<size>`` must be in the range [1,2^23).
1618 ``v<size>:<abi>:<pref>``
1619     This specifies the alignment for a vector type of a given bit
1620     ``<size>``.
1621 ``f<size>:<abi>:<pref>``
1622     This specifies the alignment for a floating point type of a given bit
1623     ``<size>``. Only values of ``<size>`` that are supported by the target
1624     will work. 32 (float) and 64 (double) are supported on all targets; 80
1625     or 128 (different flavors of long double) are also supported on some
1626     targets.
1627 ``a:<abi>:<pref>``
1628     This specifies the alignment for an object of aggregate type.
1629 ``m:<mangling>``
1630     If present, specifies that llvm names are mangled in the output. The
1631     options are
1632
1633     * ``e``: ELF mangling: Private symbols get a ``.L`` prefix.
1634     * ``m``: Mips mangling: Private symbols get a ``$`` prefix.
1635     * ``o``: Mach-O mangling: Private symbols get ``L`` prefix. Other
1636       symbols get a ``_`` prefix.
1637     * ``w``: Windows COFF prefix:  Similar to Mach-O, but stdcall and fastcall
1638       functions also get a suffix based on the frame size.
1639     * ``x``: Windows x86 COFF prefix:  Similar to Windows COFF, but use a ``_``
1640       prefix for ``__cdecl`` functions.
1641 ``n<size1>:<size2>:<size3>...``
1642     This specifies a set of native integer widths for the target CPU in
1643     bits. For example, it might contain ``n32`` for 32-bit PowerPC,
1644     ``n32:64`` for PowerPC 64, or ``n8:16:32:64`` for X86-64. Elements of
1645     this set are considered to support most general arithmetic operations
1646     efficiently.
1647
1648 On every specification that takes a ``<abi>:<pref>``, specifying the
1649 ``<pref>`` alignment is optional. If omitted, the preceding ``:``
1650 should be omitted too and ``<pref>`` will be equal to ``<abi>``.
1651
1652 When constructing the data layout for a given target, LLVM starts with a
1653 default set of specifications which are then (possibly) overridden by
1654 the specifications in the ``datalayout`` keyword. The default
1655 specifications are given in this list:
1656
1657 -  ``E`` - big endian
1658 -  ``p:64:64:64`` - 64-bit pointers with 64-bit alignment.
1659 -  ``p[n]:64:64:64`` - Other address spaces are assumed to be the
1660    same as the default address space.
1661 -  ``S0`` - natural stack alignment is unspecified
1662 -  ``i1:8:8`` - i1 is 8-bit (byte) aligned
1663 -  ``i8:8:8`` - i8 is 8-bit (byte) aligned
1664 -  ``i16:16:16`` - i16 is 16-bit aligned
1665 -  ``i32:32:32`` - i32 is 32-bit aligned
1666 -  ``i64:32:64`` - i64 has ABI alignment of 32-bits but preferred
1667    alignment of 64-bits
1668 -  ``f16:16:16`` - half is 16-bit aligned
1669 -  ``f32:32:32`` - float is 32-bit aligned
1670 -  ``f64:64:64`` - double is 64-bit aligned
1671 -  ``f128:128:128`` - quad is 128-bit aligned
1672 -  ``v64:64:64`` - 64-bit vector is 64-bit aligned
1673 -  ``v128:128:128`` - 128-bit vector is 128-bit aligned
1674 -  ``a:0:64`` - aggregates are 64-bit aligned
1675
1676 When LLVM is determining the alignment for a given type, it uses the
1677 following rules:
1678
1679 #. If the type sought is an exact match for one of the specifications,
1680    that specification is used.
1681 #. If no match is found, and the type sought is an integer type, then
1682    the smallest integer type that is larger than the bitwidth of the
1683    sought type is used. If none of the specifications are larger than
1684    the bitwidth then the largest integer type is used. For example,
1685    given the default specifications above, the i7 type will use the
1686    alignment of i8 (next largest) while both i65 and i256 will use the
1687    alignment of i64 (largest specified).
1688 #. If no match is found, and the type sought is a vector type, then the
1689    largest vector type that is smaller than the sought vector type will
1690    be used as a fall back. This happens because <128 x double> can be
1691    implemented in terms of 64 <2 x double>, for example.
1692
1693 The function of the data layout string may not be what you expect.
1694 Notably, this is not a specification from the frontend of what alignment
1695 the code generator should use.
1696
1697 Instead, if specified, the target data layout is required to match what
1698 the ultimate *code generator* expects. This string is used by the
1699 mid-level optimizers to improve code, and this only works if it matches
1700 what the ultimate code generator uses. There is no way to generate IR
1701 that does not embed this target-specific detail into the IR. If you
1702 don't specify the string, the default specifications will be used to
1703 generate a Data Layout and the optimization phases will operate
1704 accordingly and introduce target specificity into the IR with respect to
1705 these default specifications.
1706
1707 .. _langref_triple:
1708
1709 Target Triple
1710 -------------
1711
1712 A module may specify a target triple string that describes the target
1713 host. The syntax for the target triple is simply:
1714
1715 .. code-block:: llvm
1716
1717     target triple = "x86_64-apple-macosx10.7.0"
1718
1719 The *target triple* string consists of a series of identifiers delimited
1720 by the minus sign character ('-'). The canonical forms are:
1721
1722 ::
1723
1724     ARCHITECTURE-VENDOR-OPERATING_SYSTEM
1725     ARCHITECTURE-VENDOR-OPERATING_SYSTEM-ENVIRONMENT
1726
1727 This information is passed along to the backend so that it generates
1728 code for the proper architecture. It's possible to override this on the
1729 command line with the ``-mtriple`` command line option.
1730
1731 .. _pointeraliasing:
1732
1733 Pointer Aliasing Rules
1734 ----------------------
1735
1736 Any memory access must be done through a pointer value associated with
1737 an address range of the memory access, otherwise the behavior is
1738 undefined. Pointer values are associated with address ranges according
1739 to the following rules:
1740
1741 -  A pointer value is associated with the addresses associated with any
1742    value it is *based* on.
1743 -  An address of a global variable is associated with the address range
1744    of the variable's storage.
1745 -  The result value of an allocation instruction is associated with the
1746    address range of the allocated storage.
1747 -  A null pointer in the default address-space is associated with no
1748    address.
1749 -  An integer constant other than zero or a pointer value returned from
1750    a function not defined within LLVM may be associated with address
1751    ranges allocated through mechanisms other than those provided by
1752    LLVM. Such ranges shall not overlap with any ranges of addresses
1753    allocated by mechanisms provided by LLVM.
1754
1755 A pointer value is *based* on another pointer value according to the
1756 following rules:
1757
1758 -  A pointer value formed from a ``getelementptr`` operation is *based*
1759    on the first value operand of the ``getelementptr``.
1760 -  The result value of a ``bitcast`` is *based* on the operand of the
1761    ``bitcast``.
1762 -  A pointer value formed by an ``inttoptr`` is *based* on all pointer
1763    values that contribute (directly or indirectly) to the computation of
1764    the pointer's value.
1765 -  The "*based* on" relationship is transitive.
1766
1767 Note that this definition of *"based"* is intentionally similar to the
1768 definition of *"based"* in C99, though it is slightly weaker.
1769
1770 LLVM IR does not associate types with memory. The result type of a
1771 ``load`` merely indicates the size and alignment of the memory from
1772 which to load, as well as the interpretation of the value. The first
1773 operand type of a ``store`` similarly only indicates the size and
1774 alignment of the store.
1775
1776 Consequently, type-based alias analysis, aka TBAA, aka
1777 ``-fstrict-aliasing``, is not applicable to general unadorned LLVM IR.
1778 :ref:`Metadata <metadata>` may be used to encode additional information
1779 which specialized optimization passes may use to implement type-based
1780 alias analysis.
1781
1782 .. _volatile:
1783
1784 Volatile Memory Accesses
1785 ------------------------
1786
1787 Certain memory accesses, such as :ref:`load <i_load>`'s,
1788 :ref:`store <i_store>`'s, and :ref:`llvm.memcpy <int_memcpy>`'s may be
1789 marked ``volatile``. The optimizers must not change the number of
1790 volatile operations or change their order of execution relative to other
1791 volatile operations. The optimizers *may* change the order of volatile
1792 operations relative to non-volatile operations. This is not Java's
1793 "volatile" and has no cross-thread synchronization behavior.
1794
1795 IR-level volatile loads and stores cannot safely be optimized into
1796 llvm.memcpy or llvm.memmove intrinsics even when those intrinsics are
1797 flagged volatile. Likewise, the backend should never split or merge
1798 target-legal volatile load/store instructions.
1799
1800 .. admonition:: Rationale
1801
1802  Platforms may rely on volatile loads and stores of natively supported
1803  data width to be executed as single instruction. For example, in C
1804  this holds for an l-value of volatile primitive type with native
1805  hardware support, but not necessarily for aggregate types. The
1806  frontend upholds these expectations, which are intentionally
1807  unspecified in the IR. The rules above ensure that IR transformations
1808  do not violate the frontend's contract with the language.
1809
1810 .. _memmodel:
1811
1812 Memory Model for Concurrent Operations
1813 --------------------------------------
1814
1815 The LLVM IR does not define any way to start parallel threads of
1816 execution or to register signal handlers. Nonetheless, there are
1817 platform-specific ways to create them, and we define LLVM IR's behavior
1818 in their presence. This model is inspired by the C++0x memory model.
1819
1820 For a more informal introduction to this model, see the :doc:`Atomics`.
1821
1822 We define a *happens-before* partial order as the least partial order
1823 that
1824
1825 -  Is a superset of single-thread program order, and
1826 -  When a *synchronizes-with* ``b``, includes an edge from ``a`` to
1827    ``b``. *Synchronizes-with* pairs are introduced by platform-specific
1828    techniques, like pthread locks, thread creation, thread joining,
1829    etc., and by atomic instructions. (See also :ref:`Atomic Memory Ordering
1830    Constraints <ordering>`).
1831
1832 Note that program order does not introduce *happens-before* edges
1833 between a thread and signals executing inside that thread.
1834
1835 Every (defined) read operation (load instructions, memcpy, atomic
1836 loads/read-modify-writes, etc.) R reads a series of bytes written by
1837 (defined) write operations (store instructions, atomic
1838 stores/read-modify-writes, memcpy, etc.). For the purposes of this
1839 section, initialized globals are considered to have a write of the
1840 initializer which is atomic and happens before any other read or write
1841 of the memory in question. For each byte of a read R, R\ :sub:`byte`
1842 may see any write to the same byte, except:
1843
1844 -  If write\ :sub:`1`  happens before write\ :sub:`2`, and
1845    write\ :sub:`2` happens before R\ :sub:`byte`, then
1846    R\ :sub:`byte` does not see write\ :sub:`1`.
1847 -  If R\ :sub:`byte` happens before write\ :sub:`3`, then
1848    R\ :sub:`byte` does not see write\ :sub:`3`.
1849
1850 Given that definition, R\ :sub:`byte` is defined as follows:
1851
1852 -  If R is volatile, the result is target-dependent. (Volatile is
1853    supposed to give guarantees which can support ``sig_atomic_t`` in
1854    C/C++, and may be used for accesses to addresses that do not behave
1855    like normal memory. It does not generally provide cross-thread
1856    synchronization.)
1857 -  Otherwise, if there is no write to the same byte that happens before
1858    R\ :sub:`byte`, R\ :sub:`byte` returns ``undef`` for that byte.
1859 -  Otherwise, if R\ :sub:`byte` may see exactly one write,
1860    R\ :sub:`byte` returns the value written by that write.
1861 -  Otherwise, if R is atomic, and all the writes R\ :sub:`byte` may
1862    see are atomic, it chooses one of the values written. See the :ref:`Atomic
1863    Memory Ordering Constraints <ordering>` section for additional
1864    constraints on how the choice is made.
1865 -  Otherwise R\ :sub:`byte` returns ``undef``.
1866
1867 R returns the value composed of the series of bytes it read. This
1868 implies that some bytes within the value may be ``undef`` **without**
1869 the entire value being ``undef``. Note that this only defines the
1870 semantics of the operation; it doesn't mean that targets will emit more
1871 than one instruction to read the series of bytes.
1872
1873 Note that in cases where none of the atomic intrinsics are used, this
1874 model places only one restriction on IR transformations on top of what
1875 is required for single-threaded execution: introducing a store to a byte
1876 which might not otherwise be stored is not allowed in general.
1877 (Specifically, in the case where another thread might write to and read
1878 from an address, introducing a store can change a load that may see
1879 exactly one write into a load that may see multiple writes.)
1880
1881 .. _ordering:
1882
1883 Atomic Memory Ordering Constraints
1884 ----------------------------------
1885
1886 Atomic instructions (:ref:`cmpxchg <i_cmpxchg>`,
1887 :ref:`atomicrmw <i_atomicrmw>`, :ref:`fence <i_fence>`,
1888 :ref:`atomic load <i_load>`, and :ref:`atomic store <i_store>`) take
1889 ordering parameters that determine which other atomic instructions on
1890 the same address they *synchronize with*. These semantics are borrowed
1891 from Java and C++0x, but are somewhat more colloquial. If these
1892 descriptions aren't precise enough, check those specs (see spec
1893 references in the :doc:`atomics guide <Atomics>`).
1894 :ref:`fence <i_fence>` instructions treat these orderings somewhat
1895 differently since they don't take an address. See that instruction's
1896 documentation for details.
1897
1898 For a simpler introduction to the ordering constraints, see the
1899 :doc:`Atomics`.
1900
1901 ``unordered``
1902     The set of values that can be read is governed by the happens-before
1903     partial order. A value cannot be read unless some operation wrote
1904     it. This is intended to provide a guarantee strong enough to model
1905     Java's non-volatile shared variables. This ordering cannot be
1906     specified for read-modify-write operations; it is not strong enough
1907     to make them atomic in any interesting way.
1908 ``monotonic``
1909     In addition to the guarantees of ``unordered``, there is a single
1910     total order for modifications by ``monotonic`` operations on each
1911     address. All modification orders must be compatible with the
1912     happens-before order. There is no guarantee that the modification
1913     orders can be combined to a global total order for the whole program
1914     (and this often will not be possible). The read in an atomic
1915     read-modify-write operation (:ref:`cmpxchg <i_cmpxchg>` and
1916     :ref:`atomicrmw <i_atomicrmw>`) reads the value in the modification
1917     order immediately before the value it writes. If one atomic read
1918     happens before another atomic read of the same address, the later
1919     read must see the same value or a later value in the address's
1920     modification order. This disallows reordering of ``monotonic`` (or
1921     stronger) operations on the same address. If an address is written
1922     ``monotonic``-ally by one thread, and other threads ``monotonic``-ally
1923     read that address repeatedly, the other threads must eventually see
1924     the write. This corresponds to the C++0x/C1x
1925     ``memory_order_relaxed``.
1926 ``acquire``
1927     In addition to the guarantees of ``monotonic``, a
1928     *synchronizes-with* edge may be formed with a ``release`` operation.
1929     This is intended to model C++'s ``memory_order_acquire``.
1930 ``release``
1931     In addition to the guarantees of ``monotonic``, if this operation
1932     writes a value which is subsequently read by an ``acquire``
1933     operation, it *synchronizes-with* that operation. (This isn't a
1934     complete description; see the C++0x definition of a release
1935     sequence.) This corresponds to the C++0x/C1x
1936     ``memory_order_release``.
1937 ``acq_rel`` (acquire+release)
1938     Acts as both an ``acquire`` and ``release`` operation on its
1939     address. This corresponds to the C++0x/C1x ``memory_order_acq_rel``.
1940 ``seq_cst`` (sequentially consistent)
1941     In addition to the guarantees of ``acq_rel`` (``acquire`` for an
1942     operation that only reads, ``release`` for an operation that only
1943     writes), there is a global total order on all
1944     sequentially-consistent operations on all addresses, which is
1945     consistent with the *happens-before* partial order and with the
1946     modification orders of all the affected addresses. Each
1947     sequentially-consistent read sees the last preceding write to the
1948     same address in this global order. This corresponds to the C++0x/C1x
1949     ``memory_order_seq_cst`` and Java volatile.
1950
1951 .. _singlethread:
1952
1953 If an atomic operation is marked ``singlethread``, it only *synchronizes
1954 with* or participates in modification and seq\_cst total orderings with
1955 other operations running in the same thread (for example, in signal
1956 handlers).
1957
1958 .. _fastmath:
1959
1960 Fast-Math Flags
1961 ---------------
1962
1963 LLVM IR floating-point binary ops (:ref:`fadd <i_fadd>`,
1964 :ref:`fsub <i_fsub>`, :ref:`fmul <i_fmul>`, :ref:`fdiv <i_fdiv>`,
1965 :ref:`frem <i_frem>`, :ref:`fcmp <i_fcmp>`) have the following flags that can
1966 be set to enable otherwise unsafe floating point operations
1967
1968 ``nnan``
1969    No NaNs - Allow optimizations to assume the arguments and result are not
1970    NaN. Such optimizations are required to retain defined behavior over
1971    NaNs, but the value of the result is undefined.
1972
1973 ``ninf``
1974    No Infs - Allow optimizations to assume the arguments and result are not
1975    +/-Inf. Such optimizations are required to retain defined behavior over
1976    +/-Inf, but the value of the result is undefined.
1977
1978 ``nsz``
1979    No Signed Zeros - Allow optimizations to treat the sign of a zero
1980    argument or result as insignificant.
1981
1982 ``arcp``
1983    Allow Reciprocal - Allow optimizations to use the reciprocal of an
1984    argument rather than perform division.
1985
1986 ``fast``
1987    Fast - Allow algebraically equivalent transformations that may
1988    dramatically change results in floating point (e.g. reassociate). This
1989    flag implies all the others.
1990
1991 .. _uselistorder:
1992
1993 Use-list Order Directives
1994 -------------------------
1995
1996 Use-list directives encode the in-memory order of each use-list, allowing the
1997 order to be recreated. ``<order-indexes>`` is a comma-separated list of
1998 indexes that are assigned to the referenced value's uses. The referenced
1999 value's use-list is immediately sorted by these indexes.
2000
2001 Use-list directives may appear at function scope or global scope. They are not
2002 instructions, and have no effect on the semantics of the IR. When they're at
2003 function scope, they must appear after the terminator of the final basic block.
2004
2005 If basic blocks have their address taken via ``blockaddress()`` expressions,
2006 ``uselistorder_bb`` can be used to reorder their use-lists from outside their
2007 function's scope.
2008
2009 :Syntax:
2010
2011 ::
2012
2013     uselistorder <ty> <value>, { <order-indexes> }
2014     uselistorder_bb @function, %block { <order-indexes> }
2015
2016 :Examples:
2017
2018 ::
2019
2020     define void @foo(i32 %arg1, i32 %arg2) {
2021     entry:
2022       ; ... instructions ...
2023     bb:
2024       ; ... instructions ...
2025
2026       ; At function scope.
2027       uselistorder i32 %arg1, { 1, 0, 2 }
2028       uselistorder label %bb, { 1, 0 }
2029     }
2030
2031     ; At global scope.
2032     uselistorder i32* @global, { 1, 2, 0 }
2033     uselistorder i32 7, { 1, 0 }
2034     uselistorder i32 (i32) @bar, { 1, 0 }
2035     uselistorder_bb @foo, %bb, { 5, 1, 3, 2, 0, 4 }
2036
2037 .. _typesystem:
2038
2039 Type System
2040 ===========
2041
2042 The LLVM type system is one of the most important features of the
2043 intermediate representation. Being typed enables a number of
2044 optimizations to be performed on the intermediate representation
2045 directly, without having to do extra analyses on the side before the
2046 transformation. A strong type system makes it easier to read the
2047 generated code and enables novel analyses and transformations that are
2048 not feasible to perform on normal three address code representations.
2049
2050 .. _t_void:
2051
2052 Void Type
2053 ---------
2054
2055 :Overview:
2056
2057
2058 The void type does not represent any value and has no size.
2059
2060 :Syntax:
2061
2062
2063 ::
2064
2065       void
2066
2067
2068 .. _t_function:
2069
2070 Function Type
2071 -------------
2072
2073 :Overview:
2074
2075
2076 The function type can be thought of as a function signature. It consists of a
2077 return type and a list of formal parameter types. The return type of a function
2078 type is a void type or first class type --- except for :ref:`label <t_label>`
2079 and :ref:`metadata <t_metadata>` types.
2080
2081 :Syntax:
2082
2083 ::
2084
2085       <returntype> (<parameter list>)
2086
2087 ...where '``<parameter list>``' is a comma-separated list of type
2088 specifiers. Optionally, the parameter list may include a type ``...``, which
2089 indicates that the function takes a variable number of arguments. Variable
2090 argument functions can access their arguments with the :ref:`variable argument
2091 handling intrinsic <int_varargs>` functions. '``<returntype>``' is any type
2092 except :ref:`label <t_label>` and :ref:`metadata <t_metadata>`.
2093
2094 :Examples:
2095
2096 +---------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2097 | ``i32 (i32)``                   | function taking an ``i32``, returning an ``i32``                                                                                                                    |
2098 +---------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2099 | ``float (i16, i32 *) *``        | :ref:`Pointer <t_pointer>` to a function that takes an ``i16`` and a :ref:`pointer <t_pointer>` to ``i32``, returning ``float``.                                    |
2100 +---------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2101 | ``i32 (i8*, ...)``              | A vararg function that takes at least one :ref:`pointer <t_pointer>` to ``i8`` (char in C), which returns an integer. This is the signature for ``printf`` in LLVM. |
2102 +---------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2103 | ``{i32, i32} (i32)``            | A function taking an ``i32``, returning a :ref:`structure <t_struct>` containing two ``i32`` values                                                                 |
2104 +---------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2105
2106 .. _t_firstclass:
2107
2108 First Class Types
2109 -----------------
2110
2111 The :ref:`first class <t_firstclass>` types are perhaps the most important.
2112 Values of these types are the only ones which can be produced by
2113 instructions.
2114
2115 .. _t_single_value:
2116
2117 Single Value Types
2118 ^^^^^^^^^^^^^^^^^^
2119
2120 These are the types that are valid in registers from CodeGen's perspective.
2121
2122 .. _t_integer:
2123
2124 Integer Type
2125 """"""""""""
2126
2127 :Overview:
2128
2129 The integer type is a very simple type that simply specifies an
2130 arbitrary bit width for the integer type desired. Any bit width from 1
2131 bit to 2\ :sup:`23`\ -1 (about 8 million) can be specified.
2132
2133 :Syntax:
2134
2135 ::
2136
2137       iN
2138
2139 The number of bits the integer will occupy is specified by the ``N``
2140 value.
2141
2142 Examples:
2143 *********
2144
2145 +----------------+------------------------------------------------+
2146 | ``i1``         | a single-bit integer.                          |
2147 +----------------+------------------------------------------------+
2148 | ``i32``        | a 32-bit integer.                              |
2149 +----------------+------------------------------------------------+
2150 | ``i1942652``   | a really big integer of over 1 million bits.   |
2151 +----------------+------------------------------------------------+
2152
2153 .. _t_floating:
2154
2155 Floating Point Types
2156 """"""""""""""""""""
2157
2158 .. list-table::
2159    :header-rows: 1
2160
2161    * - Type
2162      - Description
2163
2164    * - ``half``
2165      - 16-bit floating point value
2166
2167    * - ``float``
2168      - 32-bit floating point value
2169
2170    * - ``double``
2171      - 64-bit floating point value
2172
2173    * - ``fp128``
2174      - 128-bit floating point value (112-bit mantissa)
2175
2176    * - ``x86_fp80``
2177      -  80-bit floating point value (X87)
2178
2179    * - ``ppc_fp128``
2180      - 128-bit floating point value (two 64-bits)
2181
2182 X86_mmx Type
2183 """"""""""""
2184
2185 :Overview:
2186
2187 The x86_mmx type represents a value held in an MMX register on an x86
2188 machine. The operations allowed on it are quite limited: parameters and
2189 return values, load and store, and bitcast. User-specified MMX
2190 instructions are represented as intrinsic or asm calls with arguments
2191 and/or results of this type. There are no arrays, vectors or constants
2192 of this type.
2193
2194 :Syntax:
2195
2196 ::
2197
2198       x86_mmx
2199
2200
2201 .. _t_pointer:
2202
2203 Pointer Type
2204 """"""""""""
2205
2206 :Overview:
2207
2208 The pointer type is used to specify memory locations. Pointers are
2209 commonly used to reference objects in memory.
2210
2211 Pointer types may have an optional address space attribute defining the
2212 numbered address space where the pointed-to object resides. The default
2213 address space is number zero. The semantics of non-zero address spaces
2214 are target-specific.
2215
2216 Note that LLVM does not permit pointers to void (``void*``) nor does it
2217 permit pointers to labels (``label*``). Use ``i8*`` instead.
2218
2219 :Syntax:
2220
2221 ::
2222
2223       <type> *
2224
2225 :Examples:
2226
2227 +-------------------------+--------------------------------------------------------------------------------------------------------------+
2228 | ``[4 x i32]*``          | A :ref:`pointer <t_pointer>` to :ref:`array <t_array>` of four ``i32`` values.                               |
2229 +-------------------------+--------------------------------------------------------------------------------------------------------------+
2230 | ``i32 (i32*) *``        | A :ref:`pointer <t_pointer>` to a :ref:`function <t_function>` that takes an ``i32*``, returning an ``i32``. |
2231 +-------------------------+--------------------------------------------------------------------------------------------------------------+
2232 | ``i32 addrspace(5)*``   | A :ref:`pointer <t_pointer>` to an ``i32`` value that resides in address space #5.                           |
2233 +-------------------------+--------------------------------------------------------------------------------------------------------------+
2234
2235 .. _t_vector:
2236
2237 Vector Type
2238 """""""""""
2239
2240 :Overview:
2241
2242 A vector type is a simple derived type that represents a vector of
2243 elements. Vector types are used when multiple primitive data are
2244 operated in parallel using a single instruction (SIMD). A vector type
2245 requires a size (number of elements) and an underlying primitive data
2246 type. Vector types are considered :ref:`first class <t_firstclass>`.
2247
2248 :Syntax:
2249
2250 ::
2251
2252       < <# elements> x <elementtype> >
2253
2254 The number of elements is a constant integer value larger than 0;
2255 elementtype may be any integer, floating point or pointer type. Vectors
2256 of size zero are not allowed.
2257
2258 :Examples:
2259
2260 +-------------------+--------------------------------------------------+
2261 | ``<4 x i32>``     | Vector of 4 32-bit integer values.               |
2262 +-------------------+--------------------------------------------------+
2263 | ``<8 x float>``   | Vector of 8 32-bit floating-point values.        |
2264 +-------------------+--------------------------------------------------+
2265 | ``<2 x i64>``     | Vector of 2 64-bit integer values.               |
2266 +-------------------+--------------------------------------------------+
2267 | ``<4 x i64*>``    | Vector of 4 pointers to 64-bit integer values.   |
2268 +-------------------+--------------------------------------------------+
2269
2270 .. _t_label:
2271
2272 Label Type
2273 ^^^^^^^^^^
2274
2275 :Overview:
2276
2277 The label type represents code labels.
2278
2279 :Syntax:
2280
2281 ::
2282
2283       label
2284
2285 .. _t_token:
2286
2287 Token Type
2288 ^^^^^^^^^^
2289
2290 :Overview:
2291
2292 The token type is used when a value is associated with an instruction
2293 but all uses of the value must not attempt to introspect or obscure it.
2294 As such, it is not appropriate to have a :ref:`phi <i_phi>` or
2295 :ref:`select <i_select>` of type token.
2296
2297 :Syntax:
2298
2299 ::
2300
2301       token
2302
2303
2304
2305 .. _t_metadata:
2306
2307 Metadata Type
2308 ^^^^^^^^^^^^^
2309
2310 :Overview:
2311
2312 The metadata type represents embedded metadata. No derived types may be
2313 created from metadata except for :ref:`function <t_function>` arguments.
2314
2315 :Syntax:
2316
2317 ::
2318
2319       metadata
2320
2321 .. _t_aggregate:
2322
2323 Aggregate Types
2324 ^^^^^^^^^^^^^^^
2325
2326 Aggregate Types are a subset of derived types that can contain multiple
2327 member types. :ref:`Arrays <t_array>` and :ref:`structs <t_struct>` are
2328 aggregate types. :ref:`Vectors <t_vector>` are not considered to be
2329 aggregate types.
2330
2331 .. _t_array:
2332
2333 Array Type
2334 """"""""""
2335
2336 :Overview:
2337
2338 The array type is a very simple derived type that arranges elements
2339 sequentially in memory. The array type requires a size (number of
2340 elements) and an underlying data type.
2341
2342 :Syntax:
2343
2344 ::
2345
2346       [<# elements> x <elementtype>]
2347
2348 The number of elements is a constant integer value; ``elementtype`` may
2349 be any type with a size.
2350
2351 :Examples:
2352
2353 +------------------+--------------------------------------+
2354 | ``[40 x i32]``   | Array of 40 32-bit integer values.   |
2355 +------------------+--------------------------------------+
2356 | ``[41 x i32]``   | Array of 41 32-bit integer values.   |
2357 +------------------+--------------------------------------+
2358 | ``[4 x i8]``     | Array of 4 8-bit integer values.     |
2359 +------------------+--------------------------------------+
2360
2361 Here are some examples of multidimensional arrays:
2362
2363 +-----------------------------+----------------------------------------------------------+
2364 | ``[3 x [4 x i32]]``         | 3x4 array of 32-bit integer values.                      |
2365 +-----------------------------+----------------------------------------------------------+
2366 | ``[12 x [10 x float]]``     | 12x10 array of single precision floating point values.   |
2367 +-----------------------------+----------------------------------------------------------+
2368 | ``[2 x [3 x [4 x i16]]]``   | 2x3x4 array of 16-bit integer values.                    |
2369 +-----------------------------+----------------------------------------------------------+
2370
2371 There is no restriction on indexing beyond the end of the array implied
2372 by a static type (though there are restrictions on indexing beyond the
2373 bounds of an allocated object in some cases). This means that
2374 single-dimension 'variable sized array' addressing can be implemented in
2375 LLVM with a zero length array type. An implementation of 'pascal style
2376 arrays' in LLVM could use the type "``{ i32, [0 x float]}``", for
2377 example.
2378
2379 .. _t_struct:
2380
2381 Structure Type
2382 """"""""""""""
2383
2384 :Overview:
2385
2386 The structure type is used to represent a collection of data members
2387 together in memory. The elements of a structure may be any type that has
2388 a size.
2389
2390 Structures in memory are accessed using '``load``' and '``store``' by
2391 getting a pointer to a field with the '``getelementptr``' instruction.
2392 Structures in registers are accessed using the '``extractvalue``' and
2393 '``insertvalue``' instructions.
2394
2395 Structures may optionally be "packed" structures, which indicate that
2396 the alignment of the struct is one byte, and that there is no padding
2397 between the elements. In non-packed structs, padding between field types
2398 is inserted as defined by the DataLayout string in the module, which is
2399 required to match what the underlying code generator expects.
2400
2401 Structures can either be "literal" or "identified". A literal structure
2402 is defined inline with other types (e.g. ``{i32, i32}*``) whereas
2403 identified types are always defined at the top level with a name.
2404 Literal types are uniqued by their contents and can never be recursive
2405 or opaque since there is no way to write one. Identified types can be
2406 recursive, can be opaqued, and are never uniqued.
2407
2408 :Syntax:
2409
2410 ::
2411
2412       %T1 = type { <type list> }     ; Identified normal struct type
2413       %T2 = type <{ <type list> }>   ; Identified packed struct type
2414
2415 :Examples:
2416
2417 +------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2418 | ``{ i32, i32, i32 }``        | A triple of three ``i32`` values                                                                                                                                                      |
2419 +------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2420 | ``{ float, i32 (i32) * }``   | A pair, where the first element is a ``float`` and the second element is a :ref:`pointer <t_pointer>` to a :ref:`function <t_function>` that takes an ``i32``, returning an ``i32``.  |
2421 +------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2422 | ``<{ i8, i32 }>``            | A packed struct known to be 5 bytes in size.                                                                                                                                          |
2423 +------------------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
2424
2425 .. _t_opaque:
2426
2427 Opaque Structure Types
2428 """"""""""""""""""""""
2429
2430 :Overview:
2431
2432 Opaque structure types are used to represent named structure types that
2433 do not have a body specified. This corresponds (for example) to the C
2434 notion of a forward declared structure.
2435
2436 :Syntax:
2437
2438 ::
2439
2440       %X = type opaque
2441       %52 = type opaque
2442
2443 :Examples:
2444
2445 +--------------+-------------------+
2446 | ``opaque``   | An opaque type.   |
2447 +--------------+-------------------+
2448
2449 .. _constants:
2450
2451 Constants
2452 =========
2453
2454 LLVM has several different basic types of constants. This section
2455 describes them all and their syntax.
2456
2457 Simple Constants
2458 ----------------
2459
2460 **Boolean constants**
2461     The two strings '``true``' and '``false``' are both valid constants
2462     of the ``i1`` type.
2463 **Integer constants**
2464     Standard integers (such as '4') are constants of the
2465     :ref:`integer <t_integer>` type. Negative numbers may be used with
2466     integer types.
2467 **Floating point constants**
2468     Floating point constants use standard decimal notation (e.g.
2469     123.421), exponential notation (e.g. 1.23421e+2), or a more precise
2470     hexadecimal notation (see below). The assembler requires the exact
2471     decimal value of a floating-point constant. For example, the
2472     assembler accepts 1.25 but rejects 1.3 because 1.3 is a repeating
2473     decimal in binary. Floating point constants must have a :ref:`floating
2474     point <t_floating>` type.
2475 **Null pointer constants**
2476     The identifier '``null``' is recognized as a null pointer constant
2477     and must be of :ref:`pointer type <t_pointer>`.
2478 **Token constants**
2479     The identifier '``none``' is recognized as an empty token constant
2480     and must be of :ref:`token type <t_token>`.
2481
2482 The one non-intuitive notation for constants is the hexadecimal form of
2483 floating point constants. For example, the form
2484 '``double    0x432ff973cafa8000``' is equivalent to (but harder to read
2485 than) '``double 4.5e+15``'. The only time hexadecimal floating point
2486 constants are required (and the only time that they are generated by the
2487 disassembler) is when a floating point constant must be emitted but it
2488 cannot be represented as a decimal floating point number in a reasonable
2489 number of digits. For example, NaN's, infinities, and other special
2490 values are represented in their IEEE hexadecimal format so that assembly
2491 and disassembly do not cause any bits to change in the constants.
2492
2493 When using the hexadecimal form, constants of types half, float, and
2494 double are represented using the 16-digit form shown above (which
2495 matches the IEEE754 representation for double); half and float values
2496 must, however, be exactly representable as IEEE 754 half and single
2497 precision, respectively. Hexadecimal format is always used for long
2498 double, and there are three forms of long double. The 80-bit format used
2499 by x86 is represented as ``0xK`` followed by 20 hexadecimal digits. The
2500 128-bit format used by PowerPC (two adjacent doubles) is represented by
2501 ``0xM`` followed by 32 hexadecimal digits. The IEEE 128-bit format is
2502 represented by ``0xL`` followed by 32 hexadecimal digits. Long doubles
2503 will only work if they match the long double format on your target.
2504 The IEEE 16-bit format (half precision) is represented by ``0xH``
2505 followed by 4 hexadecimal digits. All hexadecimal formats are big-endian
2506 (sign bit at the left).
2507
2508 There are no constants of type x86_mmx.
2509
2510 .. _complexconstants:
2511
2512 Complex Constants
2513 -----------------
2514
2515 Complex constants are a (potentially recursive) combination of simple
2516 constants and smaller complex constants.
2517
2518 **Structure constants**
2519     Structure constants are represented with notation similar to
2520     structure type definitions (a comma separated list of elements,
2521     surrounded by braces (``{}``)). For example:
2522     "``{ i32 4, float 17.0, i32* @G }``", where "``@G``" is declared as
2523     "``@G = external global i32``". Structure constants must have
2524     :ref:`structure type <t_struct>`, and the number and types of elements
2525     must match those specified by the type.
2526 **Array constants**
2527     Array constants are represented with notation similar to array type
2528     definitions (a comma separated list of elements, surrounded by
2529     square brackets (``[]``)). For example:
2530     "``[ i32 42, i32 11, i32 74 ]``". Array constants must have
2531     :ref:`array type <t_array>`, and the number and types of elements must
2532     match those specified by the type. As a special case, character array
2533     constants may also be represented as a double-quoted string using the ``c``
2534     prefix. For example: "``c"Hello World\0A\00"``".
2535 **Vector constants**
2536     Vector constants are represented with notation similar to vector
2537     type definitions (a comma separated list of elements, surrounded by
2538     less-than/greater-than's (``<>``)). For example:
2539     "``< i32 42, i32 11, i32 74, i32 100 >``". Vector constants
2540     must have :ref:`vector type <t_vector>`, and the number and types of
2541     elements must match those specified by the type.
2542 **Zero initialization**
2543     The string '``zeroinitializer``' can be used to zero initialize a
2544     value to zero of *any* type, including scalar and
2545     :ref:`aggregate <t_aggregate>` types. This is often used to avoid
2546     having to print large zero initializers (e.g. for large arrays) and
2547     is always exactly equivalent to using explicit zero initializers.
2548 **Metadata node**
2549     A metadata node is a constant tuple without types. For example:
2550     "``!{!0, !{!2, !0}, !"test"}``". Metadata can reference constant values,
2551     for example: "``!{!0, i32 0, i8* @global, i64 (i64)* @function, !"str"}``".
2552     Unlike other typed constants that are meant to be interpreted as part of
2553     the instruction stream, metadata is a place to attach additional
2554     information such as debug info.
2555
2556 Global Variable and Function Addresses
2557 --------------------------------------
2558
2559 The addresses of :ref:`global variables <globalvars>` and
2560 :ref:`functions <functionstructure>` are always implicitly valid
2561 (link-time) constants. These constants are explicitly referenced when
2562 the :ref:`identifier for the global <identifiers>` is used and always have
2563 :ref:`pointer <t_pointer>` type. For example, the following is a legal LLVM
2564 file:
2565
2566 .. code-block:: llvm
2567
2568     @X = global i32 17
2569     @Y = global i32 42
2570     @Z = global [2 x i32*] [ i32* @X, i32* @Y ]
2571
2572 .. _undefvalues:
2573
2574 Undefined Values
2575 ----------------
2576
2577 The string '``undef``' can be used anywhere a constant is expected, and
2578 indicates that the user of the value may receive an unspecified
2579 bit-pattern. Undefined values may be of any type (other than '``label``'
2580 or '``void``') and be used anywhere a constant is permitted.
2581
2582 Undefined values are useful because they indicate to the compiler that
2583 the program is well defined no matter what value is used. This gives the
2584 compiler more freedom to optimize. Here are some examples of
2585 (potentially surprising) transformations that are valid (in pseudo IR):
2586
2587 .. code-block:: llvm
2588
2589       %A = add %X, undef
2590       %B = sub %X, undef
2591       %C = xor %X, undef
2592     Safe:
2593       %A = undef
2594       %B = undef
2595       %C = undef
2596
2597 This is safe because all of the output bits are affected by the undef
2598 bits. Any output bit can have a zero or one depending on the input bits.
2599
2600 .. code-block:: llvm
2601
2602       %A = or %X, undef
2603       %B = and %X, undef
2604     Safe:
2605       %A = -1
2606       %B = 0
2607     Unsafe:
2608       %A = undef
2609       %B = undef
2610
2611 These logical operations have bits that are not always affected by the
2612 input. For example, if ``%X`` has a zero bit, then the output of the
2613 '``and``' operation will always be a zero for that bit, no matter what
2614 the corresponding bit from the '``undef``' is. As such, it is unsafe to
2615 optimize or assume that the result of the '``and``' is '``undef``'.
2616 However, it is safe to assume that all bits of the '``undef``' could be
2617 0, and optimize the '``and``' to 0. Likewise, it is safe to assume that
2618 all the bits of the '``undef``' operand to the '``or``' could be set,
2619 allowing the '``or``' to be folded to -1.
2620
2621 .. code-block:: llvm
2622
2623       %A = select undef, %X, %Y
2624       %B = select undef, 42, %Y
2625       %C = select %X, %Y, undef
2626     Safe:
2627       %A = %X     (or %Y)
2628       %B = 42     (or %Y)
2629       %C = %Y
2630     Unsafe:
2631       %A = undef
2632       %B = undef
2633       %C = undef
2634
2635 This set of examples shows that undefined '``select``' (and conditional
2636 branch) conditions can go *either way*, but they have to come from one
2637 of the two operands. In the ``%A`` example, if ``%X`` and ``%Y`` were
2638 both known to have a clear low bit, then ``%A`` would have to have a
2639 cleared low bit. However, in the ``%C`` example, the optimizer is
2640 allowed to assume that the '``undef``' operand could be the same as
2641 ``%Y``, allowing the whole '``select``' to be eliminated.
2642
2643 .. code-block:: llvm
2644
2645       %A = xor undef, undef
2646
2647       %B = undef
2648       %C = xor %B, %B
2649
2650       %D = undef
2651       %E = icmp slt %D, 4
2652       %F = icmp gte %D, 4
2653
2654     Safe:
2655       %A = undef
2656       %B = undef
2657       %C = undef
2658       %D = undef
2659       %E = undef
2660       %F = undef
2661
2662 This example points out that two '``undef``' operands are not
2663 necessarily the same. This can be surprising to people (and also matches
2664 C semantics) where they assume that "``X^X``" is always zero, even if
2665 ``X`` is undefined. This isn't true for a number of reasons, but the
2666 short answer is that an '``undef``' "variable" can arbitrarily change
2667 its value over its "live range". This is true because the variable
2668 doesn't actually *have a live range*. Instead, the value is logically
2669 read from arbitrary registers that happen to be around when needed, so
2670 the value is not necessarily consistent over time. In fact, ``%A`` and
2671 ``%C`` need to have the same semantics or the core LLVM "replace all
2672 uses with" concept would not hold.
2673
2674 .. code-block:: llvm
2675
2676       %A = fdiv undef, %X
2677       %B = fdiv %X, undef
2678     Safe:
2679       %A = undef
2680     b: unreachable
2681
2682 These examples show the crucial difference between an *undefined value*
2683 and *undefined behavior*. An undefined value (like '``undef``') is
2684 allowed to have an arbitrary bit-pattern. This means that the ``%A``
2685 operation can be constant folded to '``undef``', because the '``undef``'
2686 could be an SNaN, and ``fdiv`` is not (currently) defined on SNaN's.
2687 However, in the second example, we can make a more aggressive
2688 assumption: because the ``undef`` is allowed to be an arbitrary value,
2689 we are allowed to assume that it could be zero. Since a divide by zero
2690 has *undefined behavior*, we are allowed to assume that the operation
2691 does not execute at all. This allows us to delete the divide and all
2692 code after it. Because the undefined operation "can't happen", the
2693 optimizer can assume that it occurs in dead code.
2694
2695 .. code-block:: llvm
2696
2697     a:  store undef -> %X
2698     b:  store %X -> undef
2699     Safe:
2700     a: <deleted>
2701     b: unreachable
2702
2703 These examples reiterate the ``fdiv`` example: a store *of* an undefined
2704 value can be assumed to not have any effect; we can assume that the
2705 value is overwritten with bits that happen to match what was already
2706 there. However, a store *to* an undefined location could clobber
2707 arbitrary memory, therefore, it has undefined behavior.
2708
2709 .. _poisonvalues:
2710
2711 Poison Values
2712 -------------
2713
2714 Poison values are similar to :ref:`undef values <undefvalues>`, however
2715 they also represent the fact that an instruction or constant expression
2716 that cannot evoke side effects has nevertheless detected a condition
2717 that results in undefined behavior.
2718
2719 There is currently no way of representing a poison value in the IR; they
2720 only exist when produced by operations such as :ref:`add <i_add>` with
2721 the ``nsw`` flag.
2722
2723 Poison value behavior is defined in terms of value *dependence*:
2724
2725 -  Values other than :ref:`phi <i_phi>` nodes depend on their operands.
2726 -  :ref:`Phi <i_phi>` nodes depend on the operand corresponding to
2727    their dynamic predecessor basic block.
2728 -  Function arguments depend on the corresponding actual argument values
2729    in the dynamic callers of their functions.
2730 -  :ref:`Call <i_call>` instructions depend on the :ref:`ret <i_ret>`
2731    instructions that dynamically transfer control back to them.
2732 -  :ref:`Invoke <i_invoke>` instructions depend on the
2733    :ref:`ret <i_ret>`, :ref:`resume <i_resume>`, or exception-throwing
2734    call instructions that dynamically transfer control back to them.
2735 -  Non-volatile loads and stores depend on the most recent stores to all
2736    of the referenced memory addresses, following the order in the IR
2737    (including loads and stores implied by intrinsics such as
2738    :ref:`@llvm.memcpy <int_memcpy>`.)
2739 -  An instruction with externally visible side effects depends on the
2740    most recent preceding instruction with externally visible side
2741    effects, following the order in the IR. (This includes :ref:`volatile
2742    operations <volatile>`.)
2743 -  An instruction *control-depends* on a :ref:`terminator
2744    instruction <terminators>` if the terminator instruction has
2745    multiple successors and the instruction is always executed when
2746    control transfers to one of the successors, and may not be executed
2747    when control is transferred to another.
2748 -  Additionally, an instruction also *control-depends* on a terminator
2749    instruction if the set of instructions it otherwise depends on would
2750    be different if the terminator had transferred control to a different
2751    successor.
2752 -  Dependence is transitive.
2753
2754 Poison values have the same behavior as :ref:`undef values <undefvalues>`,
2755 with the additional effect that any instruction that has a *dependence*
2756 on a poison value has undefined behavior.
2757
2758 Here are some examples:
2759
2760 .. code-block:: llvm
2761
2762     entry:
2763       %poison = sub nuw i32 0, 1           ; Results in a poison value.
2764       %still_poison = and i32 %poison, 0   ; 0, but also poison.
2765       %poison_yet_again = getelementptr i32, i32* @h, i32 %still_poison
2766       store i32 0, i32* %poison_yet_again  ; memory at @h[0] is poisoned
2767
2768       store i32 %poison, i32* @g           ; Poison value stored to memory.
2769       %poison2 = load i32, i32* @g         ; Poison value loaded back from memory.
2770
2771       store volatile i32 %poison, i32* @g  ; External observation; undefined behavior.
2772
2773       %narrowaddr = bitcast i32* @g to i16*
2774       %wideaddr = bitcast i32* @g to i64*
2775       %poison3 = load i16, i16* %narrowaddr ; Returns a poison value.
2776       %poison4 = load i64, i64* %wideaddr  ; Returns a poison value.
2777
2778       %cmp = icmp slt i32 %poison, 0       ; Returns a poison value.
2779       br i1 %cmp, label %true, label %end  ; Branch to either destination.
2780
2781     true:
2782       store volatile i32 0, i32* @g        ; This is control-dependent on %cmp, so
2783                                            ; it has undefined behavior.
2784       br label %end
2785
2786     end:
2787       %p = phi i32 [ 0, %entry ], [ 1, %true ]
2788                                            ; Both edges into this PHI are
2789                                            ; control-dependent on %cmp, so this
2790                                            ; always results in a poison value.
2791
2792       store volatile i32 0, i32* @g        ; This would depend on the store in %true
2793                                            ; if %cmp is true, or the store in %entry
2794                                            ; otherwise, so this is undefined behavior.
2795
2796       br i1 %cmp, label %second_true, label %second_end
2797                                            ; The same branch again, but this time the
2798                                            ; true block doesn't have side effects.
2799
2800     second_true:
2801       ; No side effects!
2802       ret void
2803
2804     second_end:
2805       store volatile i32 0, i32* @g        ; This time, the instruction always depends
2806                                            ; on the store in %end. Also, it is
2807                                            ; control-equivalent to %end, so this is
2808                                            ; well-defined (ignoring earlier undefined
2809                                            ; behavior in this example).
2810
2811 .. _blockaddress:
2812
2813 Addresses of Basic Blocks
2814 -------------------------
2815
2816 ``blockaddress(@function, %block)``
2817
2818 The '``blockaddress``' constant computes the address of the specified
2819 basic block in the specified function, and always has an ``i8*`` type.
2820 Taking the address of the entry block is illegal.
2821
2822 This value only has defined behavior when used as an operand to the
2823 ':ref:`indirectbr <i_indirectbr>`' instruction, or for comparisons
2824 against null. Pointer equality tests between labels addresses results in
2825 undefined behavior --- though, again, comparison against null is ok, and
2826 no label is equal to the null pointer. This may be passed around as an
2827 opaque pointer sized value as long as the bits are not inspected. This
2828 allows ``ptrtoint`` and arithmetic to be performed on these values so
2829 long as the original value is reconstituted before the ``indirectbr``
2830 instruction.
2831
2832 Finally, some targets may provide defined semantics when using the value
2833 as the operand to an inline assembly, but that is target specific.
2834
2835 .. _constantexprs:
2836
2837 Constant Expressions
2838 --------------------
2839
2840 Constant expressions are used to allow expressions involving other
2841 constants to be used as constants. Constant expressions may be of any
2842 :ref:`first class <t_firstclass>` type and may involve any LLVM operation
2843 that does not have side effects (e.g. load and call are not supported).
2844 The following is the syntax for constant expressions:
2845
2846 ``trunc (CST to TYPE)``
2847     Truncate a constant to another type. The bit size of CST must be
2848     larger than the bit size of TYPE. Both types must be integers.
2849 ``zext (CST to TYPE)``
2850     Zero extend a constant to another type. The bit size of CST must be
2851     smaller than the bit size of TYPE. Both types must be integers.
2852 ``sext (CST to TYPE)``
2853     Sign extend a constant to another type. The bit size of CST must be
2854     smaller than the bit size of TYPE. Both types must be integers.
2855 ``fptrunc (CST to TYPE)``
2856     Truncate a floating point constant to another floating point type.
2857     The size of CST must be larger than the size of TYPE. Both types
2858     must be floating point.
2859 ``fpext (CST to TYPE)``
2860     Floating point extend a constant to another type. The size of CST
2861     must be smaller or equal to the size of TYPE. Both types must be
2862     floating point.
2863 ``fptoui (CST to TYPE)``
2864     Convert a floating point constant to the corresponding unsigned
2865     integer constant. TYPE must be a scalar or vector integer type. CST
2866     must be of scalar or vector floating point type. Both CST and TYPE
2867     must be scalars, or vectors of the same number of elements. If the
2868     value won't fit in the integer type, the results are undefined.
2869 ``fptosi (CST to TYPE)``
2870     Convert a floating point constant to the corresponding signed
2871     integer constant. TYPE must be a scalar or vector integer type. CST
2872     must be of scalar or vector floating point type. Both CST and TYPE
2873     must be scalars, or vectors of the same number of elements. If the
2874     value won't fit in the integer type, the results are undefined.
2875 ``uitofp (CST to TYPE)``
2876     Convert an unsigned integer constant to the corresponding floating
2877     point constant. TYPE must be a scalar or vector floating point type.
2878     CST must be of scalar or vector integer type. Both CST and TYPE must
2879     be scalars, or vectors of the same number of elements. If the value
2880     won't fit in the floating point type, the results are undefined.
2881 ``sitofp (CST to TYPE)``
2882     Convert a signed integer constant to the corresponding floating
2883     point constant. TYPE must be a scalar or vector floating point type.
2884     CST must be of scalar or vector integer type. Both CST and TYPE must
2885     be scalars, or vectors of the same number of elements. If the value
2886     won't fit in the floating point type, the results are undefined.
2887 ``ptrtoint (CST to TYPE)``
2888     Convert a pointer typed constant to the corresponding integer
2889     constant. ``TYPE`` must be an integer type. ``CST`` must be of
2890     pointer type. The ``CST`` value is zero extended, truncated, or
2891     unchanged to make it fit in ``TYPE``.
2892 ``inttoptr (CST to TYPE)``
2893     Convert an integer constant to a pointer constant. TYPE must be a
2894     pointer type. CST must be of integer type. The CST value is zero
2895     extended, truncated, or unchanged to make it fit in a pointer size.
2896     This one is *really* dangerous!
2897 ``bitcast (CST to TYPE)``
2898     Convert a constant, CST, to another TYPE. The constraints of the
2899     operands are the same as those for the :ref:`bitcast
2900     instruction <i_bitcast>`.
2901 ``addrspacecast (CST to TYPE)``
2902     Convert a constant pointer or constant vector of pointer, CST, to another
2903     TYPE in a different address space. The constraints of the operands are the
2904     same as those for the :ref:`addrspacecast instruction <i_addrspacecast>`.
2905 ``getelementptr (TY, CSTPTR, IDX0, IDX1, ...)``, ``getelementptr inbounds (TY, CSTPTR, IDX0, IDX1, ...)``
2906     Perform the :ref:`getelementptr operation <i_getelementptr>` on
2907     constants. As with the :ref:`getelementptr <i_getelementptr>`
2908     instruction, the index list may have zero or more indexes, which are
2909     required to make sense for the type of "pointer to TY".
2910 ``select (COND, VAL1, VAL2)``
2911     Perform the :ref:`select operation <i_select>` on constants.
2912 ``icmp COND (VAL1, VAL2)``
2913     Performs the :ref:`icmp operation <i_icmp>` on constants.
2914 ``fcmp COND (VAL1, VAL2)``
2915     Performs the :ref:`fcmp operation <i_fcmp>` on constants.
2916 ``extractelement (VAL, IDX)``
2917     Perform the :ref:`extractelement operation <i_extractelement>` on
2918     constants.
2919 ``insertelement (VAL, ELT, IDX)``
2920     Perform the :ref:`insertelement operation <i_insertelement>` on
2921     constants.
2922 ``shufflevector (VEC1, VEC2, IDXMASK)``
2923     Perform the :ref:`shufflevector operation <i_shufflevector>` on
2924     constants.
2925 ``extractvalue (VAL, IDX0, IDX1, ...)``
2926     Perform the :ref:`extractvalue operation <i_extractvalue>` on
2927     constants. The index list is interpreted in a similar manner as
2928     indices in a ':ref:`getelementptr <i_getelementptr>`' operation. At
2929     least one index value must be specified.
2930 ``insertvalue (VAL, ELT, IDX0, IDX1, ...)``
2931     Perform the :ref:`insertvalue operation <i_insertvalue>` on constants.
2932     The index list is interpreted in a similar manner as indices in a
2933     ':ref:`getelementptr <i_getelementptr>`' operation. At least one index
2934     value must be specified.
2935 ``OPCODE (LHS, RHS)``
2936     Perform the specified operation of the LHS and RHS constants. OPCODE
2937     may be any of the :ref:`binary <binaryops>` or :ref:`bitwise
2938     binary <bitwiseops>` operations. The constraints on operands are
2939     the same as those for the corresponding instruction (e.g. no bitwise
2940     operations on floating point values are allowed).
2941
2942 Other Values
2943 ============
2944
2945 .. _inlineasmexprs:
2946
2947 Inline Assembler Expressions
2948 ----------------------------
2949
2950 LLVM supports inline assembler expressions (as opposed to :ref:`Module-Level
2951 Inline Assembly <moduleasm>`) through the use of a special value. This value
2952 represents the inline assembler as a template string (containing the
2953 instructions to emit), a list of operand constraints (stored as a string), a
2954 flag that indicates whether or not the inline asm expression has side effects,
2955 and a flag indicating whether the function containing the asm needs to align its
2956 stack conservatively.
2957
2958 The template string supports argument substitution of the operands using "``$``"
2959 followed by a number, to indicate substitution of the given register/memory
2960 location, as specified by the constraint string. "``${NUM:MODIFIER}``" may also
2961 be used, where ``MODIFIER`` is a target-specific annotation for how to print the
2962 operand (See :ref:`inline-asm-modifiers`).
2963
2964 A literal "``$``" may be included by using "``$$``" in the template. To include
2965 other special characters into the output, the usual "``\XX``" escapes may be
2966 used, just as in other strings. Note that after template substitution, the
2967 resulting assembly string is parsed by LLVM's integrated assembler unless it is
2968 disabled -- even when emitting a ``.s`` file -- and thus must contain assembly
2969 syntax known to LLVM.
2970
2971 LLVM's support for inline asm is modeled closely on the requirements of Clang's
2972 GCC-compatible inline-asm support. Thus, the feature-set and the constraint and
2973 modifier codes listed here are similar or identical to those in GCC's inline asm
2974 support. However, to be clear, the syntax of the template and constraint strings
2975 described here is *not* the same as the syntax accepted by GCC and Clang, and,
2976 while most constraint letters are passed through as-is by Clang, some get
2977 translated to other codes when converting from the C source to the LLVM
2978 assembly.
2979
2980 An example inline assembler expression is:
2981
2982 .. code-block:: llvm
2983
2984     i32 (i32) asm "bswap $0", "=r,r"
2985
2986 Inline assembler expressions may **only** be used as the callee operand
2987 of a :ref:`call <i_call>` or an :ref:`invoke <i_invoke>` instruction.
2988 Thus, typically we have:
2989
2990 .. code-block:: llvm
2991
2992     %X = call i32 asm "bswap $0", "=r,r"(i32 %Y)
2993
2994 Inline asms with side effects not visible in the constraint list must be
2995 marked as having side effects. This is done through the use of the
2996 '``sideeffect``' keyword, like so:
2997
2998 .. code-block:: llvm
2999
3000     call void asm sideeffect "eieio", ""()
3001
3002 In some cases inline asms will contain code that will not work unless
3003 the stack is aligned in some way, such as calls or SSE instructions on
3004 x86, yet will not contain code that does that alignment within the asm.
3005 The compiler should make conservative assumptions about what the asm
3006 might contain and should generate its usual stack alignment code in the
3007 prologue if the '``alignstack``' keyword is present:
3008
3009 .. code-block:: llvm
3010
3011     call void asm alignstack "eieio", ""()
3012
3013 Inline asms also support using non-standard assembly dialects. The
3014 assumed dialect is ATT. When the '``inteldialect``' keyword is present,
3015 the inline asm is using the Intel dialect. Currently, ATT and Intel are
3016 the only supported dialects. An example is:
3017
3018 .. code-block:: llvm
3019
3020     call void asm inteldialect "eieio", ""()
3021
3022 If multiple keywords appear the '``sideeffect``' keyword must come
3023 first, the '``alignstack``' keyword second and the '``inteldialect``'
3024 keyword last.
3025
3026 Inline Asm Constraint String
3027 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
3028
3029 The constraint list is a comma-separated string, each element containing one or
3030 more constraint codes.
3031
3032 For each element in the constraint list an appropriate register or memory
3033 operand will be chosen, and it will be made available to assembly template
3034 string expansion as ``$0`` for the first constraint in the list, ``$1`` for the
3035 second, etc.
3036
3037 There are three different types of constraints, which are distinguished by a
3038 prefix symbol in front of the constraint code: Output, Input, and Clobber. The
3039 constraints must always be given in that order: outputs first, then inputs, then
3040 clobbers. They cannot be intermingled.
3041
3042 There are also three different categories of constraint codes:
3043
3044 - Register constraint. This is either a register class, or a fixed physical
3045   register. This kind of constraint will allocate a register, and if necessary,
3046   bitcast the argument or result to the appropriate type.
3047 - Memory constraint. This kind of constraint is for use with an instruction
3048   taking a memory operand. Different constraints allow for different addressing
3049   modes used by the target.
3050 - Immediate value constraint. This kind of constraint is for an integer or other
3051   immediate value which can be rendered directly into an instruction. The
3052   various target-specific constraints allow the selection of a value in the
3053   proper range for the instruction you wish to use it with.
3054
3055 Output constraints
3056 """"""""""""""""""
3057
3058 Output constraints are specified by an "``=``" prefix (e.g. "``=r``"). This
3059 indicates that the assembly will write to this operand, and the operand will
3060 then be made available as a return value of the ``asm`` expression. Output
3061 constraints do not consume an argument from the call instruction. (Except, see
3062 below about indirect outputs).
3063
3064 Normally, it is expected that no output locations are written to by the assembly
3065 expression until *all* of the inputs have been read. As such, LLVM may assign
3066 the same register to an output and an input. If this is not safe (e.g. if the
3067 assembly contains two instructions, where the first writes to one output, and
3068 the second reads an input and writes to a second output), then the "``&``"
3069 modifier must be used (e.g. "``=&r``") to specify that the output is an
3070 "early-clobber" output. Marking an ouput as "early-clobber" ensures that LLVM
3071 will not use the same register for any inputs (other than an input tied to this
3072 output).
3073
3074 Input constraints
3075 """""""""""""""""
3076
3077 Input constraints do not have a prefix -- just the constraint codes. Each input
3078 constraint will consume one argument from the call instruction. It is not
3079 permitted for the asm to write to any input register or memory location (unless
3080 that input is tied to an output). Note also that multiple inputs may all be
3081 assigned to the same register, if LLVM can determine that they necessarily all
3082 contain the same value.
3083
3084 Instead of providing a Constraint Code, input constraints may also "tie"
3085 themselves to an output constraint, by providing an integer as the constraint
3086 string. Tied inputs still consume an argument from the call instruction, and
3087 take up a position in the asm template numbering as is usual -- they will simply
3088 be constrained to always use the same register as the output they've been tied
3089 to. For example, a constraint string of "``=r,0``" says to assign a register for
3090 output, and use that register as an input as well (it being the 0'th
3091 constraint).
3092
3093 It is permitted to tie an input to an "early-clobber" output. In that case, no
3094 *other* input may share the same register as the input tied to the early-clobber
3095 (even when the other input has the same value).
3096
3097 You may only tie an input to an output which has a register constraint, not a
3098 memory constraint. Only a single input may be tied to an output.
3099
3100 There is also an "interesting" feature which deserves a bit of explanation: if a
3101 register class constraint allocates a register which is too small for the value
3102 type operand provided as input, the input value will be split into multiple
3103 registers, and all of them passed to the inline asm.
3104
3105 However, this feature is often not as useful as you might think.
3106
3107 Firstly, the registers are *not* guaranteed to be consecutive. So, on those
3108 architectures that have instructions which operate on multiple consecutive
3109 instructions, this is not an appropriate way to support them. (e.g. the 32-bit
3110 SparcV8 has a 64-bit load, which instruction takes a single 32-bit register. The
3111 hardware then loads into both the named register, and the next register. This
3112 feature of inline asm would not be useful to support that.)
3113
3114 A few of the targets provide a template string modifier allowing explicit access
3115 to the second register of a two-register operand (e.g. MIPS ``L``, ``M``, and
3116 ``D``). On such an architecture, you can actually access the second allocated
3117 register (yet, still, not any subsequent ones). But, in that case, you're still
3118 probably better off simply splitting the value into two separate operands, for
3119 clarity. (e.g. see the description of the ``A`` constraint on X86, which,
3120 despite existing only for use with this feature, is not really a good idea to
3121 use)
3122
3123 Indirect inputs and outputs
3124 """""""""""""""""""""""""""
3125
3126 Indirect output or input constraints can be specified by the "``*``" modifier
3127 (which goes after the "``=``" in case of an output). This indicates that the asm
3128 will write to or read from the contents of an *address* provided as an input
3129 argument. (Note that in this way, indirect outputs act more like an *input* than
3130 an output: just like an input, they consume an argument of the call expression,
3131 rather than producing a return value. An indirect output constraint is an
3132 "output" only in that the asm is expected to write to the contents of the input
3133 memory location, instead of just read from it).
3134
3135 This is most typically used for memory constraint, e.g. "``=*m``", to pass the
3136 address of a variable as a value.
3137
3138 It is also possible to use an indirect *register* constraint, but only on output
3139 (e.g. "``=*r``"). This will cause LLVM to allocate a register for an output
3140 value normally, and then, separately emit a store to the address provided as
3141 input, after the provided inline asm. (It's not clear what value this
3142 functionality provides, compared to writing the store explicitly after the asm
3143 statement, and it can only produce worse code, since it bypasses many
3144 optimization passes. I would recommend not using it.)
3145
3146
3147 Clobber constraints
3148 """""""""""""""""""
3149
3150 A clobber constraint is indicated by a "``~``" prefix. A clobber does not
3151 consume an input operand, nor generate an output. Clobbers cannot use any of the
3152 general constraint code letters -- they may use only explicit register
3153 constraints, e.g. "``~{eax}``". The one exception is that a clobber string of
3154 "``~{memory}``" indicates that the assembly writes to arbitrary undeclared
3155 memory locations -- not only the memory pointed to by a declared indirect
3156 output.
3157
3158
3159 Constraint Codes
3160 """"""""""""""""
3161 After a potential prefix comes constraint code, or codes.
3162
3163 A Constraint Code is either a single letter (e.g. "``r``"), a "``^``" character
3164 followed by two letters (e.g. "``^wc``"), or "``{``" register-name "``}``"
3165 (e.g. "``{eax}``").
3166
3167 The one and two letter constraint codes are typically chosen to be the same as
3168 GCC's constraint codes.
3169
3170 A single constraint may include one or more than constraint code in it, leaving
3171 it up to LLVM to choose which one to use. This is included mainly for
3172 compatibility with the translation of GCC inline asm coming from clang.
3173
3174 There are two ways to specify alternatives, and either or both may be used in an
3175 inline asm constraint list:
3176
3177 1) Append the codes to each other, making a constraint code set. E.g. "``im``"
3178    or "``{eax}m``". This means "choose any of the options in the set". The
3179    choice of constraint is made independently for each constraint in the
3180    constraint list.
3181
3182 2) Use "``|``" between constraint code sets, creating alternatives. Every
3183    constraint in the constraint list must have the same number of alternative
3184    sets. With this syntax, the same alternative in *all* of the items in the
3185    constraint list will be chosen together.
3186
3187 Putting those together, you might have a two operand constraint string like
3188 ``"rm|r,ri|rm"``. This indicates that if operand 0 is ``r`` or ``m``, then
3189 operand 1 may be one of ``r`` or ``i``. If operand 0 is ``r``, then operand 1
3190 may be one of ``r`` or ``m``. But, operand 0 and 1 cannot both be of type m.
3191
3192 However, the use of either of the alternatives features is *NOT* recommended, as
3193 LLVM is not able to make an intelligent choice about which one to use. (At the
3194 point it currently needs to choose, not enough information is available to do so
3195 in a smart way.) Thus, it simply tries to make a choice that's most likely to
3196 compile, not one that will be optimal performance. (e.g., given "``rm``", it'll
3197 always choose to use memory, not registers). And, if given multiple registers,
3198 or multiple register classes, it will simply choose the first one. (In fact, it
3199 doesn't currently even ensure explicitly specified physical registers are
3200 unique, so specifying multiple physical registers as alternatives, like
3201 ``{r11}{r12},{r11}{r12}``, will assign r11 to both operands, not at all what was
3202 intended.)
3203
3204 Supported Constraint Code List
3205 """"""""""""""""""""""""""""""
3206
3207 The constraint codes are, in general, expected to behave the same way they do in
3208 GCC. LLVM's support is often implemented on an 'as-needed' basis, to support C
3209 inline asm code which was supported by GCC. A mismatch in behavior between LLVM
3210 and GCC likely indicates a bug in LLVM.
3211
3212 Some constraint codes are typically supported by all targets:
3213
3214 - ``r``: A register in the target's general purpose register class.
3215 - ``m``: A memory address operand. It is target-specific what addressing modes
3216   are supported, typical examples are register, or register + register offset,
3217   or register + immediate offset (of some target-specific size).
3218 - ``i``: An integer constant (of target-specific width). Allows either a simple
3219   immediate, or a relocatable value.
3220 - ``n``: An integer constant -- *not* including relocatable values.
3221 - ``s``: An integer constant, but allowing *only* relocatable values.
3222 - ``X``: Allows an operand of any kind, no constraint whatsoever. Typically
3223   useful to pass a label for an asm branch or call.
3224
3225   .. FIXME: but that surely isn't actually okay to jump out of an asm
3226      block without telling llvm about the control transfer???)
3227
3228 - ``{register-name}``: Requires exactly the named physical register.
3229
3230 Other constraints are target-specific:
3231
3232 AArch64:
3233
3234 - ``z``: An immediate integer 0. Outputs ``WZR`` or ``XZR``, as appropriate.
3235 - ``I``: An immediate integer valid for an ``ADD`` or ``SUB`` instruction,
3236   i.e. 0 to 4095 with optional shift by 12.
3237 - ``J``: An immediate integer that, when negated, is valid for an ``ADD`` or
3238   ``SUB`` instruction, i.e. -1 to -4095 with optional left shift by 12.
3239 - ``K``: An immediate integer that is valid for the 'bitmask immediate 32' of a
3240   logical instruction like ``AND``, ``EOR``, or ``ORR`` with a 32-bit register.
3241 - ``L``: An immediate integer that is valid for the 'bitmask immediate 64' of a
3242   logical instruction like ``AND``, ``EOR``, or ``ORR`` with a 64-bit register.
3243 - ``M``: An immediate integer for use with the ``MOV`` assembly alias on a
3244   32-bit register. This is a superset of ``K``: in addition to the bitmask
3245   immediate, also allows immediate integers which can be loaded with a single
3246   ``MOVZ`` or ``MOVL`` instruction.
3247 - ``N``: An immediate integer for use with the ``MOV`` assembly alias on a
3248   64-bit register. This is a superset of ``L``.
3249 - ``Q``: Memory address operand must be in a single register (no
3250   offsets). (However, LLVM currently does this for the ``m`` constraint as
3251   well.)
3252 - ``r``: A 32 or 64-bit integer register (W* or X*).
3253 - ``w``: A 32, 64, or 128-bit floating-point/SIMD register.
3254 - ``x``: A lower 128-bit floating-point/SIMD register (``V0`` to ``V15``).
3255
3256 AMDGPU:
3257
3258 - ``r``: A 32 or 64-bit integer register.
3259 - ``[0-9]v``: The 32-bit VGPR register, number 0-9.
3260 - ``[0-9]s``: The 32-bit SGPR register, number 0-9.
3261
3262
3263 All ARM modes:
3264
3265 - ``Q``, ``Um``, ``Un``, ``Uq``, ``Us``, ``Ut``, ``Uv``, ``Uy``: Memory address
3266   operand. Treated the same as operand ``m``, at the moment.
3267
3268 ARM and ARM's Thumb2 mode:
3269
3270 - ``j``: An immediate integer between 0 and 65535 (valid for ``MOVW``)
3271 - ``I``: An immediate integer valid for a data-processing instruction.
3272 - ``J``: An immediate integer between -4095 and 4095.
3273 - ``K``: An immediate integer whose bitwise inverse is valid for a
3274   data-processing instruction. (Can be used with template modifier "``B``" to
3275   print the inverted value).
3276 - ``L``: An immediate integer whose negation is valid for a data-processing
3277   instruction. (Can be used with template modifier "``n``" to print the negated
3278   value).
3279 - ``M``: A power of two or a integer between 0 and 32.
3280 - ``N``: Invalid immediate constraint.
3281 - ``O``: Invalid immediate constraint.
3282 - ``r``: A general-purpose 32-bit integer register (``r0-r15``).
3283 - ``l``: In Thumb2 mode, low 32-bit GPR registers (``r0-r7``). In ARM mode, same
3284   as ``r``.
3285 - ``h``: In Thumb2 mode, a high 32-bit GPR register (``r8-r15``). In ARM mode,
3286   invalid.
3287 - ``w``: A 32, 64, or 128-bit floating-point/SIMD register: ``s0-s31``,
3288   ``d0-d31``, or ``q0-q15``.
3289 - ``x``: A 32, 64, or 128-bit floating-point/SIMD register: ``s0-s15``,
3290   ``d0-d7``, or ``q0-q3``.
3291 - ``t``: A floating-point/SIMD register, only supports 32-bit values:
3292   ``s0-s31``.
3293
3294 ARM's Thumb1 mode:
3295
3296 - ``I``: An immediate integer between 0 and 255.
3297 - ``J``: An immediate integer between -255 and -1.
3298 - ``K``: An immediate integer between 0 and 255, with optional left-shift by
3299   some amount.
3300 - ``L``: An immediate integer between -7 and 7.
3301 - ``M``: An immediate integer which is a multiple of 4 between 0 and 1020.
3302 - ``N``: An immediate integer between 0 and 31.
3303 - ``O``: An immediate integer which is a multiple of 4 between -508 and 508.
3304 - ``r``: A low 32-bit GPR register (``r0-r7``).
3305 - ``l``: A low 32-bit GPR register (``r0-r7``).
3306 - ``h``: A high GPR register (``r0-r7``).
3307 - ``w``: A 32, 64, or 128-bit floating-point/SIMD register: ``s0-s31``,
3308   ``d0-d31``, or ``q0-q15``.
3309 - ``x``: A 32, 64, or 128-bit floating-point/SIMD register: ``s0-s15``,
3310   ``d0-d7``, or ``q0-q3``.
3311 - ``t``: A floating-point/SIMD register, only supports 32-bit values:
3312   ``s0-s31``.
3313
3314
3315 Hexagon:
3316
3317 - ``o``, ``v``: A memory address operand, treated the same as constraint ``m``,
3318   at the moment.
3319 - ``r``: A 32 or 64-bit register.
3320
3321 MSP430:
3322
3323 - ``r``: An 8 or 16-bit register.
3324
3325 MIPS:
3326
3327 - ``I``: An immediate signed 16-bit integer.
3328 - ``J``: An immediate integer zero.
3329 - ``K``: An immediate unsigned 16-bit integer.
3330 - ``L``: An immediate 32-bit integer, where the lower 16 bits are 0.
3331 - ``N``: An immediate integer between -65535 and -1.
3332 - ``O``: An immediate signed 15-bit integer.
3333 - ``P``: An immediate integer between 1 and 65535.
3334 - ``m``: A memory address operand. In MIPS-SE mode, allows a base address
3335   register plus 16-bit immediate offset. In MIPS mode, just a base register.
3336 - ``R``: A memory address operand. In MIPS-SE mode, allows a base address
3337   register plus a 9-bit signed offset. In MIPS mode, the same as constraint
3338   ``m``.
3339 - ``ZC``: A memory address operand, suitable for use in a ``pref``, ``ll``, or
3340   ``sc`` instruction on the given subtarget (details vary).
3341 - ``r``, ``d``,  ``y``: A 32 or 64-bit GPR register.
3342 - ``f``: A 32 or 64-bit FPU register (``F0-F31``), or a 128-bit MSA register
3343   (``W0-W31``). In the case of MSA registers, it is recommended to use the ``w``
3344   argument modifier for compatibility with GCC.
3345 - ``c``: A 32-bit or 64-bit GPR register suitable for indirect jump (always
3346   ``25``).
3347 - ``l``: The ``lo`` register, 32 or 64-bit.
3348 - ``x``: Invalid.
3349
3350 NVPTX:
3351
3352 - ``b``: A 1-bit integer register.
3353 - ``c`` or ``h``: A 16-bit integer register.
3354 - ``r``: A 32-bit integer register.
3355 - ``l`` or ``N``: A 64-bit integer register.
3356 - ``f``: A 32-bit float register.
3357 - ``d``: A 64-bit float register.
3358
3359
3360 PowerPC:
3361
3362 - ``I``: An immediate signed 16-bit integer.
3363 - ``J``: An immediate unsigned 16-bit integer, shifted left 16 bits.
3364 - ``K``: An immediate unsigned 16-bit integer.
3365 - ``L``: An immediate signed 16-bit integer, shifted left 16 bits.
3366 - ``M``: An immediate integer greater than 31.
3367 - ``N``: An immediate integer that is an exact power of 2.
3368 - ``O``: The immediate integer constant 0.
3369 - ``P``: An immediate integer constant whose negation is a signed 16-bit
3370   constant.
3371 - ``es``, ``o``, ``Q``, ``Z``, ``Zy``: A memory address operand, currently
3372   treated the same as ``m``.
3373 - ``r``: A 32 or 64-bit integer register.
3374 - ``b``: A 32 or 64-bit integer register, excluding ``R0`` (that is:
3375   ``R1-R31``).
3376 - ``f``: A 32 or 64-bit float register (``F0-F31``), or when QPX is enabled, a
3377   128 or 256-bit QPX register (``Q0-Q31``; aliases the ``F`` registers).
3378 - ``v``: For ``4 x f32`` or ``4 x f64`` types, when QPX is enabled, a
3379   128 or 256-bit QPX register (``Q0-Q31``), otherwise a 128-bit
3380   altivec vector register (``V0-V31``).
3381
3382   .. FIXME: is this a bug that v accepts QPX registers? I think this
3383      is supposed to only use the altivec vector registers?
3384
3385 - ``y``: Condition register (``CR0-CR7``).
3386 - ``wc``: An individual CR bit in a CR register.
3387 - ``wa``, ``wd``, ``wf``: Any 128-bit VSX vector register, from the full VSX
3388   register set (overlapping both the floating-point and vector register files).
3389 - ``ws``: A 32 or 64-bit floating point register, from the full VSX register
3390   set.
3391
3392 Sparc:
3393
3394 - ``I``: An immediate 13-bit signed integer.
3395 - ``r``: A 32-bit integer register.
3396
3397 SystemZ:
3398
3399 - ``I``: An immediate unsigned 8-bit integer.
3400 - ``J``: An immediate unsigned 12-bit integer.
3401 - ``K``: An immediate signed 16-bit integer.
3402 - ``L``: An immediate signed 20-bit integer.
3403 - ``M``: An immediate integer 0x7fffffff.
3404 - ``Q``, ``R``, ``S``, ``T``: A memory address operand, treated the same as
3405   ``m``, at the moment.
3406 - ``r`` or ``d``: A 32, 64, or 128-bit integer register.
3407 - ``a``: A 32, 64, or 128-bit integer address register (excludes R0, which in an
3408   address context evaluates as zero).
3409 - ``h``: A 32-bit value in the high part of a 64bit data register
3410   (LLVM-specific)
3411 - ``f``: A 32, 64, or 128-bit floating point register.
3412
3413 X86:
3414
3415 - ``I``: An immediate integer between 0 and 31.
3416 - ``J``: An immediate integer between 0 and 64.
3417 - ``K``: An immediate signed 8-bit integer.
3418 - ``L``: An immediate integer, 0xff or 0xffff or (in 64-bit mode only)
3419   0xffffffff.
3420 - ``M``: An immediate integer between 0 and 3.
3421 - ``N``: An immediate unsigned 8-bit integer.
3422 - ``O``: An immediate integer between 0 and 127.
3423 - ``e``: An immediate 32-bit signed integer.
3424 - ``Z``: An immediate 32-bit unsigned integer.
3425 - ``o``, ``v``: Treated the same as ``m``, at the moment.
3426 - ``q``: An 8, 16, 32, or 64-bit register which can be accessed as an 8-bit
3427   ``l`` integer register. On X86-32, this is the ``a``, ``b``, ``c``, and ``d``
3428   registers, and on X86-64, it is all of the integer registers.
3429 - ``Q``: An 8, 16, 32, or 64-bit register which can be accessed as an 8-bit
3430   ``h`` integer register. This is the ``a``, ``b``, ``c``, and ``d`` registers.
3431 - ``r`` or ``l``: An 8, 16, 32, or 64-bit integer register.
3432 - ``R``: An 8, 16, 32, or 64-bit "legacy" integer register -- one which has
3433   existed since i386, and can be accessed without the REX prefix.
3434 - ``f``: A 32, 64, or 80-bit '387 FPU stack pseudo-register.
3435 - ``y``: A 64-bit MMX register, if MMX is enabled.
3436 - ``x``: If SSE is enabled: a 32 or 64-bit scalar operand, or 128-bit vector
3437   operand in a SSE register. If AVX is also enabled, can also be a 256-bit
3438   vector operand in an AVX register. If AVX-512 is also enabled, can also be a
3439   512-bit vector operand in an AVX512 register, Otherwise, an error.
3440 - ``Y``: The same as ``x``, if *SSE2* is enabled, otherwise an error.
3441 - ``A``: Special case: allocates EAX first, then EDX, for a single operand (in
3442   32-bit mode, a 64-bit integer operand will get split into two registers). It
3443   is not recommended to use this constraint, as in 64-bit mode, the 64-bit
3444   operand will get allocated only to RAX -- if two 32-bit operands are needed,
3445   you're better off splitting it yourself, before passing it to the asm
3446   statement.
3447
3448 XCore:
3449
3450 - ``r``: A 32-bit integer register.
3451
3452
3453 .. _inline-asm-modifiers:
3454
3455 Asm template argument modifiers
3456 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
3457
3458 In the asm template string, modifiers can be used on the operand reference, like
3459 "``${0:n}``".
3460
3461 The modifiers are, in general, expected to behave the same way they do in
3462 GCC. LLVM's support is often implemented on an 'as-needed' basis, to support C
3463 inline asm code which was supported by GCC. A mismatch in behavior between LLVM
3464 and GCC likely indicates a bug in LLVM.
3465
3466 Target-independent:
3467
3468 - ``c``: Print an immediate integer constant unadorned, without
3469   the target-specific immediate punctuation (e.g. no ``$`` prefix).
3470 - ``n``: Negate and print immediate integer constant unadorned, without the
3471   target-specific immediate punctuation (e.g. no ``$`` prefix).
3472 - ``l``: Print as an unadorned label, without the target-specific label
3473   punctuation (e.g. no ``$`` prefix).
3474
3475 AArch64:
3476
3477 - ``w``: Print a GPR register with a ``w*`` name instead of ``x*`` name. E.g.,
3478   instead of ``x30``, print ``w30``.
3479 - ``x``: Print a GPR register with a ``x*`` name. (this is the default, anyhow).
3480 - ``b``, ``h``, ``s``, ``d``, ``q``: Print a floating-point/SIMD register with a
3481   ``b*``, ``h*``, ``s*``, ``d*``, or ``q*`` name, rather than the default of
3482   ``v*``.
3483
3484 AMDGPU:
3485
3486 - ``r``: No effect.
3487
3488 ARM:
3489
3490 - ``a``: Print an operand as an address (with ``[`` and ``]`` surrounding a
3491   register).
3492 - ``P``: No effect.
3493 - ``q``: No effect.
3494 - ``y``: Print a VFP single-precision register as an indexed double (e.g. print
3495   as ``d4[1]`` instead of ``s9``)
3496 - ``B``: Bitwise invert and print an immediate integer constant without ``#``
3497   prefix.
3498 - ``L``: Print the low 16-bits of an immediate integer constant.
3499 - ``M``: Print as a register set suitable for ldm/stm. Also prints *all*
3500   register operands subsequent to the specified one (!), so use carefully.
3501 - ``Q``: Print the low-order register of a register-pair, or the low-order
3502   register of a two-register operand.
3503 - ``R``: Print the high-order register of a register-pair, or the high-order
3504   register of a two-register operand.
3505 - ``H``: Print the second register of a register-pair. (On a big-endian system,
3506   ``H`` is equivalent to ``Q``, and on little-endian system, ``H`` is equivalent
3507   to ``R``.)
3508
3509   .. FIXME: H doesn't currently support printing the second register
3510      of a two-register operand.
3511
3512 - ``e``: Print the low doubleword register of a NEON quad register.
3513 - ``f``: Print the high doubleword register of a NEON quad register.
3514 - ``m``: Print the base register of a memory operand without the ``[`` and ``]``
3515   adornment.
3516
3517 Hexagon:
3518
3519 - ``L``: Print the second register of a two-register operand. Requires that it
3520   has been allocated consecutively to the first.
3521
3522   .. FIXME: why is it restricted to consecutive ones? And there's
3523      nothing that ensures that happens, is there?
3524
3525 - ``I``: Print the letter 'i' if the operand is an integer constant, otherwise
3526   nothing. Used to print 'addi' vs 'add' instructions.
3527
3528 MSP430:
3529
3530 No additional modifiers.
3531
3532 MIPS:
3533
3534 - ``X``: Print an immediate integer as hexadecimal
3535 - ``x``: Print the low 16 bits of an immediate integer as hexadecimal.
3536 - ``d``: Print an immediate integer as decimal.
3537 - ``m``: Subtract one and print an immediate integer as decimal.
3538 - ``z``: Print $0 if an immediate zero, otherwise print normally.
3539 - ``L``: Print the low-order register of a two-register operand, or prints the
3540   address of the low-order word of a double-word memory operand.
3541
3542   .. FIXME: L seems to be missing memory operand support.
3543
3544 - ``M``: Print the high-order register of a two-register operand, or prints the
3545   address of the high-order word of a double-word memory operand.
3546
3547   .. FIXME: M seems to be missing memory operand support.
3548
3549 - ``D``: Print the second register of a two-register operand, or prints the
3550   second word of a double-word memory operand. (On a big-endian system, ``D`` is
3551   equivalent to ``L``, and on little-endian system, ``D`` is equivalent to
3552   ``M``.)
3553 - ``w``: No effect. Provided for compatibility with GCC which requires this
3554   modifier in order to print MSA registers (``W0-W31``) with the ``f``
3555   constraint.
3556
3557 NVPTX:
3558
3559 - ``r``: No effect.
3560
3561 PowerPC:
3562
3563 - ``L``: Print the second register of a two-register operand. Requires that it
3564   has been allocated consecutively to the first.
3565
3566   .. FIXME: why is it restricted to consecutive ones? And there's
3567      nothing that ensures that happens, is there?
3568
3569 - ``I``: Print the letter 'i' if the operand is an integer constant, otherwise
3570   nothing. Used to print 'addi' vs 'add' instructions.
3571 - ``y``: For a memory operand, prints formatter for a two-register X-form
3572   instruction. (Currently always prints ``r0,OPERAND``).
3573 - ``U``: Prints 'u' if the memory operand is an update form, and nothing
3574   otherwise. (NOTE: LLVM does not support update form, so this will currently
3575   always print nothing)
3576 - ``X``: Prints 'x' if the memory operand is an indexed form. (NOTE: LLVM does
3577   not support indexed form, so this will currently always print nothing)
3578
3579 Sparc:
3580
3581 - ``r``: No effect.
3582
3583 SystemZ:
3584
3585 SystemZ implements only ``n``, and does *not* support any of the other
3586 target-independent modifiers.
3587
3588 X86:
3589
3590 - ``c``: Print an unadorned integer or symbol name. (The latter is
3591   target-specific behavior for this typically target-independent modifier).
3592 - ``A``: Print a register name with a '``*``' before it.
3593 - ``b``: Print an 8-bit register name (e.g. ``al``); do nothing on a memory
3594   operand.
3595 - ``h``: Print the upper 8-bit register name (e.g. ``ah``); do nothing on a
3596   memory operand.
3597 - ``w``: Print the 16-bit register name (e.g. ``ax``); do nothing on a memory
3598   operand.
3599 - ``k``: Print the 32-bit register name (e.g. ``eax``); do nothing on a memory
3600   operand.
3601 - ``q``: Print the 64-bit register name (e.g. ``rax``), if 64-bit registers are
3602   available, otherwise the 32-bit register name; do nothing on a memory operand.
3603 - ``n``: Negate and print an unadorned integer, or, for operands other than an
3604   immediate integer (e.g. a relocatable symbol expression), print a '-' before
3605   the operand. (The behavior for relocatable symbol expressions is a
3606   target-specific behavior for this typically target-independent modifier)
3607 - ``H``: Print a memory reference with additional offset +8.
3608 - ``P``: Print a memory reference or operand for use as the argument of a call
3609   instruction. (E.g. omit ``(rip)``, even though it's PC-relative.)
3610
3611 XCore:
3612
3613 No additional modifiers.
3614
3615
3616 Inline Asm Metadata
3617 ^^^^^^^^^^^^^^^^^^^
3618
3619 The call instructions that wrap inline asm nodes may have a
3620 "``!srcloc``" MDNode attached to it that contains a list of constant
3621 integers. If present, the code generator will use the integer as the
3622 location cookie value when report errors through the ``LLVMContext``
3623 error reporting mechanisms. This allows a front-end to correlate backend
3624 errors that occur with inline asm back to the source code that produced
3625 it. For example:
3626
3627 .. code-block:: llvm
3628
3629     call void asm sideeffect "something bad", ""(), !srcloc !42
3630     ...
3631     !42 = !{ i32 1234567 }
3632
3633 It is up to the front-end to make sense of the magic numbers it places
3634 in the IR. If the MDNode contains multiple constants, the code generator
3635 will use the one that corresponds to the line of the asm that the error
3636 occurs on.
3637
3638 .. _metadata:
3639
3640 Metadata
3641 ========
3642
3643 LLVM IR allows metadata to be attached to instructions in the program
3644 that can convey extra information about the code to the optimizers and
3645 code generator. One example application of metadata is source-level
3646 debug information. There are two metadata primitives: strings and nodes.
3647
3648 Metadata does not have a type, and is not a value. If referenced from a
3649 ``call`` instruction, it uses the ``metadata`` type.
3650
3651 All metadata are identified in syntax by a exclamation point ('``!``').
3652
3653 .. _metadata-string:
3654
3655 Metadata Nodes and Metadata Strings
3656 -----------------------------------
3657
3658 A metadata string is a string surrounded by double quotes. It can
3659 contain any character by escaping non-printable characters with
3660 "``\xx``" where "``xx``" is the two digit hex code. For example:
3661 "``!"test\00"``".
3662
3663 Metadata nodes are represented with notation similar to structure
3664 constants (a comma separated list of elements, surrounded by braces and
3665 preceded by an exclamation point). Metadata nodes can have any values as
3666 their operand. For example:
3667
3668 .. code-block:: llvm
3669
3670     !{ !"test\00", i32 10}
3671
3672 Metadata nodes that aren't uniqued use the ``distinct`` keyword. For example:
3673
3674 .. code-block:: llvm
3675
3676     !0 = distinct !{!"test\00", i32 10}
3677
3678 ``distinct`` nodes are useful when nodes shouldn't be merged based on their
3679 content. They can also occur when transformations cause uniquing collisions
3680 when metadata operands change.
3681
3682 A :ref:`named metadata <namedmetadatastructure>` is a collection of
3683 metadata nodes, which can be looked up in the module symbol table. For
3684 example:
3685
3686 .. code-block:: llvm
3687
3688     !foo = !{!4, !3}
3689
3690 Metadata can be used as function arguments. Here ``llvm.dbg.value``
3691 function is using two metadata arguments:
3692
3693 .. code-block:: llvm
3694
3695     call void @llvm.dbg.value(metadata !24, i64 0, metadata !25)
3696
3697 Metadata can be attached to an instruction. Here metadata ``!21`` is attached
3698 to the ``add`` instruction using the ``!dbg`` identifier:
3699
3700 .. code-block:: llvm
3701
3702     %indvar.next = add i64 %indvar, 1, !dbg !21
3703
3704 Metadata can also be attached to a function definition. Here metadata ``!22``
3705 is attached to the ``foo`` function using the ``!dbg`` identifier:
3706
3707 .. code-block:: llvm
3708
3709     define void @foo() !dbg !22 {
3710       ret void
3711     }
3712
3713 More information about specific metadata nodes recognized by the
3714 optimizers and code generator is found below.
3715
3716 .. _specialized-metadata:
3717
3718 Specialized Metadata Nodes
3719 ^^^^^^^^^^^^^^^^^^^^^^^^^^
3720
3721 Specialized metadata nodes are custom data structures in metadata (as opposed
3722 to generic tuples). Their fields are labelled, and can be specified in any
3723 order.
3724
3725 These aren't inherently debug info centric, but currently all the specialized
3726 metadata nodes are related to debug info.
3727
3728 .. _DICompileUnit:
3729
3730 DICompileUnit
3731 """""""""""""
3732
3733 ``DICompileUnit`` nodes represent a compile unit. The ``enums:``,
3734 ``retainedTypes:``, ``subprograms:``, ``globals:`` and ``imports:`` fields are
3735 tuples containing the debug info to be emitted along with the compile unit,
3736 regardless of code optimizations (some nodes are only emitted if there are
3737 references to them from instructions).
3738
3739 .. code-block:: llvm
3740
3741     !0 = !DICompileUnit(language: DW_LANG_C99, file: !1, producer: "clang",
3742                         isOptimized: true, flags: "-O2", runtimeVersion: 2,
3743                         splitDebugFilename: "abc.debug", emissionKind: 1,
3744                         enums: !2, retainedTypes: !3, subprograms: !4,
3745                         globals: !5, imports: !6)
3746
3747 Compile unit descriptors provide the root scope for objects declared in a
3748 specific compilation unit. File descriptors are defined using this scope.
3749 These descriptors are collected by a named metadata ``!llvm.dbg.cu``. They
3750 keep track of subprograms, global variables, type information, and imported
3751 entities (declarations and namespaces).
3752
3753 .. _DIFile:
3754
3755 DIFile
3756 """"""
3757
3758 ``DIFile`` nodes represent files. The ``filename:`` can include slashes.
3759
3760 .. code-block:: llvm
3761
3762     !0 = !DIFile(filename: "path/to/file", directory: "/path/to/dir")
3763
3764 Files are sometimes used in ``scope:`` fields, and are the only valid target
3765 for ``file:`` fields.
3766
3767 .. _DIBasicType:
3768
3769 DIBasicType
3770 """""""""""
3771
3772 ``DIBasicType`` nodes represent primitive types, such as ``int``, ``bool`` and
3773 ``float``. ``tag:`` defaults to ``DW_TAG_base_type``.
3774
3775 .. code-block:: llvm
3776
3777     !0 = !DIBasicType(name: "unsigned char", size: 8, align: 8,
3778                       encoding: DW_ATE_unsigned_char)
3779     !1 = !DIBasicType(tag: DW_TAG_unspecified_type, name: "decltype(nullptr)")
3780
3781 The ``encoding:`` describes the details of the type. Usually it's one of the
3782 following:
3783
3784 .. code-block:: llvm
3785
3786   DW_ATE_address       = 1
3787   DW_ATE_boolean       = 2
3788   DW_ATE_float         = 4
3789   DW_ATE_signed        = 5
3790   DW_ATE_signed_char   = 6
3791   DW_ATE_unsigned      = 7
3792   DW_ATE_unsigned_char = 8
3793
3794 .. _DISubroutineType:
3795
3796 DISubroutineType
3797 """"""""""""""""
3798
3799 ``DISubroutineType`` nodes represent subroutine types. Their ``types:`` field
3800 refers to a tuple; the first operand is the return type, while the rest are the
3801 types of the formal arguments in order. If the first operand is ``null``, that
3802 represents a function with no return value (such as ``void foo() {}`` in C++).
3803
3804 .. code-block:: llvm
3805
3806     !0 = !BasicType(name: "int", size: 32, align: 32, DW_ATE_signed)
3807     !1 = !BasicType(name: "char", size: 8, align: 8, DW_ATE_signed_char)
3808     !2 = !DISubroutineType(types: !{null, !0, !1}) ; void (int, char)
3809
3810 .. _DIDerivedType:
3811
3812 DIDerivedType
3813 """""""""""""
3814
3815 ``DIDerivedType`` nodes represent types derived from other types, such as
3816 qualified types.
3817
3818 .. code-block:: llvm
3819
3820     !0 = !DIBasicType(name: "unsigned char", size: 8, align: 8,
3821                       encoding: DW_ATE_unsigned_char)
3822     !1 = !DIDerivedType(tag: DW_TAG_pointer_type, baseType: !0, size: 32,
3823                         align: 32)
3824
3825 The following ``tag:`` values are valid:
3826
3827 .. code-block:: llvm
3828
3829   DW_TAG_formal_parameter   = 5
3830   DW_TAG_member             = 13
3831   DW_TAG_pointer_type       = 15
3832   DW_TAG_reference_type     = 16
3833   DW_TAG_typedef            = 22
3834   DW_TAG_ptr_to_member_type = 31
3835   DW_TAG_const_type         = 38
3836   DW_TAG_volatile_type      = 53
3837   DW_TAG_restrict_type      = 55
3838
3839 ``DW_TAG_member`` is used to define a member of a :ref:`composite type
3840 <DICompositeType>` or :ref:`subprogram <DISubprogram>`. The type of the member
3841 is the ``baseType:``. The ``offset:`` is the member's bit offset.
3842 ``DW_TAG_formal_parameter`` is used to define a member which is a formal
3843 argument of a subprogram.
3844
3845 ``DW_TAG_typedef`` is used to provide a name for the ``baseType:``.
3846
3847 ``DW_TAG_pointer_type``, ``DW_TAG_reference_type``, ``DW_TAG_const_type``,
3848 ``DW_TAG_volatile_type`` and ``DW_TAG_restrict_type`` are used to qualify the
3849 ``baseType:``.
3850
3851 Note that the ``void *`` type is expressed as a type derived from NULL.
3852
3853 .. _DICompositeType:
3854
3855 DICompositeType
3856 """""""""""""""
3857
3858 ``DICompositeType`` nodes represent types composed of other types, like
3859 structures and unions. ``elements:`` points to a tuple of the composed types.
3860
3861 If the source language supports ODR, the ``identifier:`` field gives the unique
3862 identifier used for type merging between modules. When specified, other types
3863 can refer to composite types indirectly via a :ref:`metadata string
3864 <metadata-string>` that matches their identifier.
3865
3866 .. code-block:: llvm
3867
3868     !0 = !DIEnumerator(name: "SixKind", value: 7)
3869     !1 = !DIEnumerator(name: "SevenKind", value: 7)
3870     !2 = !DIEnumerator(name: "NegEightKind", value: -8)
3871     !3 = !DICompositeType(tag: DW_TAG_enumeration_type, name: "Enum", file: !12,
3872                           line: 2, size: 32, align: 32, identifier: "_M4Enum",
3873                           elements: !{!0, !1, !2})
3874
3875 The following ``tag:`` values are valid:
3876
3877 .. code-block:: llvm
3878
3879   DW_TAG_array_type       = 1
3880   DW_TAG_class_type       = 2
3881   DW_TAG_enumeration_type = 4
3882   DW_TAG_structure_type   = 19
3883   DW_TAG_union_type       = 23
3884   DW_TAG_subroutine_type  = 21
3885   DW_TAG_inheritance      = 28
3886
3887
3888 For ``DW_TAG_array_type``, the ``elements:`` should be :ref:`subrange
3889 descriptors <DISubrange>`, each representing the range of subscripts at that
3890 level of indexing. The ``DIFlagVector`` flag to ``flags:`` indicates that an
3891 array type is a native packed vector.
3892
3893 For ``DW_TAG_enumeration_type``, the ``elements:`` should be :ref:`enumerator
3894 descriptors <DIEnumerator>`, each representing the definition of an enumeration
3895 value for the set. All enumeration type descriptors are collected in the
3896 ``enums:`` field of the :ref:`compile unit <DICompileUnit>`.
3897
3898 For ``DW_TAG_structure_type``, ``DW_TAG_class_type``, and
3899 ``DW_TAG_union_type``, the ``elements:`` should be :ref:`derived types
3900 <DIDerivedType>` with ``tag: DW_TAG_member`` or ``tag: DW_TAG_inheritance``.
3901
3902 .. _DISubrange:
3903
3904 DISubrange
3905 """"""""""
3906
3907 ``DISubrange`` nodes are the elements for ``DW_TAG_array_type`` variants of
3908 :ref:`DICompositeType`. ``count: -1`` indicates an empty array.
3909
3910 .. code-block:: llvm
3911
3912     !0 = !DISubrange(count: 5, lowerBound: 0) ; array counting from 0
3913     !1 = !DISubrange(count: 5, lowerBound: 1) ; array counting from 1
3914     !2 = !DISubrange(count: -1) ; empty array.
3915
3916 .. _DIEnumerator:
3917
3918 DIEnumerator
3919 """"""""""""
3920
3921 ``DIEnumerator`` nodes are the elements for ``DW_TAG_enumeration_type``
3922 variants of :ref:`DICompositeType`.
3923
3924 .. code-block:: llvm
3925
3926     !0 = !DIEnumerator(name: "SixKind", value: 7)
3927     !1 = !DIEnumerator(name: "SevenKind", value: 7)
3928     !2 = !DIEnumerator(name: "NegEightKind", value: -8)
3929
3930 DITemplateTypeParameter
3931 """""""""""""""""""""""
3932
3933 ``DITemplateTypeParameter`` nodes represent type parameters to generic source
3934 language constructs. They are used (optionally) in :ref:`DICompositeType` and
3935 :ref:`DISubprogram` ``templateParams:`` fields.
3936
3937 .. code-block:: llvm
3938
3939     !0 = !DITemplateTypeParameter(name: "Ty", type: !1)
3940
3941 DITemplateValueParameter
3942 """"""""""""""""""""""""
3943
3944 ``DITemplateValueParameter`` nodes represent value parameters to generic source
3945 language constructs. ``tag:`` defaults to ``DW_TAG_template_value_parameter``,
3946 but if specified can also be set to ``DW_TAG_GNU_template_template_param`` or
3947 ``DW_TAG_GNU_template_param_pack``. They are used (optionally) in
3948 :ref:`DICompositeType` and :ref:`DISubprogram` ``templateParams:`` fields.
3949
3950 .. code-block:: llvm
3951
3952     !0 = !DITemplateValueParameter(name: "Ty", type: !1, value: i32 7)
3953
3954 DINamespace
3955 """""""""""
3956
3957 ``DINamespace`` nodes represent namespaces in the source language.
3958
3959 .. code-block:: llvm
3960
3961     !0 = !DINamespace(name: "myawesomeproject", scope: !1, file: !2, line: 7)
3962
3963 DIGlobalVariable
3964 """"""""""""""""
3965
3966 ``DIGlobalVariable`` nodes represent global variables in the source language.
3967
3968 .. code-block:: llvm
3969
3970     !0 = !DIGlobalVariable(name: "foo", linkageName: "foo", scope: !1,
3971                            file: !2, line: 7, type: !3, isLocal: true,
3972                            isDefinition: false, variable: i32* @foo,
3973                            declaration: !4)
3974
3975 All global variables should be referenced by the `globals:` field of a
3976 :ref:`compile unit <DICompileUnit>`.
3977
3978 .. _DISubprogram:
3979
3980 DISubprogram
3981 """"""""""""
3982
3983 ``DISubprogram`` nodes represent functions from the source language. A
3984 ``DISubprogram`` may be attached to a function definition using ``!dbg``
3985 metadata. The ``variables:`` field points at :ref:`variables <DILocalVariable>`
3986 that must be retained, even if their IR counterparts are optimized out of
3987 the IR. The ``type:`` field must point at an :ref:`DISubroutineType`.
3988
3989 .. code-block:: llvm
3990
3991     define void @_Z3foov() !dbg !0 {
3992       ...
3993     }
3994
3995     !0 = distinct !DISubprogram(name: "foo", linkageName: "_Zfoov", scope: !1,
3996                                 file: !2, line: 7, type: !3, isLocal: true,
3997                                 isDefinition: false, scopeLine: 8,
3998                                 containingType: !4,
3999                                 virtuality: DW_VIRTUALITY_pure_virtual,
4000                                 virtualIndex: 10, flags: DIFlagPrototyped,
4001                                 isOptimized: true, templateParams: !5,
4002                                 declaration: !6, variables: !7)
4003
4004 .. _DILexicalBlock:
4005
4006 DILexicalBlock
4007 """"""""""""""
4008
4009 ``DILexicalBlock`` nodes describe nested blocks within a :ref:`subprogram
4010 <DISubprogram>`. The line number and column numbers are used to distinguish
4011 two lexical blocks at same depth. They are valid targets for ``scope:``
4012 fields.
4013
4014 .. code-block:: llvm
4015
4016     !0 = distinct !DILexicalBlock(scope: !1, file: !2, line: 7, column: 35)
4017
4018 Usually lexical blocks are ``distinct`` to prevent node merging based on
4019 operands.
4020
4021 .. _DILexicalBlockFile:
4022
4023 DILexicalBlockFile
4024 """"""""""""""""""
4025
4026 ``DILexicalBlockFile`` nodes are used to discriminate between sections of a
4027 :ref:`lexical block <DILexicalBlock>`. The ``file:`` field can be changed to
4028 indicate textual inclusion, or the ``discriminator:`` field can be used to
4029 discriminate between control flow within a single block in the source language.
4030
4031 .. code-block:: llvm
4032
4033     !0 = !DILexicalBlock(scope: !3, file: !4, line: 7, column: 35)
4034     !1 = !DILexicalBlockFile(scope: !0, file: !4, discriminator: 0)
4035     !2 = !DILexicalBlockFile(scope: !0, file: !4, discriminator: 1)
4036
4037 .. _DILocation:
4038
4039 DILocation
4040 """"""""""
4041
4042 ``DILocation`` nodes represent source debug locations. The ``scope:`` field is
4043 mandatory, and points at an :ref:`DILexicalBlockFile`, an
4044 :ref:`DILexicalBlock`, or an :ref:`DISubprogram`.
4045
4046 .. code-block:: llvm
4047
4048     !0 = !DILocation(line: 2900, column: 42, scope: !1, inlinedAt: !2)
4049
4050 .. _DILocalVariable:
4051
4052 DILocalVariable
4053 """""""""""""""
4054
4055 ``DILocalVariable`` nodes represent local variables in the source language. If
4056 the ``arg:`` field is set to non-zero, then this variable is a subprogram
4057 parameter, and it will be included in the ``variables:`` field of its
4058 :ref:`DISubprogram`.
4059
4060 .. code-block:: llvm
4061
4062     !0 = !DILocalVariable(name: "this", arg: 1, scope: !3, file: !2, line: 7,
4063                           type: !3, flags: DIFlagArtificial)
4064     !1 = !DILocalVariable(name: "x", arg: 2, scope: !4, file: !2, line: 7,
4065                           type: !3)
4066     !2 = !DILocalVariable(name: "y", scope: !5, file: !2, line: 7, type: !3)
4067
4068 DIExpression
4069 """"""""""""
4070
4071 ``DIExpression`` nodes represent DWARF expression sequences. They are used in
4072 :ref:`debug intrinsics<dbg_intrinsics>` (such as ``llvm.dbg.declare``) to
4073 describe how the referenced LLVM variable relates to the source language
4074 variable.
4075
4076 The current supported vocabulary is limited:
4077
4078 - ``DW_OP_deref`` dereferences the working expression.
4079 - ``DW_OP_plus, 93`` adds ``93`` to the working expression.
4080 - ``DW_OP_bit_piece, 16, 8`` specifies the offset and size (``16`` and ``8``
4081   here, respectively) of the variable piece from the working expression.
4082
4083 .. code-block:: llvm
4084
4085     !0 = !DIExpression(DW_OP_deref)
4086     !1 = !DIExpression(DW_OP_plus, 3)
4087     !2 = !DIExpression(DW_OP_bit_piece, 3, 7)
4088     !3 = !DIExpression(DW_OP_deref, DW_OP_plus, 3, DW_OP_bit_piece, 3, 7)
4089
4090 DIObjCProperty
4091 """"""""""""""
4092
4093 ``DIObjCProperty`` nodes represent Objective-C property nodes.
4094
4095 .. code-block:: llvm
4096
4097     !3 = !DIObjCProperty(name: "foo", file: !1, line: 7, setter: "setFoo",
4098                          getter: "getFoo", attributes: 7, type: !2)
4099
4100 DIImportedEntity
4101 """"""""""""""""
4102
4103 ``DIImportedEntity`` nodes represent entities (such as modules) imported into a
4104 compile unit.
4105
4106 .. code-block:: llvm
4107
4108    !2 = !DIImportedEntity(tag: DW_TAG_imported_module, name: "foo", scope: !0,
4109                           entity: !1, line: 7)
4110
4111 '``tbaa``' Metadata
4112 ^^^^^^^^^^^^^^^^^^^
4113
4114 In LLVM IR, memory does not have types, so LLVM's own type system is not
4115 suitable for doing TBAA. Instead, metadata is added to the IR to
4116 describe a type system of a higher level language. This can be used to
4117 implement typical C/C++ TBAA, but it can also be used to implement
4118 custom alias analysis behavior for other languages.
4119
4120 The current metadata format is very simple. TBAA metadata nodes have up
4121 to three fields, e.g.:
4122
4123 .. code-block:: llvm
4124
4125     !0 = !{ !"an example type tree" }
4126     !1 = !{ !"int", !0 }
4127     !2 = !{ !"float", !0 }
4128     !3 = !{ !"const float", !2, i64 1 }
4129
4130 The first field is an identity field. It can be any value, usually a
4131 metadata string, which uniquely identifies the type. The most important
4132 name in the tree is the name of the root node. Two trees with different
4133 root node names are entirely disjoint, even if they have leaves with
4134 common names.
4135
4136 The second field identifies the type's parent node in the tree, or is
4137 null or omitted for a root node. A type is considered to alias all of
4138 its descendants and all of its ancestors in the tree. Also, a type is
4139 considered to alias all types in other trees, so that bitcode produced
4140 from multiple front-ends is handled conservatively.
4141
4142 If the third field is present, it's an integer which if equal to 1
4143 indicates that the type is "constant" (meaning
4144 ``pointsToConstantMemory`` should return true; see `other useful
4145 AliasAnalysis methods <AliasAnalysis.html#OtherItfs>`_).
4146
4147 '``tbaa.struct``' Metadata
4148 ^^^^^^^^^^^^^^^^^^^^^^^^^^
4149
4150 The :ref:`llvm.memcpy <int_memcpy>` is often used to implement
4151 aggregate assignment operations in C and similar languages, however it
4152 is defined to copy a contiguous region of memory, which is more than
4153 strictly necessary for aggregate types which contain holes due to
4154 padding. Also, it doesn't contain any TBAA information about the fields
4155 of the aggregate.
4156
4157 ``!tbaa.struct`` metadata can describe which memory subregions in a
4158 memcpy are padding and what the TBAA tags of the struct are.
4159
4160 The current metadata format is very simple. ``!tbaa.struct`` metadata
4161 nodes are a list of operands which are in conceptual groups of three.
4162 For each group of three, the first operand gives the byte offset of a
4163 field in bytes, the second gives its size in bytes, and the third gives
4164 its tbaa tag. e.g.:
4165
4166 .. code-block:: llvm
4167
4168     !4 = !{ i64 0, i64 4, !1, i64 8, i64 4, !2 }
4169
4170 This describes a struct with two fields. The first is at offset 0 bytes
4171 with size 4 bytes, and has tbaa tag !1. The second is at offset 8 bytes
4172 and has size 4 bytes and has tbaa tag !2.
4173
4174 Note that the fields need not be contiguous. In this example, there is a
4175 4 byte gap between the two fields. This gap represents padding which
4176 does not carry useful data and need not be preserved.
4177
4178 '``noalias``' and '``alias.scope``' Metadata
4179 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4180
4181 ``noalias`` and ``alias.scope`` metadata provide the ability to specify generic
4182 noalias memory-access sets. This means that some collection of memory access
4183 instructions (loads, stores, memory-accessing calls, etc.) that carry
4184 ``noalias`` metadata can specifically be specified not to alias with some other
4185 collection of memory access instructions that carry ``alias.scope`` metadata.
4186 Each type of metadata specifies a list of scopes where each scope has an id and
4187 a domain. When evaluating an aliasing query, if for some domain, the set
4188 of scopes with that domain in one instruction's ``alias.scope`` list is a
4189 subset of (or equal to) the set of scopes for that domain in another
4190 instruction's ``noalias`` list, then the two memory accesses are assumed not to
4191 alias.
4192
4193 The metadata identifying each domain is itself a list containing one or two
4194 entries. The first entry is the name of the domain. Note that if the name is a
4195 string then it can be combined across functions and translation units. A
4196 self-reference can be used to create globally unique domain names. A
4197 descriptive string may optionally be provided as a second list entry.
4198
4199 The metadata identifying each scope is also itself a list containing two or
4200 three entries. The first entry is the name of the scope. Note that if the name
4201 is a string then it can be combined across functions and translation units. A
4202 self-reference can be used to create globally unique scope names. A metadata
4203 reference to the scope's domain is the second entry. A descriptive string may
4204 optionally be provided as a third list entry.
4205
4206 For example,
4207
4208 .. code-block:: llvm
4209
4210     ; Two scope domains:
4211     !0 = !{!0}
4212     !1 = !{!1}
4213
4214     ; Some scopes in these domains:
4215     !2 = !{!2, !0}
4216     !3 = !{!3, !0}
4217     !4 = !{!4, !1}
4218
4219     ; Some scope lists:
4220     !5 = !{!4} ; A list containing only scope !4
4221     !6 = !{!4, !3, !2}
4222     !7 = !{!3}
4223
4224     ; These two instructions don't alias:
4225     %0 = load float, float* %c, align 4, !alias.scope !5
4226     store float %0, float* %arrayidx.i, align 4, !noalias !5
4227
4228     ; These two instructions also don't alias (for domain !1, the set of scopes
4229     ; in the !alias.scope equals that in the !noalias list):
4230     %2 = load float, float* %c, align 4, !alias.scope !5
4231     store float %2, float* %arrayidx.i2, align 4, !noalias !6
4232
4233     ; These two instructions may alias (for domain !0, the set of scopes in
4234     ; the !noalias list is not a superset of, or equal to, the scopes in the
4235     ; !alias.scope list):
4236     %2 = load float, float* %c, align 4, !alias.scope !6
4237     store float %0, float* %arrayidx.i, align 4, !noalias !7
4238
4239 '``fpmath``' Metadata
4240 ^^^^^^^^^^^^^^^^^^^^^
4241
4242 ``fpmath`` metadata may be attached to any instruction of floating point
4243 type. It can be used to express the maximum acceptable error in the
4244 result of that instruction, in ULPs, thus potentially allowing the
4245 compiler to use a more efficient but less accurate method of computing
4246 it. ULP is defined as follows:
4247
4248     If ``x`` is a real number that lies between two finite consecutive
4249     floating-point numbers ``a`` and ``b``, without being equal to one
4250     of them, then ``ulp(x) = |b - a|``, otherwise ``ulp(x)`` is the
4251     distance between the two non-equal finite floating-point numbers
4252     nearest ``x``. Moreover, ``ulp(NaN)`` is ``NaN``.
4253
4254 The metadata node shall consist of a single positive floating point
4255 number representing the maximum relative error, for example:
4256
4257 .. code-block:: llvm
4258
4259     !0 = !{ float 2.5 } ; maximum acceptable inaccuracy is 2.5 ULPs
4260
4261 .. _range-metadata:
4262
4263 '``range``' Metadata
4264 ^^^^^^^^^^^^^^^^^^^^
4265
4266 ``range`` metadata may be attached only to ``load``, ``call`` and ``invoke`` of
4267 integer types. It expresses the possible ranges the loaded value or the value
4268 returned by the called function at this call site is in. The ranges are
4269 represented with a flattened list of integers. The loaded value or the value
4270 returned is known to be in the union of the ranges defined by each consecutive
4271 pair. Each pair has the following properties:
4272
4273 -  The type must match the type loaded by the instruction.
4274 -  The pair ``a,b`` represents the range ``[a,b)``.
4275 -  Both ``a`` and ``b`` are constants.
4276 -  The range is allowed to wrap.
4277 -  The range should not represent the full or empty set. That is,
4278    ``a!=b``.
4279
4280 In addition, the pairs must be in signed order of the lower bound and
4281 they must be non-contiguous.
4282
4283 Examples:
4284
4285 .. code-block:: llvm
4286
4287       %a = load i8, i8* %x, align 1, !range !0 ; Can only be 0 or 1
4288       %b = load i8, i8* %y, align 1, !range !1 ; Can only be 255 (-1), 0 or 1
4289       %c = call i8 @foo(),       !range !2 ; Can only be 0, 1, 3, 4 or 5
4290       %d = invoke i8 @bar() to label %cont
4291              unwind label %lpad, !range !3 ; Can only be -2, -1, 3, 4 or 5
4292     ...
4293     !0 = !{ i8 0, i8 2 }
4294     !1 = !{ i8 255, i8 2 }
4295     !2 = !{ i8 0, i8 2, i8 3, i8 6 }
4296     !3 = !{ i8 -2, i8 0, i8 3, i8 6 }
4297
4298 '``unpredictable``' Metadata
4299 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4300
4301 ``unpredictable`` metadata may be attached to any branch or switch
4302 instruction. It can be used to express the unpredictability of control
4303 flow. Similar to the llvm.expect intrinsic, it may be used to alter
4304 optimizations related to compare and branch instructions. The metadata
4305 is treated as a boolean value; if it exists, it signals that the branch
4306 or switch that it is attached to is completely unpredictable.
4307
4308 '``llvm.loop``'
4309 ^^^^^^^^^^^^^^^
4310
4311 It is sometimes useful to attach information to loop constructs. Currently,
4312 loop metadata is implemented as metadata attached to the branch instruction
4313 in the loop latch block. This type of metadata refer to a metadata node that is
4314 guaranteed to be separate for each loop. The loop identifier metadata is
4315 specified with the name ``llvm.loop``.
4316
4317 The loop identifier metadata is implemented using a metadata that refers to
4318 itself to avoid merging it with any other identifier metadata, e.g.,
4319 during module linkage or function inlining. That is, each loop should refer
4320 to their own identification metadata even if they reside in separate functions.
4321 The following example contains loop identifier metadata for two separate loop
4322 constructs:
4323
4324 .. code-block:: llvm
4325
4326     !0 = !{!0}
4327     !1 = !{!1}
4328
4329 The loop identifier metadata can be used to specify additional
4330 per-loop metadata. Any operands after the first operand can be treated
4331 as user-defined metadata. For example the ``llvm.loop.unroll.count``
4332 suggests an unroll factor to the loop unroller:
4333
4334 .. code-block:: llvm
4335
4336       br i1 %exitcond, label %._crit_edge, label %.lr.ph, !llvm.loop !0
4337     ...
4338     !0 = !{!0, !1}
4339     !1 = !{!"llvm.loop.unroll.count", i32 4}
4340
4341 '``llvm.loop.vectorize``' and '``llvm.loop.interleave``'
4342 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4343
4344 Metadata prefixed with ``llvm.loop.vectorize`` or ``llvm.loop.interleave`` are
4345 used to control per-loop vectorization and interleaving parameters such as
4346 vectorization width and interleave count. These metadata should be used in
4347 conjunction with ``llvm.loop`` loop identification metadata. The
4348 ``llvm.loop.vectorize`` and ``llvm.loop.interleave`` metadata are only
4349 optimization hints and the optimizer will only interleave and vectorize loops if
4350 it believes it is safe to do so. The ``llvm.mem.parallel_loop_access`` metadata
4351 which contains information about loop-carried memory dependencies can be helpful
4352 in determining the safety of these transformations.
4353
4354 '``llvm.loop.interleave.count``' Metadata
4355 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4356
4357 This metadata suggests an interleave count to the loop interleaver.
4358 The first operand is the string ``llvm.loop.interleave.count`` and the
4359 second operand is an integer specifying the interleave count. For
4360 example:
4361
4362 .. code-block:: llvm
4363
4364    !0 = !{!"llvm.loop.interleave.count", i32 4}
4365
4366 Note that setting ``llvm.loop.interleave.count`` to 1 disables interleaving
4367 multiple iterations of the loop. If ``llvm.loop.interleave.count`` is set to 0
4368 then the interleave count will be determined automatically.
4369
4370 '``llvm.loop.vectorize.enable``' Metadata
4371 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4372
4373 This metadata selectively enables or disables vectorization for the loop. The
4374 first operand is the string ``llvm.loop.vectorize.enable`` and the second operand
4375 is a bit. If the bit operand value is 1 vectorization is enabled. A value of
4376 0 disables vectorization:
4377
4378 .. code-block:: llvm
4379
4380    !0 = !{!"llvm.loop.vectorize.enable", i1 0}
4381    !1 = !{!"llvm.loop.vectorize.enable", i1 1}
4382
4383 '``llvm.loop.vectorize.width``' Metadata
4384 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4385
4386 This metadata sets the target width of the vectorizer. The first
4387 operand is the string ``llvm.loop.vectorize.width`` and the second
4388 operand is an integer specifying the width. For example:
4389
4390 .. code-block:: llvm
4391
4392    !0 = !{!"llvm.loop.vectorize.width", i32 4}
4393
4394 Note that setting ``llvm.loop.vectorize.width`` to 1 disables
4395 vectorization of the loop. If ``llvm.loop.vectorize.width`` is set to
4396 0 or if the loop does not have this metadata the width will be
4397 determined automatically.
4398
4399 '``llvm.loop.unroll``'
4400 ^^^^^^^^^^^^^^^^^^^^^^
4401
4402 Metadata prefixed with ``llvm.loop.unroll`` are loop unrolling
4403 optimization hints such as the unroll factor. ``llvm.loop.unroll``
4404 metadata should be used in conjunction with ``llvm.loop`` loop
4405 identification metadata. The ``llvm.loop.unroll`` metadata are only
4406 optimization hints and the unrolling will only be performed if the
4407 optimizer believes it is safe to do so.
4408
4409 '``llvm.loop.unroll.count``' Metadata
4410 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4411
4412 This metadata suggests an unroll factor to the loop unroller. The
4413 first operand is the string ``llvm.loop.unroll.count`` and the second
4414 operand is a positive integer specifying the unroll factor. For
4415 example:
4416
4417 .. code-block:: llvm
4418
4419    !0 = !{!"llvm.loop.unroll.count", i32 4}
4420
4421 If the trip count of the loop is less than the unroll count the loop
4422 will be partially unrolled.
4423
4424 '``llvm.loop.unroll.disable``' Metadata
4425 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4426
4427 This metadata disables loop unrolling. The metadata has a single operand
4428 which is the string ``llvm.loop.unroll.disable``. For example:
4429
4430 .. code-block:: llvm
4431
4432    !0 = !{!"llvm.loop.unroll.disable"}
4433
4434 '``llvm.loop.unroll.runtime.disable``' Metadata
4435 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4436
4437 This metadata disables runtime loop unrolling. The metadata has a single
4438 operand which is the string ``llvm.loop.unroll.runtime.disable``. For example:
4439
4440 .. code-block:: llvm
4441
4442    !0 = !{!"llvm.loop.unroll.runtime.disable"}
4443
4444 '``llvm.loop.unroll.enable``' Metadata
4445 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4446
4447 This metadata suggests that the loop should be fully unrolled if the trip count
4448 is known at compile time and partially unrolled if the trip count is not known
4449 at compile time. The metadata has a single operand which is the string
4450 ``llvm.loop.unroll.enable``.  For example:
4451
4452 .. code-block:: llvm
4453
4454    !0 = !{!"llvm.loop.unroll.enable"}
4455
4456 '``llvm.loop.unroll.full``' Metadata
4457 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4458
4459 This metadata suggests that the loop should be unrolled fully. The
4460 metadata has a single operand which is the string ``llvm.loop.unroll.full``.
4461 For example:
4462
4463 .. code-block:: llvm
4464
4465    !0 = !{!"llvm.loop.unroll.full"}
4466
4467 '``llvm.mem``'
4468 ^^^^^^^^^^^^^^^
4469
4470 Metadata types used to annotate memory accesses with information helpful
4471 for optimizations are prefixed with ``llvm.mem``.
4472
4473 '``llvm.mem.parallel_loop_access``' Metadata
4474 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4475
4476 The ``llvm.mem.parallel_loop_access`` metadata refers to a loop identifier,
4477 or metadata containing a list of loop identifiers for nested loops.
4478 The metadata is attached to memory accessing instructions and denotes that
4479 no loop carried memory dependence exist between it and other instructions denoted
4480 with the same loop identifier.
4481
4482 Precisely, given two instructions ``m1`` and ``m2`` that both have the
4483 ``llvm.mem.parallel_loop_access`` metadata, with ``L1`` and ``L2`` being the
4484 set of loops associated with that metadata, respectively, then there is no loop
4485 carried dependence between ``m1`` and ``m2`` for loops in both ``L1`` and
4486 ``L2``.
4487
4488 As a special case, if all memory accessing instructions in a loop have
4489 ``llvm.mem.parallel_loop_access`` metadata that refers to that loop, then the
4490 loop has no loop carried memory dependences and is considered to be a parallel
4491 loop.
4492
4493 Note that if not all memory access instructions have such metadata referring to
4494 the loop, then the loop is considered not being trivially parallel. Additional
4495 memory dependence analysis is required to make that determination. As a fail
4496 safe mechanism, this causes loops that were originally parallel to be considered
4497 sequential (if optimization passes that are unaware of the parallel semantics
4498 insert new memory instructions into the loop body).
4499
4500 Example of a loop that is considered parallel due to its correct use of
4501 both ``llvm.loop`` and ``llvm.mem.parallel_loop_access``
4502 metadata types that refer to the same loop identifier metadata.
4503
4504 .. code-block:: llvm
4505
4506    for.body:
4507      ...
4508      %val0 = load i32, i32* %arrayidx, !llvm.mem.parallel_loop_access !0
4509      ...
4510      store i32 %val0, i32* %arrayidx1, !llvm.mem.parallel_loop_access !0
4511      ...
4512      br i1 %exitcond, label %for.end, label %for.body, !llvm.loop !0
4513
4514    for.end:
4515    ...
4516    !0 = !{!0}
4517
4518 It is also possible to have nested parallel loops. In that case the
4519 memory accesses refer to a list of loop identifier metadata nodes instead of
4520 the loop identifier metadata node directly:
4521
4522 .. code-block:: llvm
4523
4524    outer.for.body:
4525      ...
4526      %val1 = load i32, i32* %arrayidx3, !llvm.mem.parallel_loop_access !2
4527      ...
4528      br label %inner.for.body
4529
4530    inner.for.body:
4531      ...
4532      %val0 = load i32, i32* %arrayidx1, !llvm.mem.parallel_loop_access !0
4533      ...
4534      store i32 %val0, i32* %arrayidx2, !llvm.mem.parallel_loop_access !0
4535      ...
4536      br i1 %exitcond, label %inner.for.end, label %inner.for.body, !llvm.loop !1
4537
4538    inner.for.end:
4539      ...
4540      store i32 %val1, i32* %arrayidx4, !llvm.mem.parallel_loop_access !2
4541      ...
4542      br i1 %exitcond, label %outer.for.end, label %outer.for.body, !llvm.loop !2
4543
4544    outer.for.end:                                          ; preds = %for.body
4545    ...
4546    !0 = !{!1, !2} ; a list of loop identifiers
4547    !1 = !{!1} ; an identifier for the inner loop
4548    !2 = !{!2} ; an identifier for the outer loop
4549
4550 '``llvm.bitsets``'
4551 ^^^^^^^^^^^^^^^^^^
4552
4553 The ``llvm.bitsets`` global metadata is used to implement
4554 :doc:`bitsets <BitSets>`.
4555
4556 '``invariant.group``' Metadata
4557 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
4558
4559 The ``invariant.group`` metadata may be attached to ``load``/``store`` instructions.
4560 The existence of the ``invariant.group`` metadata on the instruction tells 
4561 the optimizer that every ``load`` and ``store`` to the same pointer operand 
4562 within the same invariant group can be assumed to load or store the same  
4563 value (but see the ``llvm.invariant.group.barrier`` intrinsic which affects 
4564 when two pointers are considered the same).
4565
4566 Examples:
4567
4568 .. code-block:: llvm
4569
4570    @unknownPtr = external global i8
4571    ...
4572    %ptr = alloca i8
4573    store i8 42, i8* %ptr, !invariant.group !0
4574    call void @foo(i8* %ptr)
4575    
4576    %a = load i8, i8* %ptr, !invariant.group !0 ; Can assume that value under %ptr didn't change
4577    call void @foo(i8* %ptr)
4578    %b = load i8, i8* %ptr, !invariant.group !1 ; Can't assume anything, because group changed
4579   
4580    %newPtr = call i8* @getPointer(i8* %ptr) 
4581    %c = load i8, i8* %newPtr, !invariant.group !0 ; Can't assume anything, because we only have information about %ptr
4582    
4583    %unknownValue = load i8, i8* @unknownPtr
4584    store i8 %unknownValue, i8* %ptr, !invariant.group !0 ; Can assume that %unknownValue == 42
4585    
4586    call void @foo(i8* %ptr)
4587    %newPtr2 = call i8* @llvm.invariant.group.barrier(i8* %ptr)
4588    %d = load i8, i8* %newPtr2, !invariant.group !0  ; Can't step through invariant.group.barrier to get value of %ptr
4589    
4590    ...
4591    declare void @foo(i8*)
4592    declare i8* @getPointer(i8*)
4593    declare i8* @llvm.invariant.group.barrier(i8*)
4594    
4595    !0 = !{!"magic ptr"}
4596    !1 = !{!"other ptr"}
4597
4598
4599
4600 Module Flags Metadata
4601 =====================
4602
4603 Information about the module as a whole is difficult to convey to LLVM's
4604 subsystems. The LLVM IR isn't sufficient to transmit this information.
4605 The ``llvm.module.flags`` named metadata exists in order to facilitate
4606 this. These flags are in the form of key / value pairs --- much like a
4607 dictionary --- making it easy for any subsystem who cares about a flag to
4608 look it up.
4609
4610 The ``llvm.module.flags`` metadata contains a list of metadata triplets.
4611 Each triplet has the following form:
4612
4613 -  The first element is a *behavior* flag, which specifies the behavior
4614    when two (or more) modules are merged together, and it encounters two
4615    (or more) metadata with the same ID. The supported behaviors are
4616    described below.
4617 -  The second element is a metadata string that is a unique ID for the
4618    metadata. Each module may only have one flag entry for each unique ID (not
4619    including entries with the **Require** behavior).
4620 -  The third element is the value of the flag.
4621
4622 When two (or more) modules are merged together, the resulting
4623 ``llvm.module.flags`` metadata is the union of the modules' flags. That is, for
4624 each unique metadata ID string, there will be exactly one entry in the merged
4625 modules ``llvm.module.flags`` metadata table, and the value for that entry will
4626 be determined by the merge behavior flag, as described below. The only exception
4627 is that entries with the *Require* behavior are always preserved.
4628
4629 The following behaviors are supported:
4630
4631 .. list-table::
4632    :header-rows: 1
4633    :widths: 10 90
4634
4635    * - Value
4636      - Behavior
4637
4638    * - 1
4639      - **Error**
4640            Emits an error if two values disagree, otherwise the resulting value
4641            is that of the operands.
4642
4643    * - 2
4644      - **Warning**
4645            Emits a warning if two values disagree. The result value will be the
4646            operand for the flag from the first module being linked.
4647
4648    * - 3
4649      - **Require**
4650            Adds a requirement that another module flag be present and have a
4651            specified value after linking is performed. The value must be a
4652            metadata pair, where the first element of the pair is the ID of the
4653            module flag to be restricted, and the second element of the pair is
4654            the value the module flag should be restricted to. This behavior can
4655            be used to restrict the allowable results (via triggering of an
4656            error) of linking IDs with the **Override** behavior.
4657
4658    * - 4
4659      - **Override**
4660            Uses the specified value, regardless of the behavior or value of the
4661            other module. If both modules specify **Override**, but the values
4662            differ, an error will be emitted.
4663
4664    * - 5
4665      - **Append**
4666            Appends the two values, which are required to be metadata nodes.
4667
4668    * - 6
4669      - **AppendUnique**
4670            Appends the two values, which are required to be metadata
4671            nodes. However, duplicate entries in the second list are dropped
4672            during the append operation.
4673
4674 It is an error for a particular unique flag ID to have multiple behaviors,
4675 except in the case of **Require** (which adds restrictions on another metadata
4676 value) or **Override**.
4677
4678 An example of module flags:
4679
4680 .. code-block:: llvm
4681
4682     !0 = !{ i32 1, !"foo", i32 1 }
4683     !1 = !{ i32 4, !"bar", i32 37 }
4684     !2 = !{ i32 2, !"qux", i32 42 }
4685     !3 = !{ i32 3, !"qux",
4686       !{
4687         !"foo", i32 1
4688       }
4689     }
4690     !llvm.module.flags = !{ !0, !1, !2, !3 }
4691
4692 -  Metadata ``!0`` has the ID ``!"foo"`` and the value '1'. The behavior
4693    if two or more ``!"foo"`` flags are seen is to emit an error if their
4694    values are not equal.
4695
4696 -  Metadata ``!1`` has the ID ``!"bar"`` and the value '37'. The
4697    behavior if two or more ``!"bar"`` flags are seen is to use the value
4698    '37'.
4699
4700 -  Metadata ``!2`` has the ID ``!"qux"`` and the value '42'. The
4701    behavior if two or more ``!"qux"`` flags are seen is to emit a
4702    warning if their values are not equal.
4703
4704 -  Metadata ``!3`` has the ID ``!"qux"`` and the value:
4705
4706    ::
4707
4708        !{ !"foo", i32 1 }
4709
4710    The behavior is to emit an error if the ``llvm.module.flags`` does not
4711    contain a flag with the ID ``!"foo"`` that has the value '1' after linking is
4712    performed.
4713
4714 Objective-C Garbage Collection Module Flags Metadata
4715 ----------------------------------------------------
4716
4717 On the Mach-O platform, Objective-C stores metadata about garbage
4718 collection in a special section called "image info". The metadata
4719 consists of a version number and a bitmask specifying what types of
4720 garbage collection are supported (if any) by the file. If two or more
4721 modules are linked together their garbage collection metadata needs to
4722 be merged rather than appended together.
4723
4724 The Objective-C garbage collection module flags metadata consists of the
4725 following key-value pairs:
4726
4727 .. list-table::
4728    :header-rows: 1
4729    :widths: 30 70
4730
4731    * - Key
4732      - Value
4733
4734    * - ``Objective-C Version``
4735      - **[Required]** --- The Objective-C ABI version. Valid values are 1 and 2.
4736
4737    * - ``Objective-C Image Info Version``
4738      - **[Required]** --- The version of the image info section. Currently
4739        always 0.
4740
4741    * - ``Objective-C Image Info Section``
4742      - **[Required]** --- The section to place the metadata. Valid values are
4743        ``"__OBJC, __image_info, regular"`` for Objective-C ABI version 1, and
4744        ``"__DATA,__objc_imageinfo, regular, no_dead_strip"`` for
4745        Objective-C ABI version 2.
4746
4747    * - ``Objective-C Garbage Collection``
4748      - **[Required]** --- Specifies whether garbage collection is supported or
4749        not. Valid values are 0, for no garbage collection, and 2, for garbage
4750        collection supported.
4751
4752    * - ``Objective-C GC Only``
4753      - **[Optional]** --- Specifies that only garbage collection is supported.
4754        If present, its value must be 6. This flag requires that the
4755        ``Objective-C Garbage Collection`` flag have the value 2.
4756
4757 Some important flag interactions:
4758
4759 -  If a module with ``Objective-C Garbage Collection`` set to 0 is
4760    merged with a module with ``Objective-C Garbage Collection`` set to
4761    2, then the resulting module has the
4762    ``Objective-C Garbage Collection`` flag set to 0.
4763 -  A module with ``Objective-C Garbage Collection`` set to 0 cannot be
4764    merged with a module with ``Objective-C GC Only`` set to 6.
4765
4766 Automatic Linker Flags Module Flags Metadata
4767 --------------------------------------------
4768
4769 Some targets support embedding flags to the linker inside individual object
4770 files. Typically this is used in conjunction with language extensions which
4771 allow source files to explicitly declare the libraries they depend on, and have
4772 these automatically be transmitted to the linker via object files.
4773
4774 These flags are encoded in the IR using metadata in the module flags section,
4775 using the ``Linker Options`` key. The merge behavior for this flag is required
4776 to be ``AppendUnique``, and the value for the key is expected to be a metadata
4777 node which should be a list of other metadata nodes, each of which should be a
4778 list of metadata strings defining linker options.
4779
4780 For example, the following metadata section specifies two separate sets of
4781 linker options, presumably to link against ``libz`` and the ``Cocoa``
4782 framework::
4783
4784     !0 = !{ i32 6, !"Linker Options",
4785        !{
4786           !{ !"-lz" },
4787           !{ !"-framework", !"Cocoa" } } }
4788     !llvm.module.flags = !{ !0 }
4789
4790 The metadata encoding as lists of lists of options, as opposed to a collapsed
4791 list of options, is chosen so that the IR encoding can use multiple option
4792 strings to specify e.g., a single library, while still having that specifier be
4793 preserved as an atomic element that can be recognized by a target specific
4794 assembly writer or object file emitter.
4795
4796 Each individual option is required to be either a valid option for the target's
4797 linker, or an option that is reserved by the target specific assembly writer or
4798 object file emitter. No other aspect of these options is defined by the IR.
4799
4800 C type width Module Flags Metadata
4801 ----------------------------------
4802
4803 The ARM backend emits a section into each generated object file describing the
4804 options that it was compiled with (in a compiler-independent way) to prevent
4805 linking incompatible objects, and to allow automatic library selection. Some
4806 of these options are not visible at the IR level, namely wchar_t width and enum
4807 width.
4808
4809 To pass this information to the backend, these options are encoded in module
4810 flags metadata, using the following key-value pairs:
4811
4812 .. list-table::
4813    :header-rows: 1
4814    :widths: 30 70
4815
4816    * - Key
4817      - Value
4818
4819    * - short_wchar
4820      - * 0 --- sizeof(wchar_t) == 4
4821        * 1 --- sizeof(wchar_t) == 2
4822
4823    * - short_enum
4824      - * 0 --- Enums are at least as large as an ``int``.
4825        * 1 --- Enums are stored in the smallest integer type which can
4826          represent all of its values.
4827
4828 For example, the following metadata section specifies that the module was
4829 compiled with a ``wchar_t`` width of 4 bytes, and the underlying type of an
4830 enum is the smallest type which can represent all of its values::
4831
4832     !llvm.module.flags = !{!0, !1}
4833     !0 = !{i32 1, !"short_wchar", i32 1}
4834     !1 = !{i32 1, !"short_enum", i32 0}
4835
4836 .. _intrinsicglobalvariables:
4837
4838 Intrinsic Global Variables
4839 ==========================
4840
4841 LLVM has a number of "magic" global variables that contain data that
4842 affect code generation or other IR semantics. These are documented here.
4843 All globals of this sort should have a section specified as
4844 "``llvm.metadata``". This section and all globals that start with
4845 "``llvm.``" are reserved for use by LLVM.
4846
4847 .. _gv_llvmused:
4848
4849 The '``llvm.used``' Global Variable
4850 -----------------------------------
4851
4852 The ``@llvm.used`` global is an array which has
4853 :ref:`appending linkage <linkage_appending>`. This array contains a list of
4854 pointers to named global variables, functions and aliases which may optionally
4855 have a pointer cast formed of bitcast or getelementptr. For example, a legal
4856 use of it is:
4857
4858 .. code-block:: llvm
4859
4860     @X = global i8 4
4861     @Y = global i32 123
4862
4863     @llvm.used = appending global [2 x i8*] [
4864        i8* @X,
4865        i8* bitcast (i32* @Y to i8*)
4866     ], section "llvm.metadata"
4867
4868 If a symbol appears in the ``@llvm.used`` list, then the compiler, assembler,
4869 and linker are required to treat the symbol as if there is a reference to the
4870 symbol that it cannot see (which is why they have to be named). For example, if
4871 a variable has internal linkage and no references other than that from the
4872 ``@llvm.used`` list, it cannot be deleted. This is commonly used to represent
4873 references from inline asms and other things the compiler cannot "see", and
4874 corresponds to "``attribute((used))``" in GNU C.
4875
4876 On some targets, the code generator must emit a directive to the
4877 assembler or object file to prevent the assembler and linker from
4878 molesting the symbol.
4879
4880 .. _gv_llvmcompilerused:
4881
4882 The '``llvm.compiler.used``' Global Variable
4883 --------------------------------------------
4884
4885 The ``@llvm.compiler.used`` directive is the same as the ``@llvm.used``
4886 directive, except that it only prevents the compiler from touching the
4887 symbol. On targets that support it, this allows an intelligent linker to
4888 optimize references to the symbol without being impeded as it would be
4889 by ``@llvm.used``.
4890
4891 This is a rare construct that should only be used in rare circumstances,
4892 and should not be exposed to source languages.
4893
4894 .. _gv_llvmglobalctors:
4895
4896 The '``llvm.global_ctors``' Global Variable
4897 -------------------------------------------
4898
4899 .. code-block:: llvm
4900
4901     %0 = type { i32, void ()*, i8* }
4902     @llvm.global_ctors = appending global [1 x %0] [%0 { i32 65535, void ()* @ctor, i8* @data }]
4903
4904 The ``@llvm.global_ctors`` array contains a list of constructor
4905 functions, priorities, and an optional associated global or function.
4906 The functions referenced by this array will be called in ascending order
4907 of priority (i.e. lowest first) when the module is loaded. The order of
4908 functions with the same priority is not defined.
4909
4910 If the third field is present, non-null, and points to a global variable
4911 or function, the initializer function will only run if the associated
4912 data from the current module is not discarded.
4913
4914 .. _llvmglobaldtors:
4915
4916 The '``llvm.global_dtors``' Global Variable
4917 -------------------------------------------
4918
4919 .. code-block:: llvm
4920
4921     %0 = type { i32, void ()*, i8* }
4922     @llvm.global_dtors = appending global [1 x %0] [%0 { i32 65535, void ()* @dtor, i8* @data }]
4923
4924 The ``@llvm.global_dtors`` array contains a list of destructor
4925 functions, priorities, and an optional associated global or function.
4926 The functions referenced by this array will be called in descending
4927 order of priority (i.e. highest first) when the module is unloaded. The
4928 order of functions with the same priority is not defined.
4929
4930 If the third field is present, non-null, and points to a global variable
4931 or function, the destructor function will only run if the associated
4932 data from the current module is not discarded.
4933
4934 Instruction Reference
4935 =====================
4936
4937 The LLVM instruction set consists of several different classifications
4938 of instructions: :ref:`terminator instructions <terminators>`, :ref:`binary
4939 instructions <binaryops>`, :ref:`bitwise binary
4940 instructions <bitwiseops>`, :ref:`memory instructions <memoryops>`, and
4941 :ref:`other instructions <otherops>`.
4942
4943 .. _terminators:
4944
4945 Terminator Instructions
4946 -----------------------
4947
4948 As mentioned :ref:`previously <functionstructure>`, every basic block in a
4949 program ends with a "Terminator" instruction, which indicates which
4950 block should be executed after the current block is finished. These
4951 terminator instructions typically yield a '``void``' value: they produce
4952 control flow, not values (the one exception being the
4953 ':ref:`invoke <i_invoke>`' instruction).
4954
4955 The terminator instructions are: ':ref:`ret <i_ret>`',
4956 ':ref:`br <i_br>`', ':ref:`switch <i_switch>`',
4957 ':ref:`indirectbr <i_indirectbr>`', ':ref:`invoke <i_invoke>`',
4958 ':ref:`resume <i_resume>`', ':ref:`catchpad <i_catchpad>`',
4959 ':ref:`catchendpad <i_catchendpad>`',
4960 ':ref:`catchret <i_catchret>`',
4961 ':ref:`cleanupendpad <i_cleanupendpad>`',
4962 ':ref:`cleanupret <i_cleanupret>`',
4963 ':ref:`terminatepad <i_terminatepad>`',
4964 and ':ref:`unreachable <i_unreachable>`'.
4965
4966 .. _i_ret:
4967
4968 '``ret``' Instruction
4969 ^^^^^^^^^^^^^^^^^^^^^
4970
4971 Syntax:
4972 """""""
4973
4974 ::
4975
4976       ret <type> <value>       ; Return a value from a non-void function
4977       ret void                 ; Return from void function
4978
4979 Overview:
4980 """""""""
4981
4982 The '``ret``' instruction is used to return control flow (and optionally
4983 a value) from a function back to the caller.
4984
4985 There are two forms of the '``ret``' instruction: one that returns a
4986 value and then causes control flow, and one that just causes control
4987 flow to occur.
4988
4989 Arguments:
4990 """"""""""
4991
4992 The '``ret``' instruction optionally accepts a single argument, the
4993 return value. The type of the return value must be a ':ref:`first
4994 class <t_firstclass>`' type.
4995
4996 A function is not :ref:`well formed <wellformed>` if it it has a non-void
4997 return type and contains a '``ret``' instruction with no return value or
4998 a return value with a type that does not match its type, or if it has a
4999 void return type and contains a '``ret``' instruction with a return
5000 value.
5001
5002 Semantics:
5003 """"""""""
5004
5005 When the '``ret``' instruction is executed, control flow returns back to
5006 the calling function's context. If the caller is a
5007 ":ref:`call <i_call>`" instruction, execution continues at the
5008 instruction after the call. If the caller was an
5009 ":ref:`invoke <i_invoke>`" instruction, execution continues at the
5010 beginning of the "normal" destination block. If the instruction returns
5011 a value, that value shall set the call or invoke instruction's return
5012 value.
5013
5014 Example:
5015 """"""""
5016
5017 .. code-block:: llvm
5018
5019       ret i32 5                       ; Return an integer value of 5
5020       ret void                        ; Return from a void function
5021       ret { i32, i8 } { i32 4, i8 2 } ; Return a struct of values 4 and 2
5022
5023 .. _i_br:
5024
5025 '``br``' Instruction
5026 ^^^^^^^^^^^^^^^^^^^^
5027
5028 Syntax:
5029 """""""
5030
5031 ::
5032
5033       br i1 <cond>, label <iftrue>, label <iffalse>
5034       br label <dest>          ; Unconditional branch
5035
5036 Overview:
5037 """""""""
5038
5039 The '``br``' instruction is used to cause control flow to transfer to a
5040 different basic block in the current function. There are two forms of
5041 this instruction, corresponding to a conditional branch and an
5042 unconditional branch.
5043
5044 Arguments:
5045 """"""""""
5046
5047 The conditional branch form of the '``br``' instruction takes a single
5048 '``i1``' value and two '``label``' values. The unconditional form of the
5049 '``br``' instruction takes a single '``label``' value as a target.
5050
5051 Semantics:
5052 """"""""""
5053
5054 Upon execution of a conditional '``br``' instruction, the '``i1``'
5055 argument is evaluated. If the value is ``true``, control flows to the
5056 '``iftrue``' ``label`` argument. If "cond" is ``false``, control flows
5057 to the '``iffalse``' ``label`` argument.
5058
5059 Example:
5060 """"""""
5061
5062 .. code-block:: llvm
5063
5064     Test:
5065       %cond = icmp eq i32 %a, %b
5066       br i1 %cond, label %IfEqual, label %IfUnequal
5067     IfEqual:
5068       ret i32 1
5069     IfUnequal:
5070       ret i32 0
5071
5072 .. _i_switch:
5073
5074 '``switch``' Instruction
5075 ^^^^^^^^^^^^^^^^^^^^^^^^
5076
5077 Syntax:
5078 """""""
5079
5080 ::
5081
5082       switch <intty> <value>, label <defaultdest> [ <intty> <val>, label <dest> ... ]
5083
5084 Overview:
5085 """""""""
5086
5087 The '``switch``' instruction is used to transfer control flow to one of
5088 several different places. It is a generalization of the '``br``'
5089 instruction, allowing a branch to occur to one of many possible
5090 destinations.
5091
5092 Arguments:
5093 """"""""""
5094
5095 The '``switch``' instruction uses three parameters: an integer
5096 comparison value '``value``', a default '``label``' destination, and an
5097 array of pairs of comparison value constants and '``label``'s. The table
5098 is not allowed to contain duplicate constant entries.
5099
5100 Semantics:
5101 """"""""""
5102
5103 The ``switch`` instruction specifies a table of values and destinations.
5104 When the '``switch``' instruction is executed, this table is searched
5105 for the given value. If the value is found, control flow is transferred
5106 to the corresponding destination; otherwise, control flow is transferred
5107 to the default destination.
5108
5109 Implementation:
5110 """""""""""""""
5111
5112 Depending on properties of the target machine and the particular
5113 ``switch`` instruction, this instruction may be code generated in
5114 different ways. For example, it could be generated as a series of
5115 chained conditional branches or with a lookup table.
5116
5117 Example:
5118 """"""""
5119
5120 .. code-block:: llvm
5121
5122      ; Emulate a conditional br instruction
5123      %Val = zext i1 %value to i32
5124      switch i32 %Val, label %truedest [ i32 0, label %falsedest ]
5125
5126      ; Emulate an unconditional br instruction
5127      switch i32 0, label %dest [ ]
5128
5129      ; Implement a jump table:
5130      switch i32 %val, label %otherwise [ i32 0, label %onzero
5131                                          i32 1, label %onone
5132                                          i32 2, label %ontwo ]
5133
5134 .. _i_indirectbr:
5135
5136 '``indirectbr``' Instruction
5137 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
5138
5139 Syntax:
5140 """""""
5141
5142 ::
5143
5144       indirectbr <somety>* <address>, [ label <dest1>, label <dest2>, ... ]
5145
5146 Overview:
5147 """""""""
5148
5149 The '``indirectbr``' instruction implements an indirect branch to a
5150 label within the current function, whose address is specified by
5151 "``address``". Address must be derived from a
5152 :ref:`blockaddress <blockaddress>` constant.
5153
5154 Arguments:
5155 """"""""""
5156
5157 The '``address``' argument is the address of the label to jump to. The
5158 rest of the arguments indicate the full set of possible destinations
5159 that the address may point to. Blocks are allowed to occur multiple
5160 times in the destination list, though this isn't particularly useful.
5161
5162 This destination list is required so that dataflow analysis has an
5163 accurate understanding of the CFG.
5164
5165 Semantics:
5166 """"""""""
5167
5168 Control transfers to the block specified in the address argument. All
5169 possible destination blocks must be listed in the label list, otherwise
5170 this instruction has undefined behavior. This implies that jumps to
5171 labels defined in other functions have undefined behavior as well.
5172
5173 Implementation:
5174 """""""""""""""
5175
5176 This is typically implemented with a jump through a register.
5177
5178 Example:
5179 """"""""
5180
5181 .. code-block:: llvm
5182
5183      indirectbr i8* %Addr, [ label %bb1, label %bb2, label %bb3 ]
5184
5185 .. _i_invoke:
5186
5187 '``invoke``' Instruction
5188 ^^^^^^^^^^^^^^^^^^^^^^^^
5189
5190 Syntax:
5191 """""""
5192
5193 ::
5194
5195       <result> = invoke [cconv] [ret attrs] <ptr to function ty> <function ptr val>(<function args>) [fn attrs]
5196                     [operand bundles] to label <normal label> unwind label <exception label>
5197
5198 Overview:
5199 """""""""
5200
5201 The '``invoke``' instruction causes control to transfer to a specified
5202 function, with the possibility of control flow transfer to either the
5203 '``normal``' label or the '``exception``' label. If the callee function
5204 returns with the "``ret``" instruction, control flow will return to the
5205 "normal" label. If the callee (or any indirect callees) returns via the
5206 ":ref:`resume <i_resume>`" instruction or other exception handling
5207 mechanism, control is interrupted and continued at the dynamically
5208 nearest "exception" label.
5209
5210 The '``exception``' label is a `landing
5211 pad <ExceptionHandling.html#overview>`_ for the exception. As such,
5212 '``exception``' label is required to have the
5213 ":ref:`landingpad <i_landingpad>`" instruction, which contains the
5214 information about the behavior of the program after unwinding happens,
5215 as its first non-PHI instruction. The restrictions on the
5216 "``landingpad``" instruction's tightly couples it to the "``invoke``"
5217 instruction, so that the important information contained within the
5218 "``landingpad``" instruction can't be lost through normal code motion.
5219
5220 Arguments:
5221 """"""""""
5222
5223 This instruction requires several arguments:
5224
5225 #. The optional "cconv" marker indicates which :ref:`calling
5226    convention <callingconv>` the call should use. If none is
5227    specified, the call defaults to using C calling conventions.
5228 #. The optional :ref:`Parameter Attributes <paramattrs>` list for return
5229    values. Only '``zeroext``', '``signext``', and '``inreg``' attributes
5230    are valid here.
5231 #. '``ptr to function ty``': shall be the signature of the pointer to
5232    function value being invoked. In most cases, this is a direct
5233    function invocation, but indirect ``invoke``'s are just as possible,
5234    branching off an arbitrary pointer to function value.
5235 #. '``function ptr val``': An LLVM value containing a pointer to a
5236    function to be invoked.
5237 #. '``function args``': argument list whose types match the function
5238    signature argument types and parameter attributes. All arguments must
5239    be of :ref:`first class <t_firstclass>` type. If the function signature
5240    indicates the function accepts a variable number of arguments, the
5241    extra arguments can be specified.
5242 #. '``normal label``': the label reached when the called function
5243    executes a '``ret``' instruction.
5244 #. '``exception label``': the label reached when a callee returns via
5245    the :ref:`resume <i_resume>` instruction or other exception handling
5246    mechanism.
5247 #. The optional :ref:`function attributes <fnattrs>` list. Only
5248    '``noreturn``', '``nounwind``', '``readonly``' and '``readnone``'
5249    attributes are valid here.
5250 #. The optional :ref:`operand bundles <opbundles>` list.
5251
5252 Semantics:
5253 """"""""""
5254
5255 This instruction is designed to operate as a standard '``call``'
5256 instruction in most regards. The primary difference is that it
5257 establishes an association with a label, which is used by the runtime
5258 library to unwind the stack.
5259
5260 This instruction is used in languages with destructors to ensure that
5261 proper cleanup is performed in the case of either a ``longjmp`` or a
5262 thrown exception. Additionally, this is important for implementation of
5263 '``catch``' clauses in high-level languages that support them.
5264
5265 For the purposes of the SSA form, the definition of the value returned
5266 by the '``invoke``' instruction is deemed to occur on the edge from the
5267 current block to the "normal" label. If the callee unwinds then no
5268 return value is available.
5269
5270 Example:
5271 """"""""
5272
5273 .. code-block:: llvm
5274
5275       %retval = invoke i32 @Test(i32 15) to label %Continue
5276                   unwind label %TestCleanup              ; i32:retval set
5277       %retval = invoke coldcc i32 %Testfnptr(i32 15) to label %Continue
5278                   unwind label %TestCleanup              ; i32:retval set
5279
5280 .. _i_resume:
5281
5282 '``resume``' Instruction
5283 ^^^^^^^^^^^^^^^^^^^^^^^^
5284
5285 Syntax:
5286 """""""
5287
5288 ::
5289
5290       resume <type> <value>
5291
5292 Overview:
5293 """""""""
5294
5295 The '``resume``' instruction is a terminator instruction that has no
5296 successors.
5297
5298 Arguments:
5299 """"""""""
5300
5301 The '``resume``' instruction requires one argument, which must have the
5302 same type as the result of any '``landingpad``' instruction in the same
5303 function.
5304
5305 Semantics:
5306 """"""""""
5307
5308 The '``resume``' instruction resumes propagation of an existing
5309 (in-flight) exception whose unwinding was interrupted with a
5310 :ref:`landingpad <i_landingpad>` instruction.
5311
5312 Example:
5313 """"""""
5314
5315 .. code-block:: llvm
5316
5317       resume { i8*, i32 } %exn
5318
5319 .. _i_catchpad:
5320
5321 '``catchpad``' Instruction
5322 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
5323
5324 Syntax:
5325 """""""
5326
5327 ::
5328
5329       <resultval> = catchpad [<args>*]
5330           to label <normal label> unwind label <exception label>
5331
5332 Overview:
5333 """""""""
5334
5335 The '``catchpad``' instruction is used by `LLVM's exception handling
5336 system <ExceptionHandling.html#overview>`_ to specify that a basic block
5337 is a catch block --- one where a personality routine attempts to transfer
5338 control to catch an exception.
5339 The ``args`` correspond to whatever information the personality
5340 routine requires to know if this is an appropriate place to catch the
5341 exception. Control is transfered to the ``exception`` label if the
5342 ``catchpad`` is not an appropriate handler for the in-flight exception.
5343 The ``normal`` label should contain the code found in the ``catch``
5344 portion of a ``try``/``catch`` sequence. The ``resultval`` has the type
5345 :ref:`token <t_token>` and is used to match the ``catchpad`` to
5346 corresponding :ref:`catchrets <i_catchret>`.
5347
5348 Arguments:
5349 """"""""""
5350
5351 The instruction takes a list of arbitrary values which are interpreted
5352 by the :ref:`personality function <personalityfn>`.
5353
5354 The ``catchpad`` must be provided a ``normal`` label to transfer control
5355 to if the ``catchpad`` matches the exception and an ``exception``
5356 label to transfer control to if it doesn't.
5357
5358 Semantics:
5359 """"""""""
5360
5361 When the call stack is being unwound due to an exception being thrown,
5362 the exception is compared against the ``args``. If it doesn't match,
5363 then control is transfered to the ``exception`` basic block.
5364 As with calling conventions, how the personality function results are
5365 represented in LLVM IR is target specific.
5366
5367 The ``catchpad`` instruction has several restrictions:
5368
5369 -  A catch block is a basic block which is the unwind destination of
5370    an exceptional instruction.
5371 -  A catch block must have a '``catchpad``' instruction as its
5372    first non-PHI instruction.
5373 -  A catch block's ``exception`` edge must refer to a catch block or a
5374    catch-end block.
5375 -  There can be only one '``catchpad``' instruction within the
5376    catch block.
5377 -  A basic block that is not a catch block may not include a
5378    '``catchpad``' instruction.
5379 -  A catch block which has another catch block as a predecessor may not have
5380    any other predecessors.
5381 -  It is undefined behavior for control to transfer from a ``catchpad`` to a
5382    ``ret`` without first executing a ``catchret`` that consumes the
5383    ``catchpad`` or unwinding through its ``catchendpad``.
5384 -  It is undefined behavior for control to transfer from a ``catchpad`` to
5385    itself without first executing a ``catchret`` that consumes the
5386    ``catchpad`` or unwinding through its ``catchendpad``.
5387
5388 Example:
5389 """"""""
5390
5391 .. code-block:: llvm
5392
5393       ;; A catch block which can catch an integer.
5394       %tok = catchpad [i8** @_ZTIi]
5395         to label %int.handler unwind label %terminate
5396
5397 .. _i_catchendpad:
5398
5399 '``catchendpad``' Instruction
5400 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
5401
5402 Syntax:
5403 """""""
5404
5405 ::
5406
5407       catchendpad unwind label <nextaction>
5408       catchendpad unwind to caller
5409
5410 Overview:
5411 """""""""
5412
5413 The '``catchendpad``' instruction is used by `LLVM's exception handling
5414 system <ExceptionHandling.html#overview>`_ to communicate to the
5415 :ref:`personality function <personalityfn>` which invokes are associated
5416 with a chain of :ref:`catchpad <i_catchpad>` instructions; propagating an
5417 exception out of a catch handler is represented by unwinding through its
5418 ``catchendpad``.  Unwinding to the outer scope when a chain of catch handlers
5419 do not handle an exception is also represented by unwinding through their
5420 ``catchendpad``.
5421
5422 The ``nextaction`` label indicates where control should transfer to if
5423 none of the ``catchpad`` instructions are suitable for catching the
5424 in-flight exception.
5425
5426 If a ``nextaction`` label is not present, the instruction unwinds out of
5427 its parent function. The
5428 :ref:`personality function <personalityfn>` will continue processing
5429 exception handling actions in the caller.
5430
5431 Arguments:
5432 """"""""""
5433
5434 The instruction optionally takes a label, ``nextaction``, indicating
5435 where control should transfer to if none of the preceding
5436 ``catchpad`` instructions are suitable for the in-flight exception.
5437
5438 Semantics:
5439 """"""""""
5440
5441 When the call stack is being unwound due to an exception being thrown
5442 and none of the constituent ``catchpad`` instructions match, then
5443 control is transfered to ``nextaction`` if it is present. If it is not
5444 present, control is transfered to the caller.
5445
5446 The ``catchendpad`` instruction has several restrictions:
5447
5448 -  A catch-end block is a basic block which is the unwind destination of
5449    an exceptional instruction.
5450 -  A catch-end block must have a '``catchendpad``' instruction as its
5451    first non-PHI instruction.
5452 -  There can be only one '``catchendpad``' instruction within the
5453    catch-end block.
5454 -  A basic block that is not a catch-end block may not include a
5455    '``catchendpad``' instruction.
5456 -  Exactly one catch block may unwind to a ``catchendpad``.
5457 - It is undefined behavior to execute a ``catchendpad`` if none of the
5458   '``catchpad``'s chained to it have been executed.
5459 - It is undefined behavior to execute a ``catchendpad`` twice without an
5460   intervening execution of one or more of the '``catchpad``'s chained to it.
5461 - It is undefined behavior to execute a ``catchendpad`` if, after the most
5462   recent execution of the normal successor edge of any ``catchpad`` chained
5463   to it, some ``catchret`` consuming that ``catchpad`` has already been
5464   executed.
5465 - It is undefined behavior to execute a ``catchendpad`` if, after the most
5466   recent execution of the normal successor edge of any ``catchpad`` chained
5467   to it, any other ``catchpad`` or ``cleanuppad`` has been executed but has
5468   not had a corresponding
5469   ``catchret``/``cleanupret``/``catchendpad``/``cleanupendpad`` executed.
5470
5471 Example:
5472 """"""""
5473
5474 .. code-block:: llvm
5475
5476       catchendpad unwind label %terminate
5477       catchendpad unwind to caller
5478
5479 .. _i_catchret:
5480
5481 '``catchret``' Instruction
5482 ^^^^^^^^^^^^^^^^^^^^^^^^^^
5483
5484 Syntax:
5485 """""""
5486
5487 ::
5488
5489       catchret <value> to label <normal>
5490
5491 Overview:
5492 """""""""
5493
5494 The '``catchret``' instruction is a terminator instruction that has a
5495 single successor.
5496
5497
5498 Arguments:
5499 """"""""""
5500
5501 The first argument to a '``catchret``' indicates which ``catchpad`` it
5502 exits.  It must be a :ref:`catchpad <i_catchpad>`.
5503 The second argument to a '``catchret``' specifies where control will
5504 transfer to next.
5505
5506 Semantics:
5507 """"""""""
5508
5509 The '``catchret``' instruction ends the existing (in-flight) exception
5510 whose unwinding was interrupted with a
5511 :ref:`catchpad <i_catchpad>` instruction.
5512 The :ref:`personality function <personalityfn>` gets a chance to execute
5513 arbitrary code to, for example, run a C++ destructor.
5514 Control then transfers to ``normal``.
5515 It may be passed an optional, personality specific, value.
5516
5517 It is undefined behavior to execute a ``catchret`` whose ``catchpad`` has
5518 not been executed.
5519
5520 It is undefined behavior to execute a ``catchret`` if, after the most recent
5521 execution of its ``catchpad``, some ``catchret`` or ``catchendpad`` linked
5522 to the same ``catchpad`` has already been executed.
5523
5524 It is undefined behavior to execute a ``catchret`` if, after the most recent
5525 execution of its ``catchpad``, any other ``catchpad`` or ``cleanuppad`` has
5526 been executed but has not had a corresponding
5527 ``catchret``/``cleanupret``/``catchendpad``/``cleanupendpad`` executed.
5528
5529 Example:
5530 """"""""
5531
5532 .. code-block:: llvm
5533
5534       catchret %catch label %continue
5535
5536 .. _i_cleanupendpad:
5537
5538 '``cleanupendpad``' Instruction
5539 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
5540
5541 Syntax:
5542 """""""
5543
5544 ::
5545
5546       cleanupendpad <value> unwind label <nextaction>
5547       cleanupendpad <value> unwind to caller
5548
5549 Overview:
5550 """""""""
5551
5552 The '``cleanupendpad``' instruction is used by `LLVM's exception handling
5553 system <ExceptionHandling.html#overview>`_ to communicate to the
5554 :ref:`personality function <personalityfn>` which invokes are associated
5555 with a :ref:`cleanuppad <i_cleanuppad>` instructions; propagating an exception
5556 out of a cleanup is represented by unwinding through its ``cleanupendpad``.
5557
5558 The ``nextaction`` label indicates where control should unwind to next, in the
5559 event that a cleanup is exited by means of an(other) exception being raised.
5560
5561 If a ``nextaction`` label is not present, the instruction unwinds out of
5562 its parent function. The
5563 :ref:`personality function <personalityfn>` will continue processing
5564 exception handling actions in the caller.
5565
5566 Arguments:
5567 """"""""""
5568
5569 The '``cleanupendpad``' instruction requires one argument, which indicates
5570 which ``cleanuppad`` it exits, and must be a :ref:`cleanuppad <i_cleanuppad>`.
5571 It also has an optional successor, ``nextaction``, indicating where control
5572 should transfer to.
5573
5574 Semantics:
5575 """"""""""
5576
5577 When and exception propagates to a ``cleanupendpad``, control is transfered to
5578 ``nextaction`` if it is present. If it is not present, control is transfered to
5579 the caller.
5580
5581 The ``cleanupendpad`` instruction has several restrictions:
5582
5583 -  A cleanup-end block is a basic block which is the unwind destination of
5584    an exceptional instruction.
5585 -  A cleanup-end block must have a '``cleanupendpad``' instruction as its
5586    first non-PHI instruction.
5587 -  There can be only one '``cleanupendpad``' instruction within the
5588    cleanup-end block.
5589 -  A basic block that is not a cleanup-end block may not include a
5590    '``cleanupendpad``' instruction.
5591 - It is undefined behavior to execute a ``cleanupendpad`` whose ``cleanuppad``
5592   has not been executed.
5593 - It is undefined behavior to execute a ``cleanupendpad`` if, after the most
5594   recent execution of its ``cleanuppad``, some ``cleanupret`` or ``cleanupendpad``
5595   consuming the same ``cleanuppad`` has already been executed.
5596 - It is undefined behavior to execute a ``cleanupendpad`` if, after the most
5597   recent execution of its ``cleanuppad``, any other ``cleanuppad`` or
5598   ``catchpad`` has been executed but has not had a corresponding
5599   ``cleanupret``/``catchret``/``cleanupendpad``/``catchendpad`` executed.
5600
5601 Example:
5602 """"""""
5603
5604 .. code-block:: llvm
5605
5606       cleanupendpad %cleanup unwind label %terminate
5607       cleanupendpad %cleanup unwind to caller
5608
5609 .. _i_cleanupret:
5610
5611 '``cleanupret``' Instruction
5612 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
5613
5614 Syntax:
5615 """""""
5616
5617 ::
5618
5619       cleanupret <value> unwind label <continue>
5620       cleanupret <value> unwind to caller
5621
5622 Overview:
5623 """""""""
5624
5625 The '``cleanupret``' instruction is a terminator instruction that has
5626 an optional successor.
5627
5628
5629 Arguments:
5630 """"""""""
5631
5632 The '``cleanupret``' instruction requires one argument, which indicates
5633 which ``cleanuppad`` it exits, and must be a :ref:`cleanuppad <i_cleanuppad>`.
5634 It also has an optional successor, ``continue``.
5635
5636 Semantics:
5637 """"""""""
5638
5639 The '``cleanupret``' instruction indicates to the
5640 :ref:`personality function <personalityfn>` that one
5641 :ref:`cleanuppad <i_cleanuppad>` it transferred control to has ended.
5642 It transfers control to ``continue`` or unwinds out of the function.
5643
5644 It is undefined behavior to execute a ``cleanupret`` whose ``cleanuppad`` has
5645 not been executed.
5646
5647 It is undefined behavior to execute a ``cleanupret`` if, after the most recent
5648 execution of its ``cleanuppad``, some ``cleanupret`` or ``cleanupendpad``
5649 consuming the same ``cleanuppad`` has already been executed.
5650
5651 It is undefined behavior to execute a ``cleanupret`` if, after the most recent
5652 execution of its ``cleanuppad``, any other ``cleanuppad`` or ``catchpad`` has
5653 been executed but has not had a corresponding
5654 ``cleanupret``/``catchret``/``cleanupendpad``/``catchendpad`` executed.
5655
5656 Example:
5657 """"""""
5658
5659 .. code-block:: llvm
5660
5661       cleanupret %cleanup unwind to caller
5662       cleanupret %cleanup unwind label %continue
5663
5664 .. _i_terminatepad:
5665
5666 '``terminatepad``' Instruction
5667 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
5668
5669 Syntax:
5670 """""""
5671
5672 ::
5673
5674       terminatepad [<args>*] unwind label <exception label>
5675       terminatepad [<args>*] unwind to caller
5676
5677 Overview:
5678 """""""""
5679
5680 The '``terminatepad``' instruction is used by `LLVM's exception handling
5681 system <ExceptionHandling.html#overview>`_ to specify that a basic block
5682 is a terminate block --- one where a personality routine may decide to
5683 terminate the program.
5684 The ``args`` correspond to whatever information the personality
5685 routine requires to know if this is an appropriate place to terminate the
5686 program. Control is transferred to the ``exception`` label if the
5687 personality routine decides not to terminate the program for the
5688 in-flight exception.
5689
5690 Arguments:
5691 """"""""""
5692
5693 The instruction takes a list of arbitrary values which are interpreted
5694 by the :ref:`personality function <personalityfn>`.
5695
5696 The ``terminatepad`` may be given an ``exception`` label to
5697 transfer control to if the in-flight exception matches the ``args``.
5698
5699 Semantics:
5700 """"""""""
5701
5702 When the call stack is being unwound due to an exception being thrown,
5703 the exception is compared against the ``args``. If it matches,
5704 then control is transfered to the ``exception`` basic block. Otherwise,
5705 the program is terminated via personality-specific means. Typically,
5706 the first argument to ``terminatepad`` specifies what function the
5707 personality should defer to in order to terminate the program.
5708
5709 The ``terminatepad`` instruction has several restrictions:
5710
5711 -  A terminate block is a basic block which is the unwind destination of
5712    an exceptional instruction.
5713 -  A terminate block must have a '``terminatepad``' instruction as its
5714    first non-PHI instruction.
5715 -  There can be only one '``terminatepad``' instruction within the
5716    terminate block.
5717 -  A basic block that is not a terminate block may not include a
5718    '``terminatepad``' instruction.
5719
5720 Example:
5721 """"""""
5722
5723 .. code-block:: llvm
5724
5725       ;; A terminate block which only permits integers.
5726       terminatepad [i8** @_ZTIi] unwind label %continue
5727
5728 .. _i_unreachable:
5729
5730 '``unreachable``' Instruction
5731 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
5732
5733 Syntax:
5734 """""""
5735
5736 ::
5737
5738       unreachable
5739
5740 Overview:
5741 """""""""
5742
5743 The '``unreachable``' instruction has no defined semantics. This
5744 instruction is used to inform the optimizer that a particular portion of
5745 the code is not reachable. This can be used to indicate that the code
5746 after a no-return function cannot be reached, and other facts.
5747
5748 Semantics:
5749 """"""""""
5750
5751 The '``unreachable``' instruction has no defined semantics.
5752
5753 .. _binaryops:
5754
5755 Binary Operations
5756 -----------------
5757
5758 Binary operators are used to do most of the computation in a program.
5759 They require two operands of the same type, execute an operation on
5760 them, and produce a single value. The operands might represent multiple
5761 data, as is the case with the :ref:`vector <t_vector>` data type. The
5762 result value has the same type as its operands.
5763
5764 There are several different binary operators:
5765
5766 .. _i_add:
5767
5768 '``add``' Instruction
5769 ^^^^^^^^^^^^^^^^^^^^^
5770
5771 Syntax:
5772 """""""
5773
5774 ::
5775
5776       <result> = add <ty> <op1>, <op2>          ; yields ty:result
5777       <result> = add nuw <ty> <op1>, <op2>      ; yields ty:result
5778       <result> = add nsw <ty> <op1>, <op2>      ; yields ty:result
5779       <result> = add nuw nsw <ty> <op1>, <op2>  ; yields ty:result
5780
5781 Overview:
5782 """""""""
5783
5784 The '``add``' instruction returns the sum of its two operands.
5785
5786 Arguments:
5787 """"""""""
5788
5789 The two arguments to the '``add``' instruction must be
5790 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
5791 arguments must have identical types.
5792
5793 Semantics:
5794 """"""""""
5795
5796 The value produced is the integer sum of the two operands.
5797
5798 If the sum has unsigned overflow, the result returned is the
5799 mathematical result modulo 2\ :sup:`n`\ , where n is the bit width of
5800 the result.
5801
5802 Because LLVM integers use a two's complement representation, this
5803 instruction is appropriate for both signed and unsigned integers.
5804
5805 ``nuw`` and ``nsw`` stand for "No Unsigned Wrap" and "No Signed Wrap",
5806 respectively. If the ``nuw`` and/or ``nsw`` keywords are present, the
5807 result value of the ``add`` is a :ref:`poison value <poisonvalues>` if
5808 unsigned and/or signed overflow, respectively, occurs.
5809
5810 Example:
5811 """"""""
5812
5813 .. code-block:: llvm
5814
5815       <result> = add i32 4, %var          ; yields i32:result = 4 + %var
5816
5817 .. _i_fadd:
5818
5819 '``fadd``' Instruction
5820 ^^^^^^^^^^^^^^^^^^^^^^
5821
5822 Syntax:
5823 """""""
5824
5825 ::
5826
5827       <result> = fadd [fast-math flags]* <ty> <op1>, <op2>   ; yields ty:result
5828
5829 Overview:
5830 """""""""
5831
5832 The '``fadd``' instruction returns the sum of its two operands.
5833
5834 Arguments:
5835 """"""""""
5836
5837 The two arguments to the '``fadd``' instruction must be :ref:`floating
5838 point <t_floating>` or :ref:`vector <t_vector>` of floating point values.
5839 Both arguments must have identical types.
5840
5841 Semantics:
5842 """"""""""
5843
5844 The value produced is the floating point sum of the two operands. This
5845 instruction can also take any number of :ref:`fast-math flags <fastmath>`,
5846 which are optimization hints to enable otherwise unsafe floating point
5847 optimizations:
5848
5849 Example:
5850 """"""""
5851
5852 .. code-block:: llvm
5853
5854       <result> = fadd float 4.0, %var          ; yields float:result = 4.0 + %var
5855
5856 '``sub``' Instruction
5857 ^^^^^^^^^^^^^^^^^^^^^
5858
5859 Syntax:
5860 """""""
5861
5862 ::
5863
5864       <result> = sub <ty> <op1>, <op2>          ; yields ty:result
5865       <result> = sub nuw <ty> <op1>, <op2>      ; yields ty:result
5866       <result> = sub nsw <ty> <op1>, <op2>      ; yields ty:result
5867       <result> = sub nuw nsw <ty> <op1>, <op2>  ; yields ty:result
5868
5869 Overview:
5870 """""""""
5871
5872 The '``sub``' instruction returns the difference of its two operands.
5873
5874 Note that the '``sub``' instruction is used to represent the '``neg``'
5875 instruction present in most other intermediate representations.
5876
5877 Arguments:
5878 """"""""""
5879
5880 The two arguments to the '``sub``' instruction must be
5881 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
5882 arguments must have identical types.
5883
5884 Semantics:
5885 """"""""""
5886
5887 The value produced is the integer difference of the two operands.
5888
5889 If the difference has unsigned overflow, the result returned is the
5890 mathematical result modulo 2\ :sup:`n`\ , where n is the bit width of
5891 the result.
5892
5893 Because LLVM integers use a two's complement representation, this
5894 instruction is appropriate for both signed and unsigned integers.
5895
5896 ``nuw`` and ``nsw`` stand for "No Unsigned Wrap" and "No Signed Wrap",
5897 respectively. If the ``nuw`` and/or ``nsw`` keywords are present, the
5898 result value of the ``sub`` is a :ref:`poison value <poisonvalues>` if
5899 unsigned and/or signed overflow, respectively, occurs.
5900
5901 Example:
5902 """"""""
5903
5904 .. code-block:: llvm
5905
5906       <result> = sub i32 4, %var          ; yields i32:result = 4 - %var
5907       <result> = sub i32 0, %val          ; yields i32:result = -%var
5908
5909 .. _i_fsub:
5910
5911 '``fsub``' Instruction
5912 ^^^^^^^^^^^^^^^^^^^^^^
5913
5914 Syntax:
5915 """""""
5916
5917 ::
5918
5919       <result> = fsub [fast-math flags]* <ty> <op1>, <op2>   ; yields ty:result
5920
5921 Overview:
5922 """""""""
5923
5924 The '``fsub``' instruction returns the difference of its two operands.
5925
5926 Note that the '``fsub``' instruction is used to represent the '``fneg``'
5927 instruction present in most other intermediate representations.
5928
5929 Arguments:
5930 """"""""""
5931
5932 The two arguments to the '``fsub``' instruction must be :ref:`floating
5933 point <t_floating>` or :ref:`vector <t_vector>` of floating point values.
5934 Both arguments must have identical types.
5935
5936 Semantics:
5937 """"""""""
5938
5939 The value produced is the floating point difference of the two operands.
5940 This instruction can also take any number of :ref:`fast-math
5941 flags <fastmath>`, which are optimization hints to enable otherwise
5942 unsafe floating point optimizations:
5943
5944 Example:
5945 """"""""
5946
5947 .. code-block:: llvm
5948
5949       <result> = fsub float 4.0, %var           ; yields float:result = 4.0 - %var
5950       <result> = fsub float -0.0, %val          ; yields float:result = -%var
5951
5952 '``mul``' Instruction
5953 ^^^^^^^^^^^^^^^^^^^^^
5954
5955 Syntax:
5956 """""""
5957
5958 ::
5959
5960       <result> = mul <ty> <op1>, <op2>          ; yields ty:result
5961       <result> = mul nuw <ty> <op1>, <op2>      ; yields ty:result
5962       <result> = mul nsw <ty> <op1>, <op2>      ; yields ty:result
5963       <result> = mul nuw nsw <ty> <op1>, <op2>  ; yields ty:result
5964
5965 Overview:
5966 """""""""
5967
5968 The '``mul``' instruction returns the product of its two operands.
5969
5970 Arguments:
5971 """"""""""
5972
5973 The two arguments to the '``mul``' instruction must be
5974 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
5975 arguments must have identical types.
5976
5977 Semantics:
5978 """"""""""
5979
5980 The value produced is the integer product of the two operands.
5981
5982 If the result of the multiplication has unsigned overflow, the result
5983 returned is the mathematical result modulo 2\ :sup:`n`\ , where n is the
5984 bit width of the result.
5985
5986 Because LLVM integers use a two's complement representation, and the
5987 result is the same width as the operands, this instruction returns the
5988 correct result for both signed and unsigned integers. If a full product
5989 (e.g. ``i32`` * ``i32`` -> ``i64``) is needed, the operands should be
5990 sign-extended or zero-extended as appropriate to the width of the full
5991 product.
5992
5993 ``nuw`` and ``nsw`` stand for "No Unsigned Wrap" and "No Signed Wrap",
5994 respectively. If the ``nuw`` and/or ``nsw`` keywords are present, the
5995 result value of the ``mul`` is a :ref:`poison value <poisonvalues>` if
5996 unsigned and/or signed overflow, respectively, occurs.
5997
5998 Example:
5999 """"""""
6000
6001 .. code-block:: llvm
6002
6003       <result> = mul i32 4, %var          ; yields i32:result = 4 * %var
6004
6005 .. _i_fmul:
6006
6007 '``fmul``' Instruction
6008 ^^^^^^^^^^^^^^^^^^^^^^
6009
6010 Syntax:
6011 """""""
6012
6013 ::
6014
6015       <result> = fmul [fast-math flags]* <ty> <op1>, <op2>   ; yields ty:result
6016
6017 Overview:
6018 """""""""
6019
6020 The '``fmul``' instruction returns the product of its two operands.
6021
6022 Arguments:
6023 """"""""""
6024
6025 The two arguments to the '``fmul``' instruction must be :ref:`floating
6026 point <t_floating>` or :ref:`vector <t_vector>` of floating point values.
6027 Both arguments must have identical types.
6028
6029 Semantics:
6030 """"""""""
6031
6032 The value produced is the floating point product of the two operands.
6033 This instruction can also take any number of :ref:`fast-math
6034 flags <fastmath>`, which are optimization hints to enable otherwise
6035 unsafe floating point optimizations:
6036
6037 Example:
6038 """"""""
6039
6040 .. code-block:: llvm
6041
6042       <result> = fmul float 4.0, %var          ; yields float:result = 4.0 * %var
6043
6044 '``udiv``' Instruction
6045 ^^^^^^^^^^^^^^^^^^^^^^
6046
6047 Syntax:
6048 """""""
6049
6050 ::
6051
6052       <result> = udiv <ty> <op1>, <op2>         ; yields ty:result
6053       <result> = udiv exact <ty> <op1>, <op2>   ; yields ty:result
6054
6055 Overview:
6056 """""""""
6057
6058 The '``udiv``' instruction returns the quotient of its two operands.
6059
6060 Arguments:
6061 """"""""""
6062
6063 The two arguments to the '``udiv``' instruction must be
6064 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
6065 arguments must have identical types.
6066
6067 Semantics:
6068 """"""""""
6069
6070 The value produced is the unsigned integer quotient of the two operands.
6071
6072 Note that unsigned integer division and signed integer division are
6073 distinct operations; for signed integer division, use '``sdiv``'.
6074
6075 Division by zero leads to undefined behavior.
6076
6077 If the ``exact`` keyword is present, the result value of the ``udiv`` is
6078 a :ref:`poison value <poisonvalues>` if %op1 is not a multiple of %op2 (as
6079 such, "((a udiv exact b) mul b) == a").
6080
6081 Example:
6082 """"""""
6083
6084 .. code-block:: llvm
6085
6086       <result> = udiv i32 4, %var          ; yields i32:result = 4 / %var
6087
6088 '``sdiv``' Instruction
6089 ^^^^^^^^^^^^^^^^^^^^^^
6090
6091 Syntax:
6092 """""""
6093
6094 ::
6095
6096       <result> = sdiv <ty> <op1>, <op2>         ; yields ty:result
6097       <result> = sdiv exact <ty> <op1>, <op2>   ; yields ty:result
6098
6099 Overview:
6100 """""""""
6101
6102 The '``sdiv``' instruction returns the quotient of its two operands.
6103
6104 Arguments:
6105 """"""""""
6106
6107 The two arguments to the '``sdiv``' instruction must be
6108 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
6109 arguments must have identical types.
6110
6111 Semantics:
6112 """"""""""
6113
6114 The value produced is the signed integer quotient of the two operands
6115 rounded towards zero.
6116
6117 Note that signed integer division and unsigned integer division are
6118 distinct operations; for unsigned integer division, use '``udiv``'.
6119
6120 Division by zero leads to undefined behavior. Overflow also leads to
6121 undefined behavior; this is a rare case, but can occur, for example, by
6122 doing a 32-bit division of -2147483648 by -1.
6123
6124 If the ``exact`` keyword is present, the result value of the ``sdiv`` is
6125 a :ref:`poison value <poisonvalues>` if the result would be rounded.
6126
6127 Example:
6128 """"""""
6129
6130 .. code-block:: llvm
6131
6132       <result> = sdiv i32 4, %var          ; yields i32:result = 4 / %var
6133
6134 .. _i_fdiv:
6135
6136 '``fdiv``' Instruction
6137 ^^^^^^^^^^^^^^^^^^^^^^
6138
6139 Syntax:
6140 """""""
6141
6142 ::
6143
6144       <result> = fdiv [fast-math flags]* <ty> <op1>, <op2>   ; yields ty:result
6145
6146 Overview:
6147 """""""""
6148
6149 The '``fdiv``' instruction returns the quotient of its two operands.
6150
6151 Arguments:
6152 """"""""""
6153
6154 The two arguments to the '``fdiv``' instruction must be :ref:`floating
6155 point <t_floating>` or :ref:`vector <t_vector>` of floating point values.
6156 Both arguments must have identical types.
6157
6158 Semantics:
6159 """"""""""
6160
6161 The value produced is the floating point quotient of the two operands.
6162 This instruction can also take any number of :ref:`fast-math
6163 flags <fastmath>`, which are optimization hints to enable otherwise
6164 unsafe floating point optimizations:
6165
6166 Example:
6167 """"""""
6168
6169 .. code-block:: llvm
6170
6171       <result> = fdiv float 4.0, %var          ; yields float:result = 4.0 / %var
6172
6173 '``urem``' Instruction
6174 ^^^^^^^^^^^^^^^^^^^^^^
6175
6176 Syntax:
6177 """""""
6178
6179 ::
6180
6181       <result> = urem <ty> <op1>, <op2>   ; yields ty:result
6182
6183 Overview:
6184 """""""""
6185
6186 The '``urem``' instruction returns the remainder from the unsigned
6187 division of its two arguments.
6188
6189 Arguments:
6190 """"""""""
6191
6192 The two arguments to the '``urem``' instruction must be
6193 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
6194 arguments must have identical types.
6195
6196 Semantics:
6197 """"""""""
6198
6199 This instruction returns the unsigned integer *remainder* of a division.
6200 This instruction always performs an unsigned division to get the
6201 remainder.
6202
6203 Note that unsigned integer remainder and signed integer remainder are
6204 distinct operations; for signed integer remainder, use '``srem``'.
6205
6206 Taking the remainder of a division by zero leads to undefined behavior.
6207
6208 Example:
6209 """"""""
6210
6211 .. code-block:: llvm
6212
6213       <result> = urem i32 4, %var          ; yields i32:result = 4 % %var
6214
6215 '``srem``' Instruction
6216 ^^^^^^^^^^^^^^^^^^^^^^
6217
6218 Syntax:
6219 """""""
6220
6221 ::
6222
6223       <result> = srem <ty> <op1>, <op2>   ; yields ty:result
6224
6225 Overview:
6226 """""""""
6227
6228 The '``srem``' instruction returns the remainder from the signed
6229 division of its two operands. This instruction can also take
6230 :ref:`vector <t_vector>` versions of the values in which case the elements
6231 must be integers.
6232
6233 Arguments:
6234 """"""""""
6235
6236 The two arguments to the '``srem``' instruction must be
6237 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
6238 arguments must have identical types.
6239
6240 Semantics:
6241 """"""""""
6242
6243 This instruction returns the *remainder* of a division (where the result
6244 is either zero or has the same sign as the dividend, ``op1``), not the
6245 *modulo* operator (where the result is either zero or has the same sign
6246 as the divisor, ``op2``) of a value. For more information about the
6247 difference, see `The Math
6248 Forum <http://mathforum.org/dr.math/problems/anne.4.28.99.html>`_. For a
6249 table of how this is implemented in various languages, please see
6250 `Wikipedia: modulo
6251 operation <http://en.wikipedia.org/wiki/Modulo_operation>`_.
6252
6253 Note that signed integer remainder and unsigned integer remainder are
6254 distinct operations; for unsigned integer remainder, use '``urem``'.
6255
6256 Taking the remainder of a division by zero leads to undefined behavior.
6257 Overflow also leads to undefined behavior; this is a rare case, but can
6258 occur, for example, by taking the remainder of a 32-bit division of
6259 -2147483648 by -1. (The remainder doesn't actually overflow, but this
6260 rule lets srem be implemented using instructions that return both the
6261 result of the division and the remainder.)
6262
6263 Example:
6264 """"""""
6265
6266 .. code-block:: llvm
6267
6268       <result> = srem i32 4, %var          ; yields i32:result = 4 % %var
6269
6270 .. _i_frem:
6271
6272 '``frem``' Instruction
6273 ^^^^^^^^^^^^^^^^^^^^^^
6274
6275 Syntax:
6276 """""""
6277
6278 ::
6279
6280       <result> = frem [fast-math flags]* <ty> <op1>, <op2>   ; yields ty:result
6281
6282 Overview:
6283 """""""""
6284
6285 The '``frem``' instruction returns the remainder from the division of
6286 its two operands.
6287
6288 Arguments:
6289 """"""""""
6290
6291 The two arguments to the '``frem``' instruction must be :ref:`floating
6292 point <t_floating>` or :ref:`vector <t_vector>` of floating point values.
6293 Both arguments must have identical types.
6294
6295 Semantics:
6296 """"""""""
6297
6298 This instruction returns the *remainder* of a division. The remainder
6299 has the same sign as the dividend. This instruction can also take any
6300 number of :ref:`fast-math flags <fastmath>`, which are optimization hints
6301 to enable otherwise unsafe floating point optimizations:
6302
6303 Example:
6304 """"""""
6305
6306 .. code-block:: llvm
6307
6308       <result> = frem float 4.0, %var          ; yields float:result = 4.0 % %var
6309
6310 .. _bitwiseops:
6311
6312 Bitwise Binary Operations
6313 -------------------------
6314
6315 Bitwise binary operators are used to do various forms of bit-twiddling
6316 in a program. They are generally very efficient instructions and can
6317 commonly be strength reduced from other instructions. They require two
6318 operands of the same type, execute an operation on them, and produce a
6319 single value. The resulting value is the same type as its operands.
6320
6321 '``shl``' Instruction
6322 ^^^^^^^^^^^^^^^^^^^^^
6323
6324 Syntax:
6325 """""""
6326
6327 ::
6328
6329       <result> = shl <ty> <op1>, <op2>           ; yields ty:result
6330       <result> = shl nuw <ty> <op1>, <op2>       ; yields ty:result
6331       <result> = shl nsw <ty> <op1>, <op2>       ; yields ty:result
6332       <result> = shl nuw nsw <ty> <op1>, <op2>   ; yields ty:result
6333
6334 Overview:
6335 """""""""
6336
6337 The '``shl``' instruction returns the first operand shifted to the left
6338 a specified number of bits.
6339
6340 Arguments:
6341 """"""""""
6342
6343 Both arguments to the '``shl``' instruction must be the same
6344 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer type.
6345 '``op2``' is treated as an unsigned value.
6346
6347 Semantics:
6348 """"""""""
6349
6350 The value produced is ``op1`` \* 2\ :sup:`op2` mod 2\ :sup:`n`,
6351 where ``n`` is the width of the result. If ``op2`` is (statically or
6352 dynamically) equal to or larger than the number of bits in
6353 ``op1``, the result is undefined. If the arguments are vectors, each
6354 vector element of ``op1`` is shifted by the corresponding shift amount
6355 in ``op2``.
6356
6357 If the ``nuw`` keyword is present, then the shift produces a :ref:`poison
6358 value <poisonvalues>` if it shifts out any non-zero bits. If the
6359 ``nsw`` keyword is present, then the shift produces a :ref:`poison
6360 value <poisonvalues>` if it shifts out any bits that disagree with the
6361 resultant sign bit. As such, NUW/NSW have the same semantics as they
6362 would if the shift were expressed as a mul instruction with the same
6363 nsw/nuw bits in (mul %op1, (shl 1, %op2)).
6364
6365 Example:
6366 """"""""
6367
6368 .. code-block:: llvm
6369
6370       <result> = shl i32 4, %var   ; yields i32: 4 << %var
6371       <result> = shl i32 4, 2      ; yields i32: 16
6372       <result> = shl i32 1, 10     ; yields i32: 1024
6373       <result> = shl i32 1, 32     ; undefined
6374       <result> = shl <2 x i32> < i32 1, i32 1>, < i32 1, i32 2>   ; yields: result=<2 x i32> < i32 2, i32 4>
6375
6376 '``lshr``' Instruction
6377 ^^^^^^^^^^^^^^^^^^^^^^
6378
6379 Syntax:
6380 """""""
6381
6382 ::
6383
6384       <result> = lshr <ty> <op1>, <op2>         ; yields ty:result
6385       <result> = lshr exact <ty> <op1>, <op2>   ; yields ty:result
6386
6387 Overview:
6388 """""""""
6389
6390 The '``lshr``' instruction (logical shift right) returns the first
6391 operand shifted to the right a specified number of bits with zero fill.
6392
6393 Arguments:
6394 """"""""""
6395
6396 Both arguments to the '``lshr``' instruction must be the same
6397 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer type.
6398 '``op2``' is treated as an unsigned value.
6399
6400 Semantics:
6401 """"""""""
6402
6403 This instruction always performs a logical shift right operation. The
6404 most significant bits of the result will be filled with zero bits after
6405 the shift. If ``op2`` is (statically or dynamically) equal to or larger
6406 than the number of bits in ``op1``, the result is undefined. If the
6407 arguments are vectors, each vector element of ``op1`` is shifted by the
6408 corresponding shift amount in ``op2``.
6409
6410 If the ``exact`` keyword is present, the result value of the ``lshr`` is
6411 a :ref:`poison value <poisonvalues>` if any of the bits shifted out are
6412 non-zero.
6413
6414 Example:
6415 """"""""
6416
6417 .. code-block:: llvm
6418
6419       <result> = lshr i32 4, 1   ; yields i32:result = 2
6420       <result> = lshr i32 4, 2   ; yields i32:result = 1
6421       <result> = lshr i8  4, 3   ; yields i8:result = 0
6422       <result> = lshr i8 -2, 1   ; yields i8:result = 0x7F
6423       <result> = lshr i32 1, 32  ; undefined
6424       <result> = lshr <2 x i32> < i32 -2, i32 4>, < i32 1, i32 2>   ; yields: result=<2 x i32> < i32 0x7FFFFFFF, i32 1>
6425
6426 '``ashr``' Instruction
6427 ^^^^^^^^^^^^^^^^^^^^^^
6428
6429 Syntax:
6430 """""""
6431
6432 ::
6433
6434       <result> = ashr <ty> <op1>, <op2>         ; yields ty:result
6435       <result> = ashr exact <ty> <op1>, <op2>   ; yields ty:result
6436
6437 Overview:
6438 """""""""
6439
6440 The '``ashr``' instruction (arithmetic shift right) returns the first
6441 operand shifted to the right a specified number of bits with sign
6442 extension.
6443
6444 Arguments:
6445 """"""""""
6446
6447 Both arguments to the '``ashr``' instruction must be the same
6448 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer type.
6449 '``op2``' is treated as an unsigned value.
6450
6451 Semantics:
6452 """"""""""
6453
6454 This instruction always performs an arithmetic shift right operation,
6455 The most significant bits of the result will be filled with the sign bit
6456 of ``op1``. If ``op2`` is (statically or dynamically) equal to or larger
6457 than the number of bits in ``op1``, the result is undefined. If the
6458 arguments are vectors, each vector element of ``op1`` is shifted by the
6459 corresponding shift amount in ``op2``.
6460
6461 If the ``exact`` keyword is present, the result value of the ``ashr`` is
6462 a :ref:`poison value <poisonvalues>` if any of the bits shifted out are
6463 non-zero.
6464
6465 Example:
6466 """"""""
6467
6468 .. code-block:: llvm
6469
6470       <result> = ashr i32 4, 1   ; yields i32:result = 2
6471       <result> = ashr i32 4, 2   ; yields i32:result = 1
6472       <result> = ashr i8  4, 3   ; yields i8:result = 0
6473       <result> = ashr i8 -2, 1   ; yields i8:result = -1
6474       <result> = ashr i32 1, 32  ; undefined
6475       <result> = ashr <2 x i32> < i32 -2, i32 4>, < i32 1, i32 3>   ; yields: result=<2 x i32> < i32 -1, i32 0>
6476
6477 '``and``' Instruction
6478 ^^^^^^^^^^^^^^^^^^^^^
6479
6480 Syntax:
6481 """""""
6482
6483 ::
6484
6485       <result> = and <ty> <op1>, <op2>   ; yields ty:result
6486
6487 Overview:
6488 """""""""
6489
6490 The '``and``' instruction returns the bitwise logical and of its two
6491 operands.
6492
6493 Arguments:
6494 """"""""""
6495
6496 The two arguments to the '``and``' instruction must be
6497 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
6498 arguments must have identical types.
6499
6500 Semantics:
6501 """"""""""
6502
6503 The truth table used for the '``and``' instruction is:
6504
6505 +-----+-----+-----+
6506 | In0 | In1 | Out |
6507 +-----+-----+-----+
6508 |   0 |   0 |   0 |
6509 +-----+-----+-----+
6510 |   0 |   1 |   0 |
6511 +-----+-----+-----+
6512 |   1 |   0 |   0 |
6513 +-----+-----+-----+
6514 |   1 |   1 |   1 |
6515 +-----+-----+-----+
6516
6517 Example:
6518 """"""""
6519
6520 .. code-block:: llvm
6521
6522       <result> = and i32 4, %var         ; yields i32:result = 4 & %var
6523       <result> = and i32 15, 40          ; yields i32:result = 8
6524       <result> = and i32 4, 8            ; yields i32:result = 0
6525
6526 '``or``' Instruction
6527 ^^^^^^^^^^^^^^^^^^^^
6528
6529 Syntax:
6530 """""""
6531
6532 ::
6533
6534       <result> = or <ty> <op1>, <op2>   ; yields ty:result
6535
6536 Overview:
6537 """""""""
6538
6539 The '``or``' instruction returns the bitwise logical inclusive or of its
6540 two operands.
6541
6542 Arguments:
6543 """"""""""
6544
6545 The two arguments to the '``or``' instruction must be
6546 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
6547 arguments must have identical types.
6548
6549 Semantics:
6550 """"""""""
6551
6552 The truth table used for the '``or``' instruction is:
6553
6554 +-----+-----+-----+
6555 | In0 | In1 | Out |
6556 +-----+-----+-----+
6557 |   0 |   0 |   0 |
6558 +-----+-----+-----+
6559 |   0 |   1 |   1 |
6560 +-----+-----+-----+
6561 |   1 |   0 |   1 |
6562 +-----+-----+-----+
6563 |   1 |   1 |   1 |
6564 +-----+-----+-----+
6565
6566 Example:
6567 """"""""
6568
6569 ::
6570
6571       <result> = or i32 4, %var         ; yields i32:result = 4 | %var
6572       <result> = or i32 15, 40          ; yields i32:result = 47
6573       <result> = or i32 4, 8            ; yields i32:result = 12
6574
6575 '``xor``' Instruction
6576 ^^^^^^^^^^^^^^^^^^^^^
6577
6578 Syntax:
6579 """""""
6580
6581 ::
6582
6583       <result> = xor <ty> <op1>, <op2>   ; yields ty:result
6584
6585 Overview:
6586 """""""""
6587
6588 The '``xor``' instruction returns the bitwise logical exclusive or of
6589 its two operands. The ``xor`` is used to implement the "one's
6590 complement" operation, which is the "~" operator in C.
6591
6592 Arguments:
6593 """"""""""
6594
6595 The two arguments to the '``xor``' instruction must be
6596 :ref:`integer <t_integer>` or :ref:`vector <t_vector>` of integer values. Both
6597 arguments must have identical types.
6598
6599 Semantics:
6600 """"""""""
6601
6602 The truth table used for the '``xor``' instruction is:
6603
6604 +-----+-----+-----+
6605 | In0 | In1 | Out |
6606 +-----+-----+-----+
6607 |   0 |   0 |   0 |
6608 +-----+-----+-----+
6609 |   0 |   1 |   1 |
6610 +-----+-----+-----+
6611 |   1 |   0 |   1 |
6612 +-----+-----+-----+
6613 |   1 |   1 |   0 |
6614 +-----+-----+-----+
6615
6616 Example:
6617 """"""""
6618
6619 .. code-block:: llvm
6620
6621       <result> = xor i32 4, %var         ; yields i32:result = 4 ^ %var
6622       <result> = xor i32 15, 40          ; yields i32:result = 39
6623       <result> = xor i32 4, 8            ; yields i32:result = 12
6624       <result> = xor i32 %V, -1          ; yields i32:result = ~%V
6625
6626 Vector Operations
6627 -----------------
6628
6629 LLVM supports several instructions to represent vector operations in a
6630 target-independent manner. These instructions cover the element-access
6631 and vector-specific operations needed to process vectors effectively.
6632 While LLVM does directly support these vector operations, many
6633 sophisticated algorithms will want to use target-specific intrinsics to
6634 take full advantage of a specific target.
6635
6636 .. _i_extractelement:
6637
6638 '``extractelement``' Instruction
6639 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
6640
6641 Syntax:
6642 """""""
6643
6644 ::
6645
6646       <result> = extractelement <n x <ty>> <val>, <ty2> <idx>  ; yields <ty>
6647
6648 Overview:
6649 """""""""
6650
6651 The '``extractelement``' instruction extracts a single scalar element
6652 from a vector at a specified index.
6653
6654 Arguments:
6655 """"""""""
6656
6657 The first operand of an '``extractelement``' instruction is a value of
6658 :ref:`vector <t_vector>` type. The second operand is an index indicating
6659 the position from which to extract the element. The index may be a
6660 variable of any integer type.
6661
6662 Semantics:
6663 """"""""""
6664
6665 The result is a scalar of the same type as the element type of ``val``.
6666 Its value is the value at position ``idx`` of ``val``. If ``idx``
6667 exceeds the length of ``val``, the results are undefined.
6668
6669 Example:
6670 """"""""
6671
6672 .. code-block:: llvm
6673
6674       <result> = extractelement <4 x i32> %vec, i32 0    ; yields i32
6675
6676 .. _i_insertelement:
6677
6678 '``insertelement``' Instruction
6679 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
6680
6681 Syntax:
6682 """""""
6683
6684 ::
6685
6686       <result> = insertelement <n x <ty>> <val>, <ty> <elt>, <ty2> <idx>    ; yields <n x <ty>>
6687
6688 Overview:
6689 """""""""
6690
6691 The '``insertelement``' instruction inserts a scalar element into a
6692 vector at a specified index.
6693
6694 Arguments:
6695 """"""""""
6696
6697 The first operand of an '``insertelement``' instruction is a value of
6698 :ref:`vector <t_vector>` type. The second operand is a scalar value whose
6699 type must equal the element type of the first operand. The third operand
6700 is an index indicating the position at which to insert the value. The
6701 index may be a variable of any integer type.
6702
6703 Semantics:
6704 """"""""""
6705
6706 The result is a vector of the same type as ``val``. Its element values
6707 are those of ``val`` except at position ``idx``, where it gets the value
6708 ``elt``. If ``idx`` exceeds the length of ``val``, the results are
6709 undefined.
6710
6711 Example:
6712 """"""""
6713
6714 .. code-block:: llvm
6715
6716       <result> = insertelement <4 x i32> %vec, i32 1, i32 0    ; yields <4 x i32>
6717
6718 .. _i_shufflevector:
6719
6720 '``shufflevector``' Instruction
6721 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
6722
6723 Syntax:
6724 """""""
6725
6726 ::
6727
6728       <result> = shufflevector <n x <ty>> <v1>, <n x <ty>> <v2>, <m x i32> <mask>    ; yields <m x <ty>>
6729
6730 Overview:
6731 """""""""
6732
6733 The '``shufflevector``' instruction constructs a permutation of elements
6734 from two input vectors, returning a vector with the same element type as
6735 the input and length that is the same as the shuffle mask.
6736
6737 Arguments:
6738 """"""""""
6739
6740 The first two operands of a '``shufflevector``' instruction are vectors
6741 with the same type. The third argument is a shuffle mask whose element
6742 type is always 'i32'. The result of the instruction is a vector whose
6743 length is the same as the shuffle mask and whose element type is the
6744 same as the element type of the first two operands.
6745
6746 The shuffle mask operand is required to be a constant vector with either
6747 constant integer or undef values.
6748
6749 Semantics:
6750 """"""""""
6751
6752 The elements of the two input vectors are numbered from left to right
6753 across both of the vectors. The shuffle mask operand specifies, for each
6754 element of the result vector, which element of the two input vectors the
6755 result element gets. The element selector may be undef (meaning "don't
6756 care") and the second operand may be undef if performing a shuffle from
6757 only one vector.
6758
6759 Example:
6760 """"""""
6761
6762 .. code-block:: llvm
6763
6764       <result> = shufflevector <4 x i32> %v1, <4 x i32> %v2,
6765                               <4 x i32> <i32 0, i32 4, i32 1, i32 5>  ; yields <4 x i32>
6766       <result> = shufflevector <4 x i32> %v1, <4 x i32> undef,
6767                               <4 x i32> <i32 0, i32 1, i32 2, i32 3>  ; yields <4 x i32> - Identity shuffle.
6768       <result> = shufflevector <8 x i32> %v1, <8 x i32> undef,
6769                               <4 x i32> <i32 0, i32 1, i32 2, i32 3>  ; yields <4 x i32>
6770       <result> = shufflevector <4 x i32> %v1, <4 x i32> %v2,
6771                               <8 x i32> <i32 0, i32 1, i32 2, i32 3, i32 4, i32 5, i32 6, i32 7 >  ; yields <8 x i32>
6772
6773 Aggregate Operations
6774 --------------------
6775
6776 LLVM supports several instructions for working with
6777 :ref:`aggregate <t_aggregate>` values.
6778
6779 .. _i_extractvalue:
6780
6781 '``extractvalue``' Instruction
6782 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
6783
6784 Syntax:
6785 """""""
6786
6787 ::
6788
6789       <result> = extractvalue <aggregate type> <val>, <idx>{, <idx>}*
6790
6791 Overview:
6792 """""""""
6793
6794 The '``extractvalue``' instruction extracts the value of a member field
6795 from an :ref:`aggregate <t_aggregate>` value.
6796
6797 Arguments:
6798 """"""""""
6799
6800 The first operand of an '``extractvalue``' instruction is a value of
6801 :ref:`struct <t_struct>` or :ref:`array <t_array>` type. The other operands are
6802 constant indices to specify which value to extract in a similar manner
6803 as indices in a '``getelementptr``' instruction.
6804
6805 The major differences to ``getelementptr`` indexing are:
6806
6807 -  Since the value being indexed is not a pointer, the first index is
6808    omitted and assumed to be zero.
6809 -  At least one index must be specified.
6810 -  Not only struct indices but also array indices must be in bounds.
6811
6812 Semantics:
6813 """"""""""
6814
6815 The result is the value at the position in the aggregate specified by
6816 the index operands.
6817
6818 Example:
6819 """"""""
6820
6821 .. code-block:: llvm
6822
6823       <result> = extractvalue {i32, float} %agg, 0    ; yields i32
6824
6825 .. _i_insertvalue:
6826
6827 '``insertvalue``' Instruction
6828 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
6829
6830 Syntax:
6831 """""""
6832
6833 ::
6834
6835       <result> = insertvalue <aggregate type> <val>, <ty> <elt>, <idx>{, <idx>}*    ; yields <aggregate type>
6836
6837 Overview:
6838 """""""""
6839
6840 The '``insertvalue``' instruction inserts a value into a member field in
6841 an :ref:`aggregate <t_aggregate>` value.
6842
6843 Arguments:
6844 """"""""""
6845
6846 The first operand of an '``insertvalue``' instruction is a value of
6847 :ref:`struct <t_struct>` or :ref:`array <t_array>` type. The second operand is
6848 a first-class value to insert. The following operands are constant
6849 indices indicating the position at which to insert the value in a
6850 similar manner as indices in a '``extractvalue``' instruction. The value
6851 to insert must have the same type as the value identified by the
6852 indices.
6853
6854 Semantics:
6855 """"""""""
6856
6857 The result is an aggregate of the same type as ``val``. Its value is
6858 that of ``val`` except that the value at the position specified by the
6859 indices is that of ``elt``.
6860
6861 Example:
6862 """"""""
6863
6864 .. code-block:: llvm
6865
6866       %agg1 = insertvalue {i32, float} undef, i32 1, 0              ; yields {i32 1, float undef}
6867       %agg2 = insertvalue {i32, float} %agg1, float %val, 1         ; yields {i32 1, float %val}
6868       %agg3 = insertvalue {i32, {float}} undef, float %val, 1, 0    ; yields {i32 undef, {float %val}}
6869
6870 .. _memoryops:
6871
6872 Memory Access and Addressing Operations
6873 ---------------------------------------
6874
6875 A key design point of an SSA-based representation is how it represents
6876 memory. In LLVM, no memory locations are in SSA form, which makes things
6877 very simple. This section describes how to read, write, and allocate
6878 memory in LLVM.
6879
6880 .. _i_alloca:
6881
6882 '``alloca``' Instruction
6883 ^^^^^^^^^^^^^^^^^^^^^^^^
6884
6885 Syntax:
6886 """""""
6887
6888 ::
6889
6890       <result> = alloca [inalloca] <type> [, <ty> <NumElements>] [, align <alignment>]     ; yields type*:result
6891
6892 Overview:
6893 """""""""
6894
6895 The '``alloca``' instruction allocates memory on the stack frame of the
6896 currently executing function, to be automatically released when this
6897 function returns to its caller. The object is always allocated in the
6898 generic address space (address space zero).
6899
6900 Arguments:
6901 """"""""""
6902
6903 The '``alloca``' instruction allocates ``sizeof(<type>)*NumElements``
6904 bytes of memory on the runtime stack, returning a pointer of the
6905 appropriate type to the program. If "NumElements" is specified, it is
6906 the number of elements allocated, otherwise "NumElements" is defaulted
6907 to be one. If a constant alignment is specified, the value result of the
6908 allocation is guaranteed to be aligned to at least that boundary. The
6909 alignment may not be greater than ``1 << 29``. If not specified, or if
6910 zero, the target can choose to align the allocation on any convenient
6911 boundary compatible with the type.
6912
6913 '``type``' may be any sized type.
6914
6915 Semantics:
6916 """"""""""
6917
6918 Memory is allocated; a pointer is returned. The operation is undefined
6919 if there is insufficient stack space for the allocation. '``alloca``'d
6920 memory is automatically released when the function returns. The
6921 '``alloca``' instruction is commonly used to represent automatic
6922 variables that must have an address available. When the function returns
6923 (either with the ``ret`` or ``resume`` instructions), the memory is
6924 reclaimed. Allocating zero bytes is legal, but the result is undefined.
6925 The order in which memory is allocated (ie., which way the stack grows)
6926 is not specified.
6927
6928 Example:
6929 """"""""
6930
6931 .. code-block:: llvm
6932
6933       %ptr = alloca i32                             ; yields i32*:ptr
6934       %ptr = alloca i32, i32 4                      ; yields i32*:ptr
6935       %ptr = alloca i32, i32 4, align 1024          ; yields i32*:ptr
6936       %ptr = alloca i32, align 1024                 ; yields i32*:ptr
6937
6938 .. _i_load:
6939
6940 '``load``' Instruction
6941 ^^^^^^^^^^^^^^^^^^^^^^
6942
6943 Syntax:
6944 """""""
6945
6946 ::
6947
6948       <result> = load [volatile] <ty>, <ty>* <pointer>[, align <alignment>][, !nontemporal !<index>][, !invariant.load !<index>][, !invariant.group !<index>][, !nonnull !<index>][, !dereferenceable !<deref_bytes_node>][, !dereferenceable_or_null !<deref_bytes_node>][, !align !<align_node>]
6949       <result> = load atomic [volatile] <ty>* <pointer> [singlethread] <ordering>, align <alignment> [, !invariant.group !<index>]
6950       !<index> = !{ i32 1 }
6951       !<deref_bytes_node> = !{i64 <dereferenceable_bytes>}
6952       !<align_node> = !{ i64 <value_alignment> }
6953
6954 Overview:
6955 """""""""
6956
6957 The '``load``' instruction is used to read from memory.
6958
6959 Arguments:
6960 """"""""""
6961
6962 The argument to the ``load`` instruction specifies the memory address
6963 from which to load. The type specified must be a :ref:`first
6964 class <t_firstclass>` type. If the ``load`` is marked as ``volatile``,
6965 then the optimizer is not allowed to modify the number or order of
6966 execution of this ``load`` with other :ref:`volatile
6967 operations <volatile>`.
6968
6969 If the ``load`` is marked as ``atomic``, it takes an extra
6970 :ref:`ordering <ordering>` and optional ``singlethread`` argument. The
6971 ``release`` and ``acq_rel`` orderings are not valid on ``load``
6972 instructions. Atomic loads produce :ref:`defined <memmodel>` results
6973 when they may see multiple atomic stores. The type of the pointee must
6974 be an integer type whose bit width is a power of two greater than or
6975 equal to eight and less than or equal to a target-specific size limit.
6976 ``align`` must be explicitly specified on atomic loads, and the load has
6977 undefined behavior if the alignment is not set to a value which is at
6978 least the size in bytes of the pointee. ``!nontemporal`` does not have
6979 any defined semantics for atomic loads.
6980
6981 The optional constant ``align`` argument specifies the alignment of the
6982 operation (that is, the alignment of the memory address). A value of 0
6983 or an omitted ``align`` argument means that the operation has the ABI
6984 alignment for the target. It is the responsibility of the code emitter
6985 to ensure that the alignment information is correct. Overestimating the
6986 alignment results in undefined behavior. Underestimating the alignment
6987 may produce less efficient code. An alignment of 1 is always safe. The
6988 maximum possible alignment is ``1 << 29``.
6989
6990 The optional ``!nontemporal`` metadata must reference a single
6991 metadata name ``<index>`` corresponding to a metadata node with one
6992 ``i32`` entry of value 1. The existence of the ``!nontemporal``
6993 metadata on the instruction tells the optimizer and code generator
6994 that this load is not expected to be reused in the cache. The code
6995 generator may select special instructions to save cache bandwidth, such
6996 as the ``MOVNT`` instruction on x86.
6997
6998 The optional ``!invariant.load`` metadata must reference a single
6999 metadata name ``<index>`` corresponding to a metadata node with no
7000 entries. The existence of the ``!invariant.load`` metadata on the
7001 instruction tells the optimizer and code generator that the address
7002 operand to this load points to memory which can be assumed unchanged.
7003 Being invariant does not imply that a location is dereferenceable,
7004 but it does imply that once the location is known dereferenceable
7005 its value is henceforth unchanging.
7006
7007 The optional ``!invariant.group`` metadata must reference a single metadata name
7008  ``<index>`` corresponding to a metadata node. See ``invariant.group`` metadata.
7009
7010 The optional ``!nonnull`` metadata must reference a single
7011 metadata name ``<index>`` corresponding to a metadata node with no
7012 entries. The existence of the ``!nonnull`` metadata on the
7013 instruction tells the optimizer that the value loaded is known to
7014 never be null. This is analogous to the ``nonnull`` attribute
7015 on parameters and return values. This metadata can only be applied
7016 to loads of a pointer type.
7017
7018 The optional ``!dereferenceable`` metadata must reference a single metadata
7019 name ``<deref_bytes_node>`` corresponding to a metadata node with one ``i64``
7020 entry. The existence of the ``!dereferenceable`` metadata on the instruction
7021 tells the optimizer that the value loaded is known to be dereferenceable.
7022 The number of bytes known to be dereferenceable is specified by the integer
7023 value in the metadata node. This is analogous to the ''dereferenceable''
7024 attribute on parameters and return values. This metadata can only be applied
7025 to loads of a pointer type.
7026
7027 The optional ``!dereferenceable_or_null`` metadata must reference a single
7028 metadata name ``<deref_bytes_node>`` corresponding to a metadata node with one
7029 ``i64`` entry. The existence of the ``!dereferenceable_or_null`` metadata on the
7030 instruction tells the optimizer that the value loaded is known to be either
7031 dereferenceable or null.
7032 The number of bytes known to be dereferenceable is specified by the integer
7033 value in the metadata node. This is analogous to the ''dereferenceable_or_null''
7034 attribute on parameters and return values. This metadata can only be applied
7035 to loads of a pointer type.
7036
7037 The optional ``!align`` metadata must reference a single metadata name
7038 ``<align_node>`` corresponding to a metadata node with one ``i64`` entry.
7039 The existence of the ``!align`` metadata on the instruction tells the
7040 optimizer that the value loaded is known to be aligned to a boundary specified
7041 by the integer value in the metadata node. The alignment must be a power of 2.
7042 This is analogous to the ''align'' attribute on parameters and return values.
7043 This metadata can only be applied to loads of a pointer type.
7044
7045 Semantics:
7046 """"""""""
7047
7048 The location of memory pointed to is loaded. If the value being loaded
7049 is of scalar type then the number of bytes read does not exceed the
7050 minimum number of bytes needed to hold all bits of the type. For
7051 example, loading an ``i24`` reads at most three bytes. When loading a
7052 value of a type like ``i20`` with a size that is not an integral number
7053 of bytes, the result is undefined if the value was not originally
7054 written using a store of the same type.
7055
7056 Examples:
7057 """""""""
7058
7059 .. code-block:: llvm
7060
7061       %ptr = alloca i32                               ; yields i32*:ptr
7062       store i32 3, i32* %ptr                          ; yields void
7063       %val = load i32, i32* %ptr                      ; yields i32:val = i32 3
7064
7065 .. _i_store:
7066
7067 '``store``' Instruction
7068 ^^^^^^^^^^^^^^^^^^^^^^^
7069
7070 Syntax:
7071 """""""
7072
7073 ::
7074
7075       store [volatile] <ty> <value>, <ty>* <pointer>[, align <alignment>][, !nontemporal !<index>][, !invariant.group !<index>]        ; yields void
7076       store atomic [volatile] <ty> <value>, <ty>* <pointer> [singlethread] <ordering>, align <alignment> [, !invariant.group !<index>] ; yields void
7077
7078 Overview:
7079 """""""""
7080
7081 The '``store``' instruction is used to write to memory.
7082
7083 Arguments:
7084 """"""""""
7085
7086 There are two arguments to the ``store`` instruction: a value to store
7087 and an address at which to store it. The type of the ``<pointer>``
7088 operand must be a pointer to the :ref:`first class <t_firstclass>` type of
7089 the ``<value>`` operand. If the ``store`` is marked as ``volatile``,
7090 then the optimizer is not allowed to modify the number or order of
7091 execution of this ``store`` with other :ref:`volatile
7092 operations <volatile>`.
7093
7094 If the ``store`` is marked as ``atomic``, it takes an extra
7095 :ref:`ordering <ordering>` and optional ``singlethread`` argument. The
7096 ``acquire`` and ``acq_rel`` orderings aren't valid on ``store``
7097 instructions. Atomic loads produce :ref:`defined <memmodel>` results
7098 when they may see multiple atomic stores. The type of the pointee must
7099 be an integer type whose bit width is a power of two greater than or
7100 equal to eight and less than or equal to a target-specific size limit.
7101 ``align`` must be explicitly specified on atomic stores, and the store
7102 has undefined behavior if the alignment is not set to a value which is
7103 at least the size in bytes of the pointee. ``!nontemporal`` does not
7104 have any defined semantics for atomic stores.
7105
7106 The optional constant ``align`` argument specifies the alignment of the
7107 operation (that is, the alignment of the memory address). A value of 0
7108 or an omitted ``align`` argument means that the operation has the ABI
7109 alignment for the target. It is the responsibility of the code emitter
7110 to ensure that the alignment information is correct. Overestimating the
7111 alignment results in undefined behavior. Underestimating the
7112 alignment may produce less efficient code. An alignment of 1 is always
7113 safe. The maximum possible alignment is ``1 << 29``.
7114
7115 The optional ``!nontemporal`` metadata must reference a single metadata
7116 name ``<index>`` corresponding to a metadata node with one ``i32`` entry of
7117 value 1. The existence of the ``!nontemporal`` metadata on the instruction
7118 tells the optimizer and code generator that this load is not expected to
7119 be reused in the cache. The code generator may select special
7120 instructions to save cache bandwidth, such as the MOVNT instruction on
7121 x86.
7122
7123 The optional ``!invariant.group`` metadata must reference a 
7124 single metadata name ``<index>``. See ``invariant.group`` metadata.
7125
7126 Semantics:
7127 """"""""""
7128
7129 The contents of memory are updated to contain ``<value>`` at the
7130 location specified by the ``<pointer>`` operand. If ``<value>`` is
7131 of scalar type then the number of bytes written does not exceed the
7132 minimum number of bytes needed to hold all bits of the type. For
7133 example, storing an ``i24`` writes at most three bytes. When writing a
7134 value of a type like ``i20`` with a size that is not an integral number
7135 of bytes, it is unspecified what happens to the extra bits that do not
7136 belong to the type, but they will typically be overwritten.
7137
7138 Example:
7139 """"""""
7140
7141 .. code-block:: llvm
7142
7143       %ptr = alloca i32                               ; yields i32*:ptr
7144       store i32 3, i32* %ptr                          ; yields void
7145       %val = load i32, i32* %ptr                      ; yields i32:val = i32 3
7146
7147 .. _i_fence:
7148
7149 '``fence``' Instruction
7150 ^^^^^^^^^^^^^^^^^^^^^^^
7151
7152 Syntax:
7153 """""""
7154
7155 ::
7156
7157       fence [singlethread] <ordering>                   ; yields void
7158
7159 Overview:
7160 """""""""
7161
7162 The '``fence``' instruction is used to introduce happens-before edges
7163 between operations.
7164
7165 Arguments:
7166 """"""""""
7167
7168 '``fence``' instructions take an :ref:`ordering <ordering>` argument which
7169 defines what *synchronizes-with* edges they add. They can only be given
7170 ``acquire``, ``release``, ``acq_rel``, and ``seq_cst`` orderings.
7171
7172 Semantics:
7173 """"""""""
7174
7175 A fence A which has (at least) ``release`` ordering semantics
7176 *synchronizes with* a fence B with (at least) ``acquire`` ordering
7177 semantics if and only if there exist atomic operations X and Y, both
7178 operating on some atomic object M, such that A is sequenced before X, X
7179 modifies M (either directly or through some side effect of a sequence
7180 headed by X), Y is sequenced before B, and Y observes M. This provides a
7181 *happens-before* dependency between A and B. Rather than an explicit
7182 ``fence``, one (but not both) of the atomic operations X or Y might
7183 provide a ``release`` or ``acquire`` (resp.) ordering constraint and
7184 still *synchronize-with* the explicit ``fence`` and establish the
7185 *happens-before* edge.
7186
7187 A ``fence`` which has ``seq_cst`` ordering, in addition to having both
7188 ``acquire`` and ``release`` semantics specified above, participates in
7189 the global program order of other ``seq_cst`` operations and/or fences.
7190
7191 The optional ":ref:`singlethread <singlethread>`" argument specifies
7192 that the fence only synchronizes with other fences in the same thread.
7193 (This is useful for interacting with signal handlers.)
7194
7195 Example:
7196 """"""""
7197
7198 .. code-block:: llvm
7199
7200       fence acquire                          ; yields void
7201       fence singlethread seq_cst             ; yields void
7202
7203 .. _i_cmpxchg:
7204
7205 '``cmpxchg``' Instruction
7206 ^^^^^^^^^^^^^^^^^^^^^^^^^
7207
7208 Syntax:
7209 """""""
7210
7211 ::
7212
7213       cmpxchg [weak] [volatile] <ty>* <pointer>, <ty> <cmp>, <ty> <new> [singlethread] <success ordering> <failure ordering> ; yields  { ty, i1 }
7214
7215 Overview:
7216 """""""""
7217
7218 The '``cmpxchg``' instruction is used to atomically modify memory. It
7219 loads a value in memory and compares it to a given value. If they are
7220 equal, it tries to store a new value into the memory.
7221
7222 Arguments:
7223 """"""""""
7224
7225 There are three arguments to the '``cmpxchg``' instruction: an address
7226 to operate on, a value to compare to the value currently be at that
7227 address, and a new value to place at that address if the compared values
7228 are equal. The type of '<cmp>' must be an integer type whose bit width
7229 is a power of two greater than or equal to eight and less than or equal
7230 to a target-specific size limit. '<cmp>' and '<new>' must have the same
7231 type, and the type of '<pointer>' must be a pointer to that type. If the
7232 ``cmpxchg`` is marked as ``volatile``, then the optimizer is not allowed
7233 to modify the number or order of execution of this ``cmpxchg`` with
7234 other :ref:`volatile operations <volatile>`.
7235
7236 The success and failure :ref:`ordering <ordering>` arguments specify how this
7237 ``cmpxchg`` synchronizes with other atomic operations. Both ordering parameters
7238 must be at least ``monotonic``, the ordering constraint on failure must be no
7239 stronger than that on success, and the failure ordering cannot be either
7240 ``release`` or ``acq_rel``.
7241
7242 The optional "``singlethread``" argument declares that the ``cmpxchg``
7243 is only atomic with respect to code (usually signal handlers) running in
7244 the same thread as the ``cmpxchg``. Otherwise the cmpxchg is atomic with
7245 respect to all other code in the system.
7246
7247 The pointer passed into cmpxchg must have alignment greater than or
7248 equal to the size in memory of the operand.
7249
7250 Semantics:
7251 """"""""""
7252
7253 The contents of memory at the location specified by the '``<pointer>``' operand
7254 is read and compared to '``<cmp>``'; if the read value is the equal, the
7255 '``<new>``' is written. The original value at the location is returned, together
7256 with a flag indicating success (true) or failure (false).
7257
7258 If the cmpxchg operation is marked as ``weak`` then a spurious failure is
7259 permitted: the operation may not write ``<new>`` even if the comparison
7260 matched.
7261
7262 If the cmpxchg operation is strong (the default), the i1 value is 1 if and only
7263 if the value loaded equals ``cmp``.
7264
7265 A successful ``cmpxchg`` is a read-modify-write instruction for the purpose of
7266 identifying release sequences. A failed ``cmpxchg`` is equivalent to an atomic
7267 load with an ordering parameter determined the second ordering parameter.
7268
7269 Example:
7270 """"""""
7271
7272 .. code-block:: llvm
7273
7274     entry:
7275       %orig = atomic load i32, i32* %ptr unordered                ; yields i32
7276       br label %loop
7277
7278     loop:
7279       %cmp = phi i32 [ %orig, %entry ], [%old, %loop]
7280       %squared = mul i32 %cmp, %cmp
7281       %val_success = cmpxchg i32* %ptr, i32 %cmp, i32 %squared acq_rel monotonic ; yields  { i32, i1 }
7282       %value_loaded = extractvalue { i32, i1 } %val_success, 0
7283       %success = extractvalue { i32, i1 } %val_success, 1
7284       br i1 %success, label %done, label %loop
7285
7286     done:
7287       ...
7288
7289 .. _i_atomicrmw:
7290
7291 '``atomicrmw``' Instruction
7292 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
7293
7294 Syntax:
7295 """""""
7296
7297 ::
7298
7299       atomicrmw [volatile] <operation> <ty>* <pointer>, <ty> <value> [singlethread] <ordering>                   ; yields ty
7300
7301 Overview:
7302 """""""""
7303
7304 The '``atomicrmw``' instruction is used to atomically modify memory.
7305
7306 Arguments:
7307 """"""""""
7308
7309 There are three arguments to the '``atomicrmw``' instruction: an
7310 operation to apply, an address whose value to modify, an argument to the
7311 operation. The operation must be one of the following keywords:
7312
7313 -  xchg
7314 -  add
7315 -  sub
7316 -  and
7317 -  nand
7318 -  or
7319 -  xor
7320 -  max
7321 -  min
7322 -  umax
7323 -  umin
7324
7325 The type of '<value>' must be an integer type whose bit width is a power
7326 of two greater than or equal to eight and less than or equal to a
7327 target-specific size limit. The type of the '``<pointer>``' operand must
7328 be a pointer to that type. If the ``atomicrmw`` is marked as
7329 ``volatile``, then the optimizer is not allowed to modify the number or
7330 order of execution of this ``atomicrmw`` with other :ref:`volatile
7331 operations <volatile>`.
7332
7333 Semantics:
7334 """"""""""
7335
7336 The contents of memory at the location specified by the '``<pointer>``'
7337 operand are atomically read, modified, and written back. The original
7338 value at the location is returned. The modification is specified by the
7339 operation argument:
7340
7341 -  xchg: ``*ptr = val``
7342 -  add: ``*ptr = *ptr + val``
7343 -  sub: ``*ptr = *ptr - val``
7344 -  and: ``*ptr = *ptr & val``
7345 -  nand: ``*ptr = ~(*ptr & val)``
7346 -  or: ``*ptr = *ptr | val``
7347 -  xor: ``*ptr = *ptr ^ val``
7348 -  max: ``*ptr = *ptr > val ? *ptr : val`` (using a signed comparison)
7349 -  min: ``*ptr = *ptr < val ? *ptr : val`` (using a signed comparison)
7350 -  umax: ``*ptr = *ptr > val ? *ptr : val`` (using an unsigned
7351    comparison)
7352 -  umin: ``*ptr = *ptr < val ? *ptr : val`` (using an unsigned
7353    comparison)
7354
7355 Example:
7356 """"""""
7357
7358 .. code-block:: llvm
7359
7360       %old = atomicrmw add i32* %ptr, i32 1 acquire                        ; yields i32
7361
7362 .. _i_getelementptr:
7363
7364 '``getelementptr``' Instruction
7365 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7366
7367 Syntax:
7368 """""""
7369
7370 ::
7371
7372       <result> = getelementptr <ty>, <ty>* <ptrval>{, <ty> <idx>}*
7373       <result> = getelementptr inbounds <ty>, <ty>* <ptrval>{, <ty> <idx>}*
7374       <result> = getelementptr <ty>, <ptr vector> <ptrval>, <vector index type> <idx>
7375
7376 Overview:
7377 """""""""
7378
7379 The '``getelementptr``' instruction is used to get the address of a
7380 subelement of an :ref:`aggregate <t_aggregate>` data structure. It performs
7381 address calculation only and does not access memory. The instruction can also
7382 be used to calculate a vector of such addresses.
7383
7384 Arguments:
7385 """"""""""
7386
7387 The first argument is always a type used as the basis for the calculations.
7388 The second argument is always a pointer or a vector of pointers, and is the
7389 base address to start from. The remaining arguments are indices
7390 that indicate which of the elements of the aggregate object are indexed.
7391 The interpretation of each index is dependent on the type being indexed
7392 into. The first index always indexes the pointer value given as the
7393 first argument, the second index indexes a value of the type pointed to
7394 (not necessarily the value directly pointed to, since the first index
7395 can be non-zero), etc. The first type indexed into must be a pointer
7396 value, subsequent types can be arrays, vectors, and structs. Note that
7397 subsequent types being indexed into can never be pointers, since that
7398 would require loading the pointer before continuing calculation.
7399
7400 The type of each index argument depends on the type it is indexing into.
7401 When indexing into a (optionally packed) structure, only ``i32`` integer
7402 **constants** are allowed (when using a vector of indices they must all
7403 be the **same** ``i32`` integer constant). When indexing into an array,
7404 pointer or vector, integers of any width are allowed, and they are not
7405 required to be constant. These integers are treated as signed values
7406 where relevant.
7407
7408 For example, let's consider a C code fragment and how it gets compiled
7409 to LLVM:
7410
7411 .. code-block:: c
7412
7413     struct RT {
7414       char A;
7415       int B[10][20];
7416       char C;
7417     };
7418     struct ST {
7419       int X;
7420       double Y;
7421       struct RT Z;
7422     };
7423
7424     int *foo(struct ST *s) {
7425       return &s[1].Z.B[5][13];
7426     }
7427
7428 The LLVM code generated by Clang is:
7429
7430 .. code-block:: llvm
7431
7432     %struct.RT = type { i8, [10 x [20 x i32]], i8 }
7433     %struct.ST = type { i32, double, %struct.RT }
7434
7435     define i32* @foo(%struct.ST* %s) nounwind uwtable readnone optsize ssp {
7436     entry:
7437       %arrayidx = getelementptr inbounds %struct.ST, %struct.ST* %s, i64 1, i32 2, i32 1, i64 5, i64 13
7438       ret i32* %arrayidx
7439     }
7440
7441 Semantics:
7442 """"""""""
7443
7444 In the example above, the first index is indexing into the
7445 '``%struct.ST*``' type, which is a pointer, yielding a '``%struct.ST``'
7446 = '``{ i32, double, %struct.RT }``' type, a structure. The second index
7447 indexes into the third element of the structure, yielding a
7448 '``%struct.RT``' = '``{ i8 , [10 x [20 x i32]], i8 }``' type, another
7449 structure. The third index indexes into the second element of the
7450 structure, yielding a '``[10 x [20 x i32]]``' type, an array. The two
7451 dimensions of the array are subscripted into, yielding an '``i32``'
7452 type. The '``getelementptr``' instruction returns a pointer to this
7453 element, thus computing a value of '``i32*``' type.
7454
7455 Note that it is perfectly legal to index partially through a structure,
7456 returning a pointer to an inner element. Because of this, the LLVM code
7457 for the given testcase is equivalent to:
7458
7459 .. code-block:: llvm
7460
7461     define i32* @foo(%struct.ST* %s) {
7462       %t1 = getelementptr %struct.ST, %struct.ST* %s, i32 1                        ; yields %struct.ST*:%t1
7463       %t2 = getelementptr %struct.ST, %struct.ST* %t1, i32 0, i32 2                ; yields %struct.RT*:%t2
7464       %t3 = getelementptr %struct.RT, %struct.RT* %t2, i32 0, i32 1                ; yields [10 x [20 x i32]]*:%t3
7465       %t4 = getelementptr [10 x [20 x i32]], [10 x [20 x i32]]* %t3, i32 0, i32 5  ; yields [20 x i32]*:%t4
7466       %t5 = getelementptr [20 x i32], [20 x i32]* %t4, i32 0, i32 13               ; yields i32*:%t5
7467       ret i32* %t5
7468     }
7469
7470 If the ``inbounds`` keyword is present, the result value of the
7471 ``getelementptr`` is a :ref:`poison value <poisonvalues>` if the base
7472 pointer is not an *in bounds* address of an allocated object, or if any
7473 of the addresses that would be formed by successive addition of the
7474 offsets implied by the indices to the base address with infinitely
7475 precise signed arithmetic are not an *in bounds* address of that
7476 allocated object. The *in bounds* addresses for an allocated object are
7477 all the addresses that point into the object, plus the address one byte
7478 past the end. In cases where the base is a vector of pointers the
7479 ``inbounds`` keyword applies to each of the computations element-wise.
7480
7481 If the ``inbounds`` keyword is not present, the offsets are added to the
7482 base address with silently-wrapping two's complement arithmetic. If the
7483 offsets have a different width from the pointer, they are sign-extended
7484 or truncated to the width of the pointer. The result value of the
7485 ``getelementptr`` may be outside the object pointed to by the base
7486 pointer. The result value may not necessarily be used to access memory
7487 though, even if it happens to point into allocated storage. See the
7488 :ref:`Pointer Aliasing Rules <pointeraliasing>` section for more
7489 information.
7490
7491 The getelementptr instruction is often confusing. For some more insight
7492 into how it works, see :doc:`the getelementptr FAQ <GetElementPtr>`.
7493
7494 Example:
7495 """"""""
7496
7497 .. code-block:: llvm
7498
7499         ; yields [12 x i8]*:aptr
7500         %aptr = getelementptr {i32, [12 x i8]}, {i32, [12 x i8]}* %saptr, i64 0, i32 1
7501         ; yields i8*:vptr
7502         %vptr = getelementptr {i32, <2 x i8>}, {i32, <2 x i8>}* %svptr, i64 0, i32 1, i32 1
7503         ; yields i8*:eptr
7504         %eptr = getelementptr [12 x i8], [12 x i8]* %aptr, i64 0, i32 1
7505         ; yields i32*:iptr
7506         %iptr = getelementptr [10 x i32], [10 x i32]* @arr, i16 0, i16 0
7507
7508 Vector of pointers:
7509 """""""""""""""""""
7510
7511 The ``getelementptr`` returns a vector of pointers, instead of a single address,
7512 when one or more of its arguments is a vector. In such cases, all vector
7513 arguments should have the same number of elements, and every scalar argument
7514 will be effectively broadcast into a vector during address calculation.
7515
7516 .. code-block:: llvm
7517
7518      ; All arguments are vectors:
7519      ;   A[i] = ptrs[i] + offsets[i]*sizeof(i8)
7520      %A = getelementptr i8, <4 x i8*> %ptrs, <4 x i64> %offsets
7521
7522      ; Add the same scalar offset to each pointer of a vector:
7523      ;   A[i] = ptrs[i] + offset*sizeof(i8)
7524      %A = getelementptr i8, <4 x i8*> %ptrs, i64 %offset
7525
7526      ; Add distinct offsets to the same pointer:
7527      ;   A[i] = ptr + offsets[i]*sizeof(i8)
7528      %A = getelementptr i8, i8* %ptr, <4 x i64> %offsets
7529
7530      ; In all cases described above the type of the result is <4 x i8*>
7531
7532 The two following instructions are equivalent:
7533
7534 .. code-block:: llvm
7535
7536      getelementptr  %struct.ST, <4 x %struct.ST*> %s, <4 x i64> %ind1,
7537        <4 x i32> <i32 2, i32 2, i32 2, i32 2>,
7538        <4 x i32> <i32 1, i32 1, i32 1, i32 1>,
7539        <4 x i32> %ind4,
7540        <4 x i64> <i64 13, i64 13, i64 13, i64 13>
7541
7542      getelementptr  %struct.ST, <4 x %struct.ST*> %s, <4 x i64> %ind1,
7543        i32 2, i32 1, <4 x i32> %ind4, i64 13
7544
7545 Let's look at the C code, where the vector version of ``getelementptr``
7546 makes sense:
7547
7548 .. code-block:: c
7549
7550     // Let's assume that we vectorize the following loop:
7551     double *A, B; int *C;
7552     for (int i = 0; i < size; ++i) {
7553       A[i] = B[C[i]];
7554     }
7555
7556 .. code-block:: llvm
7557
7558     ; get pointers for 8 elements from array B
7559     %ptrs = getelementptr double, double* %B, <8 x i32> %C
7560     ; load 8 elements from array B into A
7561     %A = call <8 x double> @llvm.masked.gather.v8f64(<8 x double*> %ptrs,
7562          i32 8, <8 x i1> %mask, <8 x double> %passthru)
7563
7564 Conversion Operations
7565 ---------------------
7566
7567 The instructions in this category are the conversion instructions
7568 (casting) which all take a single operand and a type. They perform
7569 various bit conversions on the operand.
7570
7571 '``trunc .. to``' Instruction
7572 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7573
7574 Syntax:
7575 """""""
7576
7577 ::
7578
7579       <result> = trunc <ty> <value> to <ty2>             ; yields ty2
7580
7581 Overview:
7582 """""""""
7583
7584 The '``trunc``' instruction truncates its operand to the type ``ty2``.
7585
7586 Arguments:
7587 """"""""""
7588
7589 The '``trunc``' instruction takes a value to trunc, and a type to trunc
7590 it to. Both types must be of :ref:`integer <t_integer>` types, or vectors
7591 of the same number of integers. The bit size of the ``value`` must be
7592 larger than the bit size of the destination type, ``ty2``. Equal sized
7593 types are not allowed.
7594
7595 Semantics:
7596 """"""""""
7597
7598 The '``trunc``' instruction truncates the high order bits in ``value``
7599 and converts the remaining bits to ``ty2``. Since the source size must
7600 be larger than the destination size, ``trunc`` cannot be a *no-op cast*.
7601 It will always truncate bits.
7602
7603 Example:
7604 """"""""
7605
7606 .. code-block:: llvm
7607
7608       %X = trunc i32 257 to i8                        ; yields i8:1
7609       %Y = trunc i32 123 to i1                        ; yields i1:true
7610       %Z = trunc i32 122 to i1                        ; yields i1:false
7611       %W = trunc <2 x i16> <i16 8, i16 7> to <2 x i8> ; yields <i8 8, i8 7>
7612
7613 '``zext .. to``' Instruction
7614 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7615
7616 Syntax:
7617 """""""
7618
7619 ::
7620
7621       <result> = zext <ty> <value> to <ty2>             ; yields ty2
7622
7623 Overview:
7624 """""""""
7625
7626 The '``zext``' instruction zero extends its operand to type ``ty2``.
7627
7628 Arguments:
7629 """"""""""
7630
7631 The '``zext``' instruction takes a value to cast, and a type to cast it
7632 to. Both types must be of :ref:`integer <t_integer>` types, or vectors of
7633 the same number of integers. The bit size of the ``value`` must be
7634 smaller than the bit size of the destination type, ``ty2``.
7635
7636 Semantics:
7637 """"""""""
7638
7639 The ``zext`` fills the high order bits of the ``value`` with zero bits
7640 until it reaches the size of the destination type, ``ty2``.
7641
7642 When zero extending from i1, the result will always be either 0 or 1.
7643
7644 Example:
7645 """"""""
7646
7647 .. code-block:: llvm
7648
7649       %X = zext i32 257 to i64              ; yields i64:257
7650       %Y = zext i1 true to i32              ; yields i32:1
7651       %Z = zext <2 x i16> <i16 8, i16 7> to <2 x i32> ; yields <i32 8, i32 7>
7652
7653 '``sext .. to``' Instruction
7654 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7655
7656 Syntax:
7657 """""""
7658
7659 ::
7660
7661       <result> = sext <ty> <value> to <ty2>             ; yields ty2
7662
7663 Overview:
7664 """""""""
7665
7666 The '``sext``' sign extends ``value`` to the type ``ty2``.
7667
7668 Arguments:
7669 """"""""""
7670
7671 The '``sext``' instruction takes a value to cast, and a type to cast it
7672 to. Both types must be of :ref:`integer <t_integer>` types, or vectors of
7673 the same number of integers. The bit size of the ``value`` must be
7674 smaller than the bit size of the destination type, ``ty2``.
7675
7676 Semantics:
7677 """"""""""
7678
7679 The '``sext``' instruction performs a sign extension by copying the sign
7680 bit (highest order bit) of the ``value`` until it reaches the bit size
7681 of the type ``ty2``.
7682
7683 When sign extending from i1, the extension always results in -1 or 0.
7684
7685 Example:
7686 """"""""
7687
7688 .. code-block:: llvm
7689
7690       %X = sext i8  -1 to i16              ; yields i16   :65535
7691       %Y = sext i1 true to i32             ; yields i32:-1
7692       %Z = sext <2 x i16> <i16 8, i16 7> to <2 x i32> ; yields <i32 8, i32 7>
7693
7694 '``fptrunc .. to``' Instruction
7695 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7696
7697 Syntax:
7698 """""""
7699
7700 ::
7701
7702       <result> = fptrunc <ty> <value> to <ty2>             ; yields ty2
7703
7704 Overview:
7705 """""""""
7706
7707 The '``fptrunc``' instruction truncates ``value`` to type ``ty2``.
7708
7709 Arguments:
7710 """"""""""
7711
7712 The '``fptrunc``' instruction takes a :ref:`floating point <t_floating>`
7713 value to cast and a :ref:`floating point <t_floating>` type to cast it to.
7714 The size of ``value`` must be larger than the size of ``ty2``. This
7715 implies that ``fptrunc`` cannot be used to make a *no-op cast*.
7716
7717 Semantics:
7718 """"""""""
7719
7720 The '``fptrunc``' instruction casts a ``value`` from a larger
7721 :ref:`floating point <t_floating>` type to a smaller :ref:`floating
7722 point <t_floating>` type. If the value cannot fit (i.e. overflows) within the
7723 destination type, ``ty2``, then the results are undefined. If the cast produces
7724 an inexact result, how rounding is performed (e.g. truncation, also known as
7725 round to zero) is undefined.
7726
7727 Example:
7728 """"""""
7729
7730 .. code-block:: llvm
7731
7732       %X = fptrunc double 123.0 to float         ; yields float:123.0
7733       %Y = fptrunc double 1.0E+300 to float      ; yields undefined
7734
7735 '``fpext .. to``' Instruction
7736 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7737
7738 Syntax:
7739 """""""
7740
7741 ::
7742
7743       <result> = fpext <ty> <value> to <ty2>             ; yields ty2
7744
7745 Overview:
7746 """""""""
7747
7748 The '``fpext``' extends a floating point ``value`` to a larger floating
7749 point value.
7750
7751 Arguments:
7752 """"""""""
7753
7754 The '``fpext``' instruction takes a :ref:`floating point <t_floating>`
7755 ``value`` to cast, and a :ref:`floating point <t_floating>` type to cast it
7756 to. The source type must be smaller than the destination type.
7757
7758 Semantics:
7759 """"""""""
7760
7761 The '``fpext``' instruction extends the ``value`` from a smaller
7762 :ref:`floating point <t_floating>` type to a larger :ref:`floating
7763 point <t_floating>` type. The ``fpext`` cannot be used to make a
7764 *no-op cast* because it always changes bits. Use ``bitcast`` to make a
7765 *no-op cast* for a floating point cast.
7766
7767 Example:
7768 """"""""
7769
7770 .. code-block:: llvm
7771
7772       %X = fpext float 3.125 to double         ; yields double:3.125000e+00
7773       %Y = fpext double %X to fp128            ; yields fp128:0xL00000000000000004000900000000000
7774
7775 '``fptoui .. to``' Instruction
7776 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7777
7778 Syntax:
7779 """""""
7780
7781 ::
7782
7783       <result> = fptoui <ty> <value> to <ty2>             ; yields ty2
7784
7785 Overview:
7786 """""""""
7787
7788 The '``fptoui``' converts a floating point ``value`` to its unsigned
7789 integer equivalent of type ``ty2``.
7790
7791 Arguments:
7792 """"""""""
7793
7794 The '``fptoui``' instruction takes a value to cast, which must be a
7795 scalar or vector :ref:`floating point <t_floating>` value, and a type to
7796 cast it to ``ty2``, which must be an :ref:`integer <t_integer>` type. If
7797 ``ty`` is a vector floating point type, ``ty2`` must be a vector integer
7798 type with the same number of elements as ``ty``
7799
7800 Semantics:
7801 """"""""""
7802
7803 The '``fptoui``' instruction converts its :ref:`floating
7804 point <t_floating>` operand into the nearest (rounding towards zero)
7805 unsigned integer value. If the value cannot fit in ``ty2``, the results
7806 are undefined.
7807
7808 Example:
7809 """"""""
7810
7811 .. code-block:: llvm
7812
7813       %X = fptoui double 123.0 to i32      ; yields i32:123
7814       %Y = fptoui float 1.0E+300 to i1     ; yields undefined:1
7815       %Z = fptoui float 1.04E+17 to i8     ; yields undefined:1
7816
7817 '``fptosi .. to``' Instruction
7818 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7819
7820 Syntax:
7821 """""""
7822
7823 ::
7824
7825       <result> = fptosi <ty> <value> to <ty2>             ; yields ty2
7826
7827 Overview:
7828 """""""""
7829
7830 The '``fptosi``' instruction converts :ref:`floating point <t_floating>`
7831 ``value`` to type ``ty2``.
7832
7833 Arguments:
7834 """"""""""
7835
7836 The '``fptosi``' instruction takes a value to cast, which must be a
7837 scalar or vector :ref:`floating point <t_floating>` value, and a type to
7838 cast it to ``ty2``, which must be an :ref:`integer <t_integer>` type. If
7839 ``ty`` is a vector floating point type, ``ty2`` must be a vector integer
7840 type with the same number of elements as ``ty``
7841
7842 Semantics:
7843 """"""""""
7844
7845 The '``fptosi``' instruction converts its :ref:`floating
7846 point <t_floating>` operand into the nearest (rounding towards zero)
7847 signed integer value. If the value cannot fit in ``ty2``, the results
7848 are undefined.
7849
7850 Example:
7851 """"""""
7852
7853 .. code-block:: llvm
7854
7855       %X = fptosi double -123.0 to i32      ; yields i32:-123
7856       %Y = fptosi float 1.0E-247 to i1      ; yields undefined:1
7857       %Z = fptosi float 1.04E+17 to i8      ; yields undefined:1
7858
7859 '``uitofp .. to``' Instruction
7860 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7861
7862 Syntax:
7863 """""""
7864
7865 ::
7866
7867       <result> = uitofp <ty> <value> to <ty2>             ; yields ty2
7868
7869 Overview:
7870 """""""""
7871
7872 The '``uitofp``' instruction regards ``value`` as an unsigned integer
7873 and converts that value to the ``ty2`` type.
7874
7875 Arguments:
7876 """"""""""
7877
7878 The '``uitofp``' instruction takes a value to cast, which must be a
7879 scalar or vector :ref:`integer <t_integer>` value, and a type to cast it to
7880 ``ty2``, which must be an :ref:`floating point <t_floating>` type. If
7881 ``ty`` is a vector integer type, ``ty2`` must be a vector floating point
7882 type with the same number of elements as ``ty``
7883
7884 Semantics:
7885 """"""""""
7886
7887 The '``uitofp``' instruction interprets its operand as an unsigned
7888 integer quantity and converts it to the corresponding floating point
7889 value. If the value cannot fit in the floating point value, the results
7890 are undefined.
7891
7892 Example:
7893 """"""""
7894
7895 .. code-block:: llvm
7896
7897       %X = uitofp i32 257 to float         ; yields float:257.0
7898       %Y = uitofp i8 -1 to double          ; yields double:255.0
7899
7900 '``sitofp .. to``' Instruction
7901 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7902
7903 Syntax:
7904 """""""
7905
7906 ::
7907
7908       <result> = sitofp <ty> <value> to <ty2>             ; yields ty2
7909
7910 Overview:
7911 """""""""
7912
7913 The '``sitofp``' instruction regards ``value`` as a signed integer and
7914 converts that value to the ``ty2`` type.
7915
7916 Arguments:
7917 """"""""""
7918
7919 The '``sitofp``' instruction takes a value to cast, which must be a
7920 scalar or vector :ref:`integer <t_integer>` value, and a type to cast it to
7921 ``ty2``, which must be an :ref:`floating point <t_floating>` type. If
7922 ``ty`` is a vector integer type, ``ty2`` must be a vector floating point
7923 type with the same number of elements as ``ty``
7924
7925 Semantics:
7926 """"""""""
7927
7928 The '``sitofp``' instruction interprets its operand as a signed integer
7929 quantity and converts it to the corresponding floating point value. If
7930 the value cannot fit in the floating point value, the results are
7931 undefined.
7932
7933 Example:
7934 """"""""
7935
7936 .. code-block:: llvm
7937
7938       %X = sitofp i32 257 to float         ; yields float:257.0
7939       %Y = sitofp i8 -1 to double          ; yields double:-1.0
7940
7941 .. _i_ptrtoint:
7942
7943 '``ptrtoint .. to``' Instruction
7944 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7945
7946 Syntax:
7947 """""""
7948
7949 ::
7950
7951       <result> = ptrtoint <ty> <value> to <ty2>             ; yields ty2
7952
7953 Overview:
7954 """""""""
7955
7956 The '``ptrtoint``' instruction converts the pointer or a vector of
7957 pointers ``value`` to the integer (or vector of integers) type ``ty2``.
7958
7959 Arguments:
7960 """"""""""
7961
7962 The '``ptrtoint``' instruction takes a ``value`` to cast, which must be
7963 a value of type :ref:`pointer <t_pointer>` or a vector of pointers, and a
7964 type to cast it to ``ty2``, which must be an :ref:`integer <t_integer>` or
7965 a vector of integers type.
7966
7967 Semantics:
7968 """"""""""
7969
7970 The '``ptrtoint``' instruction converts ``value`` to integer type
7971 ``ty2`` by interpreting the pointer value as an integer and either
7972 truncating or zero extending that value to the size of the integer type.
7973 If ``value`` is smaller than ``ty2`` then a zero extension is done. If
7974 ``value`` is larger than ``ty2`` then a truncation is done. If they are
7975 the same size, then nothing is done (*no-op cast*) other than a type
7976 change.
7977
7978 Example:
7979 """"""""
7980
7981 .. code-block:: llvm
7982
7983       %X = ptrtoint i32* %P to i8                         ; yields truncation on 32-bit architecture
7984       %Y = ptrtoint i32* %P to i64                        ; yields zero extension on 32-bit architecture
7985       %Z = ptrtoint <4 x i32*> %P to <4 x i64>; yields vector zero extension for a vector of addresses on 32-bit architecture
7986
7987 .. _i_inttoptr:
7988
7989 '``inttoptr .. to``' Instruction
7990 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
7991
7992 Syntax:
7993 """""""
7994
7995 ::
7996
7997       <result> = inttoptr <ty> <value> to <ty2>             ; yields ty2
7998
7999 Overview:
8000 """""""""
8001
8002 The '``inttoptr``' instruction converts an integer ``value`` to a
8003 pointer type, ``ty2``.
8004
8005 Arguments:
8006 """"""""""
8007
8008 The '``inttoptr``' instruction takes an :ref:`integer <t_integer>` value to
8009 cast, and a type to cast it to, which must be a :ref:`pointer <t_pointer>`
8010 type.
8011
8012 Semantics:
8013 """"""""""
8014
8015 The '``inttoptr``' instruction converts ``value`` to type ``ty2`` by
8016 applying either a zero extension or a truncation depending on the size
8017 of the integer ``value``. If ``value`` is larger than the size of a
8018 pointer then a truncation is done. If ``value`` is smaller than the size
8019 of a pointer then a zero extension is done. If they are the same size,
8020 nothing is done (*no-op cast*).
8021
8022 Example:
8023 """"""""
8024
8025 .. code-block:: llvm
8026
8027       %X = inttoptr i32 255 to i32*          ; yields zero extension on 64-bit architecture
8028       %Y = inttoptr i32 255 to i32*          ; yields no-op on 32-bit architecture
8029       %Z = inttoptr i64 0 to i32*            ; yields truncation on 32-bit architecture
8030       %Z = inttoptr <4 x i32> %G to <4 x i8*>; yields truncation of vector G to four pointers
8031
8032 .. _i_bitcast:
8033
8034 '``bitcast .. to``' Instruction
8035 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
8036
8037 Syntax:
8038 """""""
8039
8040 ::
8041
8042       <result> = bitcast <ty> <value> to <ty2>             ; yields ty2
8043
8044 Overview:
8045 """""""""
8046
8047 The '``bitcast``' instruction converts ``value`` to type ``ty2`` without
8048 changing any bits.
8049
8050 Arguments:
8051 """"""""""
8052
8053 The '``bitcast``' instruction takes a value to cast, which must be a
8054 non-aggregate first class value, and a type to cast it to, which must
8055 also be a non-aggregate :ref:`first class <t_firstclass>` type. The
8056 bit sizes of ``value`` and the destination type, ``ty2``, must be
8057 identical. If the source type is a pointer, the destination type must
8058 also be a pointer of the same size. This instruction supports bitwise
8059 conversion of vectors to integers and to vectors of other types (as
8060 long as they have the same size).
8061
8062 Semantics:
8063 """"""""""
8064
8065 The '``bitcast``' instruction converts ``value`` to type ``ty2``. It
8066 is always a *no-op cast* because no bits change with this
8067 conversion. The conversion is done as if the ``value`` had been stored
8068 to memory and read back as type ``ty2``. Pointer (or vector of
8069 pointers) types may only be converted to other pointer (or vector of
8070 pointers) types with the same address space through this instruction.
8071 To convert pointers to other types, use the :ref:`inttoptr <i_inttoptr>`
8072 or :ref:`ptrtoint <i_ptrtoint>` instructions first.
8073
8074 Example:
8075 """"""""
8076
8077 .. code-block:: llvm
8078
8079       %X = bitcast i8 255 to i8              ; yields i8 :-1
8080       %Y = bitcast i32* %x to sint*          ; yields sint*:%x
8081       %Z = bitcast <2 x int> %V to i64;        ; yields i64: %V
8082       %Z = bitcast <2 x i32*> %V to <2 x i64*> ; yields <2 x i64*>
8083
8084 .. _i_addrspacecast:
8085
8086 '``addrspacecast .. to``' Instruction
8087 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
8088
8089 Syntax:
8090 """""""
8091
8092 ::
8093
8094       <result> = addrspacecast <pty> <ptrval> to <pty2>       ; yields pty2
8095
8096 Overview:
8097 """""""""
8098
8099 The '``addrspacecast``' instruction converts ``ptrval`` from ``pty`` in
8100 address space ``n`` to type ``pty2`` in address space ``m``.
8101
8102 Arguments:
8103 """"""""""
8104
8105 The '``addrspacecast``' instruction takes a pointer or vector of pointer value
8106 to cast and a pointer type to cast it to, which must have a different
8107 address space.
8108
8109 Semantics:
8110 """"""""""
8111
8112 The '``addrspacecast``' instruction converts the pointer value
8113 ``ptrval`` to type ``pty2``. It can be a *no-op cast* or a complex
8114 value modification, depending on the target and the address space
8115 pair. Pointer conversions within the same address space must be
8116 performed with the ``bitcast`` instruction. Note that if the address space
8117 conversion is legal then both result and operand refer to the same memory
8118 location.
8119
8120 Example:
8121 """"""""
8122
8123 .. code-block:: llvm
8124
8125       %X = addrspacecast i32* %x to i32 addrspace(1)*    ; yields i32 addrspace(1)*:%x
8126       %Y = addrspacecast i32 addrspace(1)* %y to i64 addrspace(2)*    ; yields i64 addrspace(2)*:%y
8127       %Z = addrspacecast <4 x i32*> %z to <4 x float addrspace(3)*>   ; yields <4 x float addrspace(3)*>:%z
8128
8129 .. _otherops:
8130
8131 Other Operations
8132 ----------------
8133
8134 The instructions in this category are the "miscellaneous" instructions,
8135 which defy better classification.
8136
8137 .. _i_icmp:
8138
8139 '``icmp``' Instruction
8140 ^^^^^^^^^^^^^^^^^^^^^^
8141
8142 Syntax:
8143 """""""
8144
8145 ::
8146
8147       <result> = icmp <cond> <ty> <op1>, <op2>   ; yields i1 or <N x i1>:result
8148
8149 Overview:
8150 """""""""
8151
8152 The '``icmp``' instruction returns a boolean value or a vector of
8153 boolean values based on comparison of its two integer, integer vector,
8154 pointer, or pointer vector operands.
8155
8156 Arguments:
8157 """"""""""
8158
8159 The '``icmp``' instruction takes three operands. The first operand is
8160 the condition code indicating the kind of comparison to perform. It is
8161 not a value, just a keyword. The possible condition code are:
8162
8163 #. ``eq``: equal
8164 #. ``ne``: not equal
8165 #. ``ugt``: unsigned greater than
8166 #. ``uge``: unsigned greater or equal
8167 #. ``ult``: unsigned less than
8168 #. ``ule``: unsigned less or equal
8169 #. ``sgt``: signed greater than
8170 #. ``sge``: signed greater or equal
8171 #. ``slt``: signed less than
8172 #. ``sle``: signed less or equal
8173
8174 The remaining two arguments must be :ref:`integer <t_integer>` or
8175 :ref:`pointer <t_pointer>` or integer :ref:`vector <t_vector>` typed. They
8176 must also be identical types.
8177
8178 Semantics:
8179 """"""""""
8180
8181 The '``icmp``' compares ``op1`` and ``op2`` according to the condition
8182 code given as ``cond``. The comparison performed always yields either an
8183 :ref:`i1 <t_integer>` or vector of ``i1`` result, as follows:
8184
8185 #. ``eq``: yields ``true`` if the operands are equal, ``false``
8186    otherwise. No sign interpretation is necessary or performed.
8187 #. ``ne``: yields ``true`` if the operands are unequal, ``false``
8188    otherwise. No sign interpretation is necessary or performed.
8189 #. ``ugt``: interprets the operands as unsigned values and yields
8190    ``true`` if ``op1`` is greater than ``op2``.
8191 #. ``uge``: interprets the operands as unsigned values and yields
8192    ``true`` if ``op1`` is greater than or equal to ``op2``.
8193 #. ``ult``: interprets the operands as unsigned values and yields
8194    ``true`` if ``op1`` is less than ``op2``.
8195 #. ``ule``: interprets the operands as unsigned values and yields
8196    ``true`` if ``op1`` is less than or equal to ``op2``.
8197 #. ``sgt``: interprets the operands as signed values and yields ``true``
8198    if ``op1`` is greater than ``op2``.
8199 #. ``sge``: interprets the operands as signed values and yields ``true``
8200    if ``op1`` is greater than or equal to ``op2``.
8201 #. ``slt``: interprets the operands as signed values and yields ``true``
8202    if ``op1`` is less than ``op2``.
8203 #. ``sle``: interprets the operands as signed values and yields ``true``
8204    if ``op1`` is less than or equal to ``op2``.
8205
8206 If the operands are :ref:`pointer <t_pointer>` typed, the pointer values
8207 are compared as if they were integers.
8208
8209 If the operands are integer vectors, then they are compared element by
8210 element. The result is an ``i1`` vector with the same number of elements
8211 as the values being compared. Otherwise, the result is an ``i1``.
8212
8213 Example:
8214 """"""""
8215
8216 .. code-block:: llvm
8217
8218       <result> = icmp eq i32 4, 5          ; yields: result=false
8219       <result> = icmp ne float* %X, %X     ; yields: result=false
8220       <result> = icmp ult i16  4, 5        ; yields: result=true
8221       <result> = icmp sgt i16  4, 5        ; yields: result=false
8222       <result> = icmp ule i16 -4, 5        ; yields: result=false
8223       <result> = icmp sge i16  4, 5        ; yields: result=false
8224
8225 Note that the code generator does not yet support vector types with the
8226 ``icmp`` instruction.
8227
8228 .. _i_fcmp:
8229
8230 '``fcmp``' Instruction
8231 ^^^^^^^^^^^^^^^^^^^^^^
8232
8233 Syntax:
8234 """""""
8235
8236 ::
8237
8238       <result> = fcmp [fast-math flags]* <cond> <ty> <op1>, <op2>     ; yields i1 or <N x i1>:result
8239
8240 Overview:
8241 """""""""
8242
8243 The '``fcmp``' instruction returns a boolean value or vector of boolean
8244 values based on comparison of its operands.
8245
8246 If the operands are floating point scalars, then the result type is a
8247 boolean (:ref:`i1 <t_integer>`).
8248
8249 If the operands are floating point vectors, then the result type is a
8250 vector of boolean with the same number of elements as the operands being
8251 compared.
8252
8253 Arguments:
8254 """"""""""
8255
8256 The '``fcmp``' instruction takes three operands. The first operand is
8257 the condition code indicating the kind of comparison to perform. It is
8258 not a value, just a keyword. The possible condition code are:
8259
8260 #. ``false``: no comparison, always returns false
8261 #. ``oeq``: ordered and equal
8262 #. ``ogt``: ordered and greater than
8263 #. ``oge``: ordered and greater than or equal
8264 #. ``olt``: ordered and less than
8265 #. ``ole``: ordered and less than or equal
8266 #. ``one``: ordered and not equal
8267 #. ``ord``: ordered (no nans)
8268 #. ``ueq``: unordered or equal
8269 #. ``ugt``: unordered or greater than
8270 #. ``uge``: unordered or greater than or equal
8271 #. ``ult``: unordered or less than
8272 #. ``ule``: unordered or less than or equal
8273 #. ``une``: unordered or not equal
8274 #. ``uno``: unordered (either nans)
8275 #. ``true``: no comparison, always returns true
8276
8277 *Ordered* means that neither operand is a QNAN while *unordered* means
8278 that either operand may be a QNAN.
8279
8280 Each of ``val1`` and ``val2`` arguments must be either a :ref:`floating
8281 point <t_floating>` type or a :ref:`vector <t_vector>` of floating point
8282 type. They must have identical types.
8283
8284 Semantics:
8285 """"""""""
8286
8287 The '``fcmp``' instruction compares ``op1`` and ``op2`` according to the
8288 condition code given as ``cond``. If the operands are vectors, then the
8289 vectors are compared element by element. Each comparison performed
8290 always yields an :ref:`i1 <t_integer>` result, as follows:
8291
8292 #. ``false``: always yields ``false``, regardless of operands.
8293 #. ``oeq``: yields ``true`` if both operands are not a QNAN and ``op1``
8294    is equal to ``op2``.
8295 #. ``ogt``: yields ``true`` if both operands are not a QNAN and ``op1``
8296    is greater than ``op2``.
8297 #. ``oge``: yields ``true`` if both operands are not a QNAN and ``op1``
8298    is greater than or equal to ``op2``.
8299 #. ``olt``: yields ``true`` if both operands are not a QNAN and ``op1``
8300    is less than ``op2``.
8301 #. ``ole``: yields ``true`` if both operands are not a QNAN and ``op1``
8302    is less than or equal to ``op2``.
8303 #. ``one``: yields ``true`` if both operands are not a QNAN and ``op1``
8304    is not equal to ``op2``.
8305 #. ``ord``: yields ``true`` if both operands are not a QNAN.
8306 #. ``ueq``: yields ``true`` if either operand is a QNAN or ``op1`` is
8307    equal to ``op2``.
8308 #. ``ugt``: yields ``true`` if either operand is a QNAN or ``op1`` is
8309    greater than ``op2``.
8310 #. ``uge``: yields ``true`` if either operand is a QNAN or ``op1`` is
8311    greater than or equal to ``op2``.
8312 #. ``ult``: yields ``true`` if either operand is a QNAN or ``op1`` is
8313    less than ``op2``.
8314 #. ``ule``: yields ``true`` if either operand is a QNAN or ``op1`` is
8315    less than or equal to ``op2``.
8316 #. ``une``: yields ``true`` if either operand is a QNAN or ``op1`` is
8317    not equal to ``op2``.
8318 #. ``uno``: yields ``true`` if either operand is a QNAN.
8319 #. ``true``: always yields ``true``, regardless of operands.
8320
8321 The ``fcmp`` instruction can also optionally take any number of
8322 :ref:`fast-math flags <fastmath>`, which are optimization hints to enable
8323 otherwise unsafe floating point optimizations.
8324
8325 Any set of fast-math flags are legal on an ``fcmp`` instruction, but the
8326 only flags that have any effect on its semantics are those that allow
8327 assumptions to be made about the values of input arguments; namely
8328 ``nnan``, ``ninf``, and ``nsz``. See :ref:`fastmath` for more information.
8329
8330 Example:
8331 """"""""
8332
8333 .. code-block:: llvm
8334
8335       <result> = fcmp oeq float 4.0, 5.0    ; yields: result=false
8336       <result> = fcmp one float 4.0, 5.0    ; yields: result=true
8337       <result> = fcmp olt float 4.0, 5.0    ; yields: result=true
8338       <result> = fcmp ueq double 1.0, 2.0   ; yields: result=false
8339
8340 Note that the code generator does not yet support vector types with the
8341 ``fcmp`` instruction.
8342
8343 .. _i_phi:
8344
8345 '``phi``' Instruction
8346 ^^^^^^^^^^^^^^^^^^^^^
8347
8348 Syntax:
8349 """""""
8350
8351 ::
8352
8353       <result> = phi <ty> [ <val0>, <label0>], ...
8354
8355 Overview:
8356 """""""""
8357
8358 The '``phi``' instruction is used to implement the Ï† node in the SSA
8359 graph representing the function.
8360
8361 Arguments:
8362 """"""""""
8363
8364 The type of the incoming values is specified with the first type field.
8365 After this, the '``phi``' instruction takes a list of pairs as
8366 arguments, with one pair for each predecessor basic block of the current
8367 block. Only values of :ref:`first class <t_firstclass>` type may be used as
8368 the value arguments to the PHI node. Only labels may be used as the
8369 label arguments.
8370
8371 There must be no non-phi instructions between the start of a basic block
8372 and the PHI instructions: i.e. PHI instructions must be first in a basic
8373 block.
8374
8375 For the purposes of the SSA form, the use of each incoming value is
8376 deemed to occur on the edge from the corresponding predecessor block to
8377 the current block (but after any definition of an '``invoke``'
8378 instruction's return value on the same edge).
8379
8380 Semantics:
8381 """"""""""
8382
8383 At runtime, the '``phi``' instruction logically takes on the value
8384 specified by the pair corresponding to the predecessor basic block that
8385 executed just prior to the current block.
8386
8387 Example:
8388 """"""""
8389
8390 .. code-block:: llvm
8391
8392     Loop:       ; Infinite loop that counts from 0 on up...
8393       %indvar = phi i32 [ 0, %LoopHeader ], [ %nextindvar, %Loop ]
8394       %nextindvar = add i32 %indvar, 1
8395       br label %Loop
8396
8397 .. _i_select:
8398
8399 '``select``' Instruction
8400 ^^^^^^^^^^^^^^^^^^^^^^^^
8401
8402 Syntax:
8403 """""""
8404
8405 ::
8406
8407       <result> = select selty <cond>, <ty> <val1>, <ty> <val2>             ; yields ty
8408
8409       selty is either i1 or {<N x i1>}
8410
8411 Overview:
8412 """""""""
8413
8414 The '``select``' instruction is used to choose one value based on a
8415 condition, without IR-level branching.
8416
8417 Arguments:
8418 """"""""""
8419
8420 The '``select``' instruction requires an 'i1' value or a vector of 'i1'
8421 values indicating the condition, and two values of the same :ref:`first
8422 class <t_firstclass>` type.
8423
8424 Semantics:
8425 """"""""""
8426
8427 If the condition is an i1 and it evaluates to 1, the instruction returns
8428 the first value argument; otherwise, it returns the second value
8429 argument.
8430
8431 If the condition is a vector of i1, then the value arguments must be
8432 vectors of the same size, and the selection is done element by element.
8433
8434 If the condition is an i1 and the value arguments are vectors of the
8435 same size, then an entire vector is selected.
8436
8437 Example:
8438 """"""""
8439
8440 .. code-block:: llvm
8441
8442       %X = select i1 true, i8 17, i8 42          ; yields i8:17
8443
8444 .. _i_call:
8445
8446 '``call``' Instruction
8447 ^^^^^^^^^^^^^^^^^^^^^^
8448
8449 Syntax:
8450 """""""
8451
8452 ::
8453
8454       <result> = [tail | musttail | notail ] call [cconv] [ret attrs] <ty> [<fnty>*] <fnptrval>(<function args>) [fn attrs]
8455                    [ operand bundles ]
8456
8457 Overview:
8458 """""""""
8459
8460 The '``call``' instruction represents a simple function call.
8461
8462 Arguments:
8463 """"""""""
8464
8465 This instruction requires several arguments:
8466
8467 #. The optional ``tail`` and ``musttail`` markers indicate that the optimizers
8468    should perform tail call optimization. The ``tail`` marker is a hint that
8469    `can be ignored <CodeGenerator.html#sibcallopt>`_. The ``musttail`` marker
8470    means that the call must be tail call optimized in order for the program to
8471    be correct. The ``musttail`` marker provides these guarantees:
8472
8473    #. The call will not cause unbounded stack growth if it is part of a
8474       recursive cycle in the call graph.
8475    #. Arguments with the :ref:`inalloca <attr_inalloca>` attribute are
8476       forwarded in place.
8477
8478    Both markers imply that the callee does not access allocas or varargs from
8479    the caller. Calls marked ``musttail`` must obey the following additional
8480    rules:
8481
8482    - The call must immediately precede a :ref:`ret <i_ret>` instruction,
8483      or a pointer bitcast followed by a ret instruction.
8484    - The ret instruction must return the (possibly bitcasted) value
8485      produced by the call or void.
8486    - The caller and callee prototypes must match. Pointer types of
8487      parameters or return types may differ in pointee type, but not
8488      in address space.
8489    - The calling conventions of the caller and callee must match.
8490    - All ABI-impacting function attributes, such as sret, byval, inreg,
8491      returned, and inalloca, must match.
8492    - The callee must be varargs iff the caller is varargs. Bitcasting a
8493      non-varargs function to the appropriate varargs type is legal so
8494      long as the non-varargs prefixes obey the other rules.
8495
8496    Tail call optimization for calls marked ``tail`` is guaranteed to occur if
8497    the following conditions are met:
8498
8499    -  Caller and callee both have the calling convention ``fastcc``.
8500    -  The call is in tail position (ret immediately follows call and ret
8501       uses value of call or is void).
8502    -  Option ``-tailcallopt`` is enabled, or
8503       ``llvm::GuaranteedTailCallOpt`` is ``true``.
8504    -  `Platform-specific constraints are
8505       met. <CodeGenerator.html#tailcallopt>`_
8506
8507 #. The optional ``notail`` marker indicates that the optimizers should not add
8508    ``tail`` or ``musttail`` markers to the call. It is used to prevent tail
8509    call optimization from being performed on the call.
8510
8511 #. The optional "cconv" marker indicates which :ref:`calling
8512    convention <callingconv>` the call should use. If none is
8513    specified, the call defaults to using C calling conventions. The
8514    calling convention of the call must match the calling convention of
8515    the target function, or else the behavior is undefined.
8516 #. The optional :ref:`Parameter Attributes <paramattrs>` list for return
8517    values. Only '``zeroext``', '``signext``', and '``inreg``' attributes
8518    are valid here.
8519 #. '``ty``': the type of the call instruction itself which is also the
8520    type of the return value. Functions that return no value are marked
8521    ``void``.
8522 #. '``fnty``': shall be the signature of the pointer to function value
8523    being invoked. The argument types must match the types implied by
8524    this signature. This type can be omitted if the function is not
8525    varargs and if the function type does not return a pointer to a
8526    function.
8527 #. '``fnptrval``': An LLVM value containing a pointer to a function to
8528    be invoked. In most cases, this is a direct function invocation, but
8529    indirect ``call``'s are just as possible, calling an arbitrary pointer
8530    to function value.
8531 #. '``function args``': argument list whose types match the function
8532    signature argument types and parameter attributes. All arguments must
8533    be of :ref:`first class <t_firstclass>` type. If the function signature
8534    indicates the function accepts a variable number of arguments, the
8535    extra arguments can be specified.
8536 #. The optional :ref:`function attributes <fnattrs>` list. Only
8537    '``noreturn``', '``nounwind``', '``readonly``' and '``readnone``'
8538    attributes are valid here.
8539 #. The optional :ref:`operand bundles <opbundles>` list.
8540
8541 Semantics:
8542 """"""""""
8543
8544 The '``call``' instruction is used to cause control flow to transfer to
8545 a specified function, with its incoming arguments bound to the specified
8546 values. Upon a '``ret``' instruction in the called function, control
8547 flow continues with the instruction after the function call, and the
8548 return value of the function is bound to the result argument.
8549
8550 Example:
8551 """"""""
8552
8553 .. code-block:: llvm
8554
8555       %retval = call i32 @test(i32 %argc)
8556       call i32 (i8*, ...)* @printf(i8* %msg, i32 12, i8 42)        ; yields i32
8557       %X = tail call i32 @foo()                                    ; yields i32
8558       %Y = tail call fastcc i32 @foo()  ; yields i32
8559       call void %foo(i8 97 signext)
8560
8561       %struct.A = type { i32, i8 }
8562       %r = call %struct.A @foo()                        ; yields { i32, i8 }
8563       %gr = extractvalue %struct.A %r, 0                ; yields i32
8564       %gr1 = extractvalue %struct.A %r, 1               ; yields i8
8565       %Z = call void @foo() noreturn                    ; indicates that %foo never returns normally
8566       %ZZ = call zeroext i32 @bar()                     ; Return value is %zero extended
8567
8568 llvm treats calls to some functions with names and arguments that match
8569 the standard C99 library as being the C99 library functions, and may
8570 perform optimizations or generate code for them under that assumption.
8571 This is something we'd like to change in the future to provide better
8572 support for freestanding environments and non-C-based languages.
8573
8574 .. _i_va_arg:
8575
8576 '``va_arg``' Instruction
8577 ^^^^^^^^^^^^^^^^^^^^^^^^
8578
8579 Syntax:
8580 """""""
8581
8582 ::
8583
8584       <resultval> = va_arg <va_list*> <arglist>, <argty>
8585
8586 Overview:
8587 """""""""
8588
8589 The '``va_arg``' instruction is used to access arguments passed through
8590 the "variable argument" area of a function call. It is used to implement
8591 the ``va_arg`` macro in C.
8592
8593 Arguments:
8594 """"""""""
8595
8596 This instruction takes a ``va_list*`` value and the type of the
8597 argument. It returns a value of the specified argument type and
8598 increments the ``va_list`` to point to the next argument. The actual
8599 type of ``va_list`` is target specific.
8600
8601 Semantics:
8602 """"""""""
8603
8604 The '``va_arg``' instruction loads an argument of the specified type
8605 from the specified ``va_list`` and causes the ``va_list`` to point to
8606 the next argument. For more information, see the variable argument
8607 handling :ref:`Intrinsic Functions <int_varargs>`.
8608
8609 It is legal for this instruction to be called in a function which does
8610 not take a variable number of arguments, for example, the ``vfprintf``
8611 function.
8612
8613 ``va_arg`` is an LLVM instruction instead of an :ref:`intrinsic
8614 function <intrinsics>` because it takes a type as an argument.
8615
8616 Example:
8617 """"""""
8618
8619 See the :ref:`variable argument processing <int_varargs>` section.
8620
8621 Note that the code generator does not yet fully support va\_arg on many
8622 targets. Also, it does not currently support va\_arg with aggregate
8623 types on any target.
8624
8625 .. _i_landingpad:
8626
8627 '``landingpad``' Instruction
8628 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
8629
8630 Syntax:
8631 """""""
8632
8633 ::
8634
8635       <resultval> = landingpad <resultty> <clause>+
8636       <resultval> = landingpad <resultty> cleanup <clause>*
8637
8638       <clause> := catch <type> <value>
8639       <clause> := filter <array constant type> <array constant>
8640
8641 Overview:
8642 """""""""
8643
8644 The '``landingpad``' instruction is used by `LLVM's exception handling
8645 system <ExceptionHandling.html#overview>`_ to specify that a basic block
8646 is a landing pad --- one where the exception lands, and corresponds to the
8647 code found in the ``catch`` portion of a ``try``/``catch`` sequence. It
8648 defines values supplied by the :ref:`personality function <personalityfn>` upon
8649 re-entry to the function. The ``resultval`` has the type ``resultty``.
8650
8651 Arguments:
8652 """"""""""
8653
8654 The optional
8655 ``cleanup`` flag indicates that the landing pad block is a cleanup.
8656
8657 A ``clause`` begins with the clause type --- ``catch`` or ``filter`` --- and
8658 contains the global variable representing the "type" that may be caught
8659 or filtered respectively. Unlike the ``catch`` clause, the ``filter``
8660 clause takes an array constant as its argument. Use
8661 "``[0 x i8**] undef``" for a filter which cannot throw. The
8662 '``landingpad``' instruction must contain *at least* one ``clause`` or
8663 the ``cleanup`` flag.
8664
8665 Semantics:
8666 """"""""""
8667
8668 The '``landingpad``' instruction defines the values which are set by the
8669 :ref:`personality function <personalityfn>` upon re-entry to the function, and
8670 therefore the "result type" of the ``landingpad`` instruction. As with
8671 calling conventions, how the personality function results are
8672 represented in LLVM IR is target specific.
8673
8674 The clauses are applied in order from top to bottom. If two
8675 ``landingpad`` instructions are merged together through inlining, the
8676 clauses from the calling function are appended to the list of clauses.
8677 When the call stack is being unwound due to an exception being thrown,
8678 the exception is compared against each ``clause`` in turn. If it doesn't
8679 match any of the clauses, and the ``cleanup`` flag is not set, then
8680 unwinding continues further up the call stack.
8681
8682 The ``landingpad`` instruction has several restrictions:
8683
8684 -  A landing pad block is a basic block which is the unwind destination
8685    of an '``invoke``' instruction.
8686 -  A landing pad block must have a '``landingpad``' instruction as its
8687    first non-PHI instruction.
8688 -  There can be only one '``landingpad``' instruction within the landing
8689    pad block.
8690 -  A basic block that is not a landing pad block may not include a
8691    '``landingpad``' instruction.
8692
8693 Example:
8694 """"""""
8695
8696 .. code-block:: llvm
8697
8698       ;; A landing pad which can catch an integer.
8699       %res = landingpad { i8*, i32 }
8700                catch i8** @_ZTIi
8701       ;; A landing pad that is a cleanup.
8702       %res = landingpad { i8*, i32 }
8703                cleanup
8704       ;; A landing pad which can catch an integer and can only throw a double.
8705       %res = landingpad { i8*, i32 }
8706                catch i8** @_ZTIi
8707                filter [1 x i8**] [@_ZTId]
8708
8709 .. _i_cleanuppad:
8710
8711 '``cleanuppad``' Instruction
8712 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
8713
8714 Syntax:
8715 """""""
8716
8717 ::
8718
8719       <resultval> = cleanuppad [<args>*]
8720
8721 Overview:
8722 """""""""
8723
8724 The '``cleanuppad``' instruction is used by `LLVM's exception handling
8725 system <ExceptionHandling.html#overview>`_ to specify that a basic block
8726 is a cleanup block --- one where a personality routine attempts to
8727 transfer control to run cleanup actions.
8728 The ``args`` correspond to whatever additional
8729 information the :ref:`personality function <personalityfn>` requires to
8730 execute the cleanup.
8731 The ``resultval`` has the type :ref:`token <t_token>` and is used to
8732 match the ``cleanuppad`` to corresponding :ref:`cleanuprets <i_cleanupret>`
8733 and :ref:`cleanupendpads <i_cleanupendpad>`.
8734
8735 Arguments:
8736 """"""""""
8737
8738 The instruction takes a list of arbitrary values which are interpreted
8739 by the :ref:`personality function <personalityfn>`.
8740
8741 Semantics:
8742 """"""""""
8743
8744 When the call stack is being unwound due to an exception being thrown,
8745 the :ref:`personality function <personalityfn>` transfers control to the
8746 ``cleanuppad`` with the aid of the personality-specific arguments.
8747 As with calling conventions, how the personality function results are
8748 represented in LLVM IR is target specific.
8749
8750 The ``cleanuppad`` instruction has several restrictions:
8751
8752 -  A cleanup block is a basic block which is the unwind destination of
8753    an exceptional instruction.
8754 -  A cleanup block must have a '``cleanuppad``' instruction as its
8755    first non-PHI instruction.
8756 -  There can be only one '``cleanuppad``' instruction within the
8757    cleanup block.
8758 -  A basic block that is not a cleanup block may not include a
8759    '``cleanuppad``' instruction.
8760 -  All '``cleanupret``'s and '``cleanupendpad``'s which consume a ``cleanuppad``
8761    must have the same exceptional successor.
8762 -  It is undefined behavior for control to transfer from a ``cleanuppad`` to a
8763    ``ret`` without first executing a ``cleanupret`` or ``cleanupendpad`` that
8764    consumes the ``cleanuppad``.
8765 -  It is undefined behavior for control to transfer from a ``cleanuppad`` to
8766    itself without first executing a ``cleanupret`` or ``cleanupendpad`` that
8767    consumes the ``cleanuppad``.
8768
8769 Example:
8770 """"""""
8771
8772 .. code-block:: llvm
8773
8774       %tok = cleanuppad []
8775
8776 .. _intrinsics:
8777
8778 Intrinsic Functions
8779 ===================
8780
8781 LLVM supports the notion of an "intrinsic function". These functions
8782 have well known names and semantics and are required to follow certain
8783 restrictions. Overall, these intrinsics represent an extension mechanism
8784 for the LLVM language that does not require changing all of the
8785 transformations in LLVM when adding to the language (or the bitcode
8786 reader/writer, the parser, etc...).
8787
8788 Intrinsic function names must all start with an "``llvm.``" prefix. This
8789 prefix is reserved in LLVM for intrinsic names; thus, function names may
8790 not begin with this prefix. Intrinsic functions must always be external
8791 functions: you cannot define the body of intrinsic functions. Intrinsic
8792 functions may only be used in call or invoke instructions: it is illegal
8793 to take the address of an intrinsic function. Additionally, because
8794 intrinsic functions are part of the LLVM language, it is required if any
8795 are added that they be documented here.
8796
8797 Some intrinsic functions can be overloaded, i.e., the intrinsic
8798 represents a family of functions that perform the same operation but on
8799 different data types. Because LLVM can represent over 8 million
8800 different integer types, overloading is used commonly to allow an
8801 intrinsic function to operate on any integer type. One or more of the
8802 argument types or the result type can be overloaded to accept any
8803 integer type. Argument types may also be defined as exactly matching a
8804 previous argument's type or the result type. This allows an intrinsic
8805 function which accepts multiple arguments, but needs all of them to be
8806 of the same type, to only be overloaded with respect to a single
8807 argument or the result.
8808
8809 Overloaded intrinsics will have the names of its overloaded argument
8810 types encoded into its function name, each preceded by a period. Only
8811 those types which are overloaded result in a name suffix. Arguments
8812 whose type is matched against another type do not. For example, the
8813 ``llvm.ctpop`` function can take an integer of any width and returns an
8814 integer of exactly the same integer width. This leads to a family of
8815 functions such as ``i8 @llvm.ctpop.i8(i8 %val)`` and
8816 ``i29 @llvm.ctpop.i29(i29 %val)``. Only one type, the return type, is
8817 overloaded, and only one type suffix is required. Because the argument's
8818 type is matched against the return type, it does not require its own
8819 name suffix.
8820
8821 To learn how to add an intrinsic function, please see the `Extending
8822 LLVM Guide <ExtendingLLVM.html>`_.
8823
8824 .. _int_varargs:
8825
8826 Variable Argument Handling Intrinsics
8827 -------------------------------------
8828
8829 Variable argument support is defined in LLVM with the
8830 :ref:`va_arg <i_va_arg>` instruction and these three intrinsic
8831 functions. These functions are related to the similarly named macros
8832 defined in the ``<stdarg.h>`` header file.
8833
8834 All of these functions operate on arguments that use a target-specific
8835 value type "``va_list``". The LLVM assembly language reference manual
8836 does not define what this type is, so all transformations should be
8837 prepared to handle these functions regardless of the type used.
8838
8839 This example shows how the :ref:`va_arg <i_va_arg>` instruction and the
8840 variable argument handling intrinsic functions are used.
8841
8842 .. code-block:: llvm
8843
8844     ; This struct is different for every platform. For most platforms,
8845     ; it is merely an i8*.
8846     %struct.va_list = type { i8* }
8847
8848     ; For Unix x86_64 platforms, va_list is the following struct:
8849     ; %struct.va_list = type { i32, i32, i8*, i8* }
8850
8851     define i32 @test(i32 %X, ...) {
8852       ; Initialize variable argument processing
8853       %ap = alloca %struct.va_list
8854       %ap2 = bitcast %struct.va_list* %ap to i8*
8855       call void @llvm.va_start(i8* %ap2)
8856
8857       ; Read a single integer argument
8858       %tmp = va_arg i8* %ap2, i32
8859
8860       ; Demonstrate usage of llvm.va_copy and llvm.va_end
8861       %aq = alloca i8*
8862       %aq2 = bitcast i8** %aq to i8*
8863       call void @llvm.va_copy(i8* %aq2, i8* %ap2)
8864       call void @llvm.va_end(i8* %aq2)
8865
8866       ; Stop processing of arguments.
8867       call void @llvm.va_end(i8* %ap2)
8868       ret i32 %tmp
8869     }
8870
8871     declare void @llvm.va_start(i8*)
8872     declare void @llvm.va_copy(i8*, i8*)
8873     declare void @llvm.va_end(i8*)
8874
8875 .. _int_va_start:
8876
8877 '``llvm.va_start``' Intrinsic
8878 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
8879
8880 Syntax:
8881 """""""
8882
8883 ::
8884
8885       declare void @llvm.va_start(i8* <arglist>)
8886
8887 Overview:
8888 """""""""
8889
8890 The '``llvm.va_start``' intrinsic initializes ``*<arglist>`` for
8891 subsequent use by ``va_arg``.
8892
8893 Arguments:
8894 """"""""""
8895
8896 The argument is a pointer to a ``va_list`` element to initialize.
8897
8898 Semantics:
8899 """"""""""
8900
8901 The '``llvm.va_start``' intrinsic works just like the ``va_start`` macro
8902 available in C. In a target-dependent way, it initializes the
8903 ``va_list`` element to which the argument points, so that the next call
8904 to ``va_arg`` will produce the first variable argument passed to the
8905 function. Unlike the C ``va_start`` macro, this intrinsic does not need
8906 to know the last argument of the function as the compiler can figure
8907 that out.
8908
8909 '``llvm.va_end``' Intrinsic
8910 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
8911
8912 Syntax:
8913 """""""
8914
8915 ::
8916
8917       declare void @llvm.va_end(i8* <arglist>)
8918
8919 Overview:
8920 """""""""
8921
8922 The '``llvm.va_end``' intrinsic destroys ``*<arglist>``, which has been
8923 initialized previously with ``llvm.va_start`` or ``llvm.va_copy``.
8924
8925 Arguments:
8926 """"""""""
8927
8928 The argument is a pointer to a ``va_list`` to destroy.
8929
8930 Semantics:
8931 """"""""""
8932
8933 The '``llvm.va_end``' intrinsic works just like the ``va_end`` macro
8934 available in C. In a target-dependent way, it destroys the ``va_list``
8935 element to which the argument points. Calls to
8936 :ref:`llvm.va_start <int_va_start>` and
8937 :ref:`llvm.va_copy <int_va_copy>` must be matched exactly with calls to
8938 ``llvm.va_end``.
8939
8940 .. _int_va_copy:
8941
8942 '``llvm.va_copy``' Intrinsic
8943 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
8944
8945 Syntax:
8946 """""""
8947
8948 ::
8949
8950       declare void @llvm.va_copy(i8* <destarglist>, i8* <srcarglist>)
8951
8952 Overview:
8953 """""""""
8954
8955 The '``llvm.va_copy``' intrinsic copies the current argument position
8956 from the source argument list to the destination argument list.
8957
8958 Arguments:
8959 """"""""""
8960
8961 The first argument is a pointer to a ``va_list`` element to initialize.
8962 The second argument is a pointer to a ``va_list`` element to copy from.
8963
8964 Semantics:
8965 """"""""""
8966
8967 The '``llvm.va_copy``' intrinsic works just like the ``va_copy`` macro
8968 available in C. In a target-dependent way, it copies the source
8969 ``va_list`` element into the destination ``va_list`` element. This
8970 intrinsic is necessary because the `` llvm.va_start`` intrinsic may be
8971 arbitrarily complex and require, for example, memory allocation.
8972
8973 Accurate Garbage Collection Intrinsics
8974 --------------------------------------
8975
8976 LLVM's support for `Accurate Garbage Collection <GarbageCollection.html>`_
8977 (GC) requires the frontend to generate code containing appropriate intrinsic
8978 calls and select an appropriate GC strategy which knows how to lower these
8979 intrinsics in a manner which is appropriate for the target collector.
8980
8981 These intrinsics allow identification of :ref:`GC roots on the
8982 stack <int_gcroot>`, as well as garbage collector implementations that
8983 require :ref:`read <int_gcread>` and :ref:`write <int_gcwrite>` barriers.
8984 Frontends for type-safe garbage collected languages should generate
8985 these intrinsics to make use of the LLVM garbage collectors. For more
8986 details, see `Garbage Collection with LLVM <GarbageCollection.html>`_.
8987
8988 Experimental Statepoint Intrinsics
8989 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
8990
8991 LLVM provides an second experimental set of intrinsics for describing garbage
8992 collection safepoints in compiled code. These intrinsics are an alternative
8993 to the ``llvm.gcroot`` intrinsics, but are compatible with the ones for
8994 :ref:`read <int_gcread>` and :ref:`write <int_gcwrite>` barriers. The
8995 differences in approach are covered in the `Garbage Collection with LLVM
8996 <GarbageCollection.html>`_ documentation. The intrinsics themselves are
8997 described in :doc:`Statepoints`.
8998
8999 .. _int_gcroot:
9000
9001 '``llvm.gcroot``' Intrinsic
9002 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
9003
9004 Syntax:
9005 """""""
9006
9007 ::
9008
9009       declare void @llvm.gcroot(i8** %ptrloc, i8* %metadata)
9010
9011 Overview:
9012 """""""""
9013
9014 The '``llvm.gcroot``' intrinsic declares the existence of a GC root to
9015 the code generator, and allows some metadata to be associated with it.
9016
9017 Arguments:
9018 """"""""""
9019
9020 The first argument specifies the address of a stack object that contains
9021 the root pointer. The second pointer (which must be either a constant or
9022 a global value address) contains the meta-data to be associated with the
9023 root.
9024
9025 Semantics:
9026 """"""""""
9027
9028 At runtime, a call to this intrinsic stores a null pointer into the
9029 "ptrloc" location. At compile-time, the code generator generates
9030 information to allow the runtime to find the pointer at GC safe points.
9031 The '``llvm.gcroot``' intrinsic may only be used in a function which
9032 :ref:`specifies a GC algorithm <gc>`.
9033
9034 .. _int_gcread:
9035
9036 '``llvm.gcread``' Intrinsic
9037 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
9038
9039 Syntax:
9040 """""""
9041
9042 ::
9043
9044       declare i8* @llvm.gcread(i8* %ObjPtr, i8** %Ptr)
9045
9046 Overview:
9047 """""""""
9048
9049 The '``llvm.gcread``' intrinsic identifies reads of references from heap
9050 locations, allowing garbage collector implementations that require read
9051 barriers.
9052
9053 Arguments:
9054 """"""""""
9055
9056 The second argument is the address to read from, which should be an
9057 address allocated from the garbage collector. The first object is a
9058 pointer to the start of the referenced object, if needed by the language
9059 runtime (otherwise null).
9060
9061 Semantics:
9062 """"""""""
9063
9064 The '``llvm.gcread``' intrinsic has the same semantics as a load
9065 instruction, but may be replaced with substantially more complex code by
9066 the garbage collector runtime, as needed. The '``llvm.gcread``'
9067 intrinsic may only be used in a function which :ref:`specifies a GC
9068 algorithm <gc>`.
9069
9070 .. _int_gcwrite:
9071
9072 '``llvm.gcwrite``' Intrinsic
9073 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9074
9075 Syntax:
9076 """""""
9077
9078 ::
9079
9080       declare void @llvm.gcwrite(i8* %P1, i8* %Obj, i8** %P2)
9081
9082 Overview:
9083 """""""""
9084
9085 The '``llvm.gcwrite``' intrinsic identifies writes of references to heap
9086 locations, allowing garbage collector implementations that require write
9087 barriers (such as generational or reference counting collectors).
9088
9089 Arguments:
9090 """"""""""
9091
9092 The first argument is the reference to store, the second is the start of
9093 the object to store it to, and the third is the address of the field of
9094 Obj to store to. If the runtime does not require a pointer to the
9095 object, Obj may be null.
9096
9097 Semantics:
9098 """"""""""
9099
9100 The '``llvm.gcwrite``' intrinsic has the same semantics as a store
9101 instruction, but may be replaced with substantially more complex code by
9102 the garbage collector runtime, as needed. The '``llvm.gcwrite``'
9103 intrinsic may only be used in a function which :ref:`specifies a GC
9104 algorithm <gc>`.
9105
9106 Code Generator Intrinsics
9107 -------------------------
9108
9109 These intrinsics are provided by LLVM to expose special features that
9110 may only be implemented with code generator support.
9111
9112 '``llvm.returnaddress``' Intrinsic
9113 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9114
9115 Syntax:
9116 """""""
9117
9118 ::
9119
9120       declare i8  *@llvm.returnaddress(i32 <level>)
9121
9122 Overview:
9123 """""""""
9124
9125 The '``llvm.returnaddress``' intrinsic attempts to compute a
9126 target-specific value indicating the return address of the current
9127 function or one of its callers.
9128
9129 Arguments:
9130 """"""""""
9131
9132 The argument to this intrinsic indicates which function to return the
9133 address for. Zero indicates the calling function, one indicates its
9134 caller, etc. The argument is **required** to be a constant integer
9135 value.
9136
9137 Semantics:
9138 """"""""""
9139
9140 The '``llvm.returnaddress``' intrinsic either returns a pointer
9141 indicating the return address of the specified call frame, or zero if it
9142 cannot be identified. The value returned by this intrinsic is likely to
9143 be incorrect or 0 for arguments other than zero, so it should only be
9144 used for debugging purposes.
9145
9146 Note that calling this intrinsic does not prevent function inlining or
9147 other aggressive transformations, so the value returned may not be that
9148 of the obvious source-language caller.
9149
9150 '``llvm.frameaddress``' Intrinsic
9151 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9152
9153 Syntax:
9154 """""""
9155
9156 ::
9157
9158       declare i8* @llvm.frameaddress(i32 <level>)
9159
9160 Overview:
9161 """""""""
9162
9163 The '``llvm.frameaddress``' intrinsic attempts to return the
9164 target-specific frame pointer value for the specified stack frame.
9165
9166 Arguments:
9167 """"""""""
9168
9169 The argument to this intrinsic indicates which function to return the
9170 frame pointer for. Zero indicates the calling function, one indicates
9171 its caller, etc. The argument is **required** to be a constant integer
9172 value.
9173
9174 Semantics:
9175 """"""""""
9176
9177 The '``llvm.frameaddress``' intrinsic either returns a pointer
9178 indicating the frame address of the specified call frame, or zero if it
9179 cannot be identified. The value returned by this intrinsic is likely to
9180 be incorrect or 0 for arguments other than zero, so it should only be
9181 used for debugging purposes.
9182
9183 Note that calling this intrinsic does not prevent function inlining or
9184 other aggressive transformations, so the value returned may not be that
9185 of the obvious source-language caller.
9186
9187 '``llvm.localescape``' and '``llvm.localrecover``' Intrinsics
9188 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9189
9190 Syntax:
9191 """""""
9192
9193 ::
9194
9195       declare void @llvm.localescape(...)
9196       declare i8* @llvm.localrecover(i8* %func, i8* %fp, i32 %idx)
9197
9198 Overview:
9199 """""""""
9200
9201 The '``llvm.localescape``' intrinsic escapes offsets of a collection of static
9202 allocas, and the '``llvm.localrecover``' intrinsic applies those offsets to a
9203 live frame pointer to recover the address of the allocation. The offset is
9204 computed during frame layout of the caller of ``llvm.localescape``.
9205
9206 Arguments:
9207 """"""""""
9208
9209 All arguments to '``llvm.localescape``' must be pointers to static allocas or
9210 casts of static allocas. Each function can only call '``llvm.localescape``'
9211 once, and it can only do so from the entry block.
9212
9213 The ``func`` argument to '``llvm.localrecover``' must be a constant
9214 bitcasted pointer to a function defined in the current module. The code
9215 generator cannot determine the frame allocation offset of functions defined in
9216 other modules.
9217
9218 The ``fp`` argument to '``llvm.localrecover``' must be a frame pointer of a
9219 call frame that is currently live. The return value of '``llvm.localaddress``'
9220 is one way to produce such a value, but various runtimes also expose a suitable
9221 pointer in platform-specific ways.
9222
9223 The ``idx`` argument to '``llvm.localrecover``' indicates which alloca passed to
9224 '``llvm.localescape``' to recover. It is zero-indexed.
9225
9226 Semantics:
9227 """"""""""
9228
9229 These intrinsics allow a group of functions to share access to a set of local
9230 stack allocations of a one parent function. The parent function may call the
9231 '``llvm.localescape``' intrinsic once from the function entry block, and the
9232 child functions can use '``llvm.localrecover``' to access the escaped allocas.
9233 The '``llvm.localescape``' intrinsic blocks inlining, as inlining changes where
9234 the escaped allocas are allocated, which would break attempts to use
9235 '``llvm.localrecover``'.
9236
9237 .. _int_read_register:
9238 .. _int_write_register:
9239
9240 '``llvm.read_register``' and '``llvm.write_register``' Intrinsics
9241 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9242
9243 Syntax:
9244 """""""
9245
9246 ::
9247
9248       declare i32 @llvm.read_register.i32(metadata)
9249       declare i64 @llvm.read_register.i64(metadata)
9250       declare void @llvm.write_register.i32(metadata, i32 @value)
9251       declare void @llvm.write_register.i64(metadata, i64 @value)
9252       !0 = !{!"sp\00"}
9253
9254 Overview:
9255 """""""""
9256
9257 The '``llvm.read_register``' and '``llvm.write_register``' intrinsics
9258 provides access to the named register. The register must be valid on
9259 the architecture being compiled to. The type needs to be compatible
9260 with the register being read.
9261
9262 Semantics:
9263 """"""""""
9264
9265 The '``llvm.read_register``' intrinsic returns the current value of the
9266 register, where possible. The '``llvm.write_register``' intrinsic sets
9267 the current value of the register, where possible.
9268
9269 This is useful to implement named register global variables that need
9270 to always be mapped to a specific register, as is common practice on
9271 bare-metal programs including OS kernels.
9272
9273 The compiler doesn't check for register availability or use of the used
9274 register in surrounding code, including inline assembly. Because of that,
9275 allocatable registers are not supported.
9276
9277 Warning: So far it only works with the stack pointer on selected
9278 architectures (ARM, AArch64, PowerPC and x86_64). Significant amount of
9279 work is needed to support other registers and even more so, allocatable
9280 registers.
9281
9282 .. _int_stacksave:
9283
9284 '``llvm.stacksave``' Intrinsic
9285 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9286
9287 Syntax:
9288 """""""
9289
9290 ::
9291
9292       declare i8* @llvm.stacksave()
9293
9294 Overview:
9295 """""""""
9296
9297 The '``llvm.stacksave``' intrinsic is used to remember the current state
9298 of the function stack, for use with
9299 :ref:`llvm.stackrestore <int_stackrestore>`. This is useful for
9300 implementing language features like scoped automatic variable sized
9301 arrays in C99.
9302
9303 Semantics:
9304 """"""""""
9305
9306 This intrinsic returns a opaque pointer value that can be passed to
9307 :ref:`llvm.stackrestore <int_stackrestore>`. When an
9308 ``llvm.stackrestore`` intrinsic is executed with a value saved from
9309 ``llvm.stacksave``, it effectively restores the state of the stack to
9310 the state it was in when the ``llvm.stacksave`` intrinsic executed. In
9311 practice, this pops any :ref:`alloca <i_alloca>` blocks from the stack that
9312 were allocated after the ``llvm.stacksave`` was executed.
9313
9314 .. _int_stackrestore:
9315
9316 '``llvm.stackrestore``' Intrinsic
9317 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9318
9319 Syntax:
9320 """""""
9321
9322 ::
9323
9324       declare void @llvm.stackrestore(i8* %ptr)
9325
9326 Overview:
9327 """""""""
9328
9329 The '``llvm.stackrestore``' intrinsic is used to restore the state of
9330 the function stack to the state it was in when the corresponding
9331 :ref:`llvm.stacksave <int_stacksave>` intrinsic executed. This is
9332 useful for implementing language features like scoped automatic variable
9333 sized arrays in C99.
9334
9335 Semantics:
9336 """"""""""
9337
9338 See the description for :ref:`llvm.stacksave <int_stacksave>`.
9339
9340 .. _int_get_dynamic_area_offset:
9341
9342 '``llvm.get.dynamic.area.offset``' Intrinsic
9343 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9344
9345 Syntax:
9346 """""""
9347
9348 ::
9349
9350       declare i32 @llvm.get.dynamic.area.offset.i32()
9351       declare i64 @llvm.get.dynamic.area.offset.i64()
9352
9353       Overview:
9354       """""""""
9355
9356       The '``llvm.get.dynamic.area.offset.*``' intrinsic family is used to
9357       get the offset from native stack pointer to the address of the most
9358       recent dynamic alloca on the caller's stack. These intrinsics are
9359       intendend for use in combination with
9360       :ref:`llvm.stacksave <int_stacksave>` to get a
9361       pointer to the most recent dynamic alloca. This is useful, for example,
9362       for AddressSanitizer's stack unpoisoning routines.
9363
9364 Semantics:
9365 """"""""""
9366
9367       These intrinsics return a non-negative integer value that can be used to
9368       get the address of the most recent dynamic alloca, allocated by :ref:`alloca <i_alloca>`
9369       on the caller's stack. In particular, for targets where stack grows downwards,
9370       adding this offset to the native stack pointer would get the address of the most
9371       recent dynamic alloca. For targets where stack grows upwards, the situation is a bit more
9372       complicated, because substracting this value from stack pointer would get the address
9373       one past the end of the most recent dynamic alloca.
9374
9375       Although for most targets `llvm.get.dynamic.area.offset <int_get_dynamic_area_offset>`
9376       returns just a zero, for others, such as PowerPC and PowerPC64, it returns a
9377       compile-time-known constant value.
9378
9379       The return value type of :ref:`llvm.get.dynamic.area.offset <int_get_dynamic_area_offset>`
9380       must match the target's generic address space's (address space 0) pointer type.
9381
9382 '``llvm.prefetch``' Intrinsic
9383 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9384
9385 Syntax:
9386 """""""
9387
9388 ::
9389
9390       declare void @llvm.prefetch(i8* <address>, i32 <rw>, i32 <locality>, i32 <cache type>)
9391
9392 Overview:
9393 """""""""
9394
9395 The '``llvm.prefetch``' intrinsic is a hint to the code generator to
9396 insert a prefetch instruction if supported; otherwise, it is a noop.
9397 Prefetches have no effect on the behavior of the program but can change
9398 its performance characteristics.
9399
9400 Arguments:
9401 """"""""""
9402
9403 ``address`` is the address to be prefetched, ``rw`` is the specifier
9404 determining if the fetch should be for a read (0) or write (1), and
9405 ``locality`` is a temporal locality specifier ranging from (0) - no
9406 locality, to (3) - extremely local keep in cache. The ``cache type``
9407 specifies whether the prefetch is performed on the data (1) or
9408 instruction (0) cache. The ``rw``, ``locality`` and ``cache type``
9409 arguments must be constant integers.
9410
9411 Semantics:
9412 """"""""""
9413
9414 This intrinsic does not modify the behavior of the program. In
9415 particular, prefetches cannot trap and do not produce a value. On
9416 targets that support this intrinsic, the prefetch can provide hints to
9417 the processor cache for better performance.
9418
9419 '``llvm.pcmarker``' Intrinsic
9420 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9421
9422 Syntax:
9423 """""""
9424
9425 ::
9426
9427       declare void @llvm.pcmarker(i32 <id>)
9428
9429 Overview:
9430 """""""""
9431
9432 The '``llvm.pcmarker``' intrinsic is a method to export a Program
9433 Counter (PC) in a region of code to simulators and other tools. The
9434 method is target specific, but it is expected that the marker will use
9435 exported symbols to transmit the PC of the marker. The marker makes no
9436 guarantees that it will remain with any specific instruction after
9437 optimizations. It is possible that the presence of a marker will inhibit
9438 optimizations. The intended use is to be inserted after optimizations to
9439 allow correlations of simulation runs.
9440
9441 Arguments:
9442 """"""""""
9443
9444 ``id`` is a numerical id identifying the marker.
9445
9446 Semantics:
9447 """"""""""
9448
9449 This intrinsic does not modify the behavior of the program. Backends
9450 that do not support this intrinsic may ignore it.
9451
9452 '``llvm.readcyclecounter``' Intrinsic
9453 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9454
9455 Syntax:
9456 """""""
9457
9458 ::
9459
9460       declare i64 @llvm.readcyclecounter()
9461
9462 Overview:
9463 """""""""
9464
9465 The '``llvm.readcyclecounter``' intrinsic provides access to the cycle
9466 counter register (or similar low latency, high accuracy clocks) on those
9467 targets that support it. On X86, it should map to RDTSC. On Alpha, it
9468 should map to RPCC. As the backing counters overflow quickly (on the
9469 order of 9 seconds on alpha), this should only be used for small
9470 timings.
9471
9472 Semantics:
9473 """"""""""
9474
9475 When directly supported, reading the cycle counter should not modify any
9476 memory. Implementations are allowed to either return a application
9477 specific value or a system wide value. On backends without support, this
9478 is lowered to a constant 0.
9479
9480 Note that runtime support may be conditional on the privilege-level code is
9481 running at and the host platform.
9482
9483 '``llvm.clear_cache``' Intrinsic
9484 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9485
9486 Syntax:
9487 """""""
9488
9489 ::
9490
9491       declare void @llvm.clear_cache(i8*, i8*)
9492
9493 Overview:
9494 """""""""
9495
9496 The '``llvm.clear_cache``' intrinsic ensures visibility of modifications
9497 in the specified range to the execution unit of the processor. On
9498 targets with non-unified instruction and data cache, the implementation
9499 flushes the instruction cache.
9500
9501 Semantics:
9502 """"""""""
9503
9504 On platforms with coherent instruction and data caches (e.g. x86), this
9505 intrinsic is a nop. On platforms with non-coherent instruction and data
9506 cache (e.g. ARM, MIPS), the intrinsic is lowered either to appropriate
9507 instructions or a system call, if cache flushing requires special
9508 privileges.
9509
9510 The default behavior is to emit a call to ``__clear_cache`` from the run
9511 time library.
9512
9513 This instrinsic does *not* empty the instruction pipeline. Modifications
9514 of the current function are outside the scope of the intrinsic.
9515
9516 '``llvm.instrprof_increment``' Intrinsic
9517 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9518
9519 Syntax:
9520 """""""
9521
9522 ::
9523
9524       declare void @llvm.instrprof_increment(i8* <name>, i64 <hash>,
9525                                              i32 <num-counters>, i32 <index>)
9526
9527 Overview:
9528 """""""""
9529
9530 The '``llvm.instrprof_increment``' intrinsic can be emitted by a
9531 frontend for use with instrumentation based profiling. These will be
9532 lowered by the ``-instrprof`` pass to generate execution counts of a
9533 program at runtime.
9534
9535 Arguments:
9536 """"""""""
9537
9538 The first argument is a pointer to a global variable containing the
9539 name of the entity being instrumented. This should generally be the
9540 (mangled) function name for a set of counters.
9541
9542 The second argument is a hash value that can be used by the consumer
9543 of the profile data to detect changes to the instrumented source, and
9544 the third is the number of counters associated with ``name``. It is an
9545 error if ``hash`` or ``num-counters`` differ between two instances of
9546 ``instrprof_increment`` that refer to the same name.
9547
9548 The last argument refers to which of the counters for ``name`` should
9549 be incremented. It should be a value between 0 and ``num-counters``.
9550
9551 Semantics:
9552 """"""""""
9553
9554 This intrinsic represents an increment of a profiling counter. It will
9555 cause the ``-instrprof`` pass to generate the appropriate data
9556 structures and the code to increment the appropriate value, in a
9557 format that can be written out by a compiler runtime and consumed via
9558 the ``llvm-profdata`` tool.
9559
9560 '``llvm.instrprof_value_profile``' Intrinsic
9561 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9562
9563 Syntax:
9564 """""""
9565
9566 ::
9567
9568       declare void @llvm.instrprof_value_profile(i8* <name>, i64 <hash>,
9569                                                  i64 <value>, i32 <value_kind>,
9570                                                  i32 <index>)
9571
9572 Overview:
9573 """""""""
9574
9575 The '``llvm.instrprof_value_profile``' intrinsic can be emitted by a
9576 frontend for use with instrumentation based profiling. This will be
9577 lowered by the ``-instrprof`` pass to find out the target values,
9578 instrumented expressions take in a program at runtime.
9579
9580 Arguments:
9581 """"""""""
9582
9583 The first argument is a pointer to a global variable containing the
9584 name of the entity being instrumented. ``name`` should generally be the
9585 (mangled) function name for a set of counters.
9586
9587 The second argument is a hash value that can be used by the consumer
9588 of the profile data to detect changes to the instrumented source. It
9589 is an error if ``hash`` differs between two instances of
9590 ``llvm.instrprof_*`` that refer to the same name.
9591
9592 The third argument is the value of the expression being profiled. The profiled
9593 expression's value should be representable as an unsigned 64-bit value. The
9594 fourth argument represents the kind of value profiling that is being done. The
9595 supported value profiling kinds are enumerated through the
9596 ``InstrProfValueKind`` type declared in the
9597 ``<include/llvm/ProfileData/InstrProf.h>`` header file. The last argument is the
9598 index of the instrumented expression within ``name``. It should be >= 0.
9599
9600 Semantics:
9601 """"""""""
9602
9603 This intrinsic represents the point where a call to a runtime routine
9604 should be inserted for value profiling of target expressions. ``-instrprof``
9605 pass will generate the appropriate data structures and replace the
9606 ``llvm.instrprof_value_profile`` intrinsic with the call to the profile
9607 runtime library with proper arguments.
9608
9609 Standard C Library Intrinsics
9610 -----------------------------
9611
9612 LLVM provides intrinsics for a few important standard C library
9613 functions. These intrinsics allow source-language front-ends to pass
9614 information about the alignment of the pointer arguments to the code
9615 generator, providing opportunity for more efficient code generation.
9616
9617 .. _int_memcpy:
9618
9619 '``llvm.memcpy``' Intrinsic
9620 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
9621
9622 Syntax:
9623 """""""
9624
9625 This is an overloaded intrinsic. You can use ``llvm.memcpy`` on any
9626 integer bit width and for different address spaces. Not all targets
9627 support all bit widths however.
9628
9629 ::
9630
9631       declare void @llvm.memcpy.p0i8.p0i8.i32(i8* <dest>, i8* <src>,
9632                                               i32 <len>, i32 <align>, i1 <isvolatile>)
9633       declare void @llvm.memcpy.p0i8.p0i8.i64(i8* <dest>, i8* <src>,
9634                                               i64 <len>, i32 <align>, i1 <isvolatile>)
9635
9636 Overview:
9637 """""""""
9638
9639 The '``llvm.memcpy.*``' intrinsics copy a block of memory from the
9640 source location to the destination location.
9641
9642 Note that, unlike the standard libc function, the ``llvm.memcpy.*``
9643 intrinsics do not return a value, takes extra alignment/isvolatile
9644 arguments and the pointers can be in specified address spaces.
9645
9646 Arguments:
9647 """"""""""
9648
9649 The first argument is a pointer to the destination, the second is a
9650 pointer to the source. The third argument is an integer argument
9651 specifying the number of bytes to copy, the fourth argument is the
9652 alignment of the source and destination locations, and the fifth is a
9653 boolean indicating a volatile access.
9654
9655 If the call to this intrinsic has an alignment value that is not 0 or 1,
9656 then the caller guarantees that both the source and destination pointers
9657 are aligned to that boundary.
9658
9659 If the ``isvolatile`` parameter is ``true``, the ``llvm.memcpy`` call is
9660 a :ref:`volatile operation <volatile>`. The detailed access behavior is not
9661 very cleanly specified and it is unwise to depend on it.
9662
9663 Semantics:
9664 """"""""""
9665
9666 The '``llvm.memcpy.*``' intrinsics copy a block of memory from the
9667 source location to the destination location, which are not allowed to
9668 overlap. It copies "len" bytes of memory over. If the argument is known
9669 to be aligned to some boundary, this can be specified as the fourth
9670 argument, otherwise it should be set to 0 or 1 (both meaning no alignment).
9671
9672 '``llvm.memmove``' Intrinsic
9673 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9674
9675 Syntax:
9676 """""""
9677
9678 This is an overloaded intrinsic. You can use llvm.memmove on any integer
9679 bit width and for different address space. Not all targets support all
9680 bit widths however.
9681
9682 ::
9683
9684       declare void @llvm.memmove.p0i8.p0i8.i32(i8* <dest>, i8* <src>,
9685                                                i32 <len>, i32 <align>, i1 <isvolatile>)
9686       declare void @llvm.memmove.p0i8.p0i8.i64(i8* <dest>, i8* <src>,
9687                                                i64 <len>, i32 <align>, i1 <isvolatile>)
9688
9689 Overview:
9690 """""""""
9691
9692 The '``llvm.memmove.*``' intrinsics move a block of memory from the
9693 source location to the destination location. It is similar to the
9694 '``llvm.memcpy``' intrinsic but allows the two memory locations to
9695 overlap.
9696
9697 Note that, unlike the standard libc function, the ``llvm.memmove.*``
9698 intrinsics do not return a value, takes extra alignment/isvolatile
9699 arguments and the pointers can be in specified address spaces.
9700
9701 Arguments:
9702 """"""""""
9703
9704 The first argument is a pointer to the destination, the second is a
9705 pointer to the source. The third argument is an integer argument
9706 specifying the number of bytes to copy, the fourth argument is the
9707 alignment of the source and destination locations, and the fifth is a
9708 boolean indicating a volatile access.
9709
9710 If the call to this intrinsic has an alignment value that is not 0 or 1,
9711 then the caller guarantees that the source and destination pointers are
9712 aligned to that boundary.
9713
9714 If the ``isvolatile`` parameter is ``true``, the ``llvm.memmove`` call
9715 is a :ref:`volatile operation <volatile>`. The detailed access behavior is
9716 not very cleanly specified and it is unwise to depend on it.
9717
9718 Semantics:
9719 """"""""""
9720
9721 The '``llvm.memmove.*``' intrinsics copy a block of memory from the
9722 source location to the destination location, which may overlap. It
9723 copies "len" bytes of memory over. If the argument is known to be
9724 aligned to some boundary, this can be specified as the fourth argument,
9725 otherwise it should be set to 0 or 1 (both meaning no alignment).
9726
9727 '``llvm.memset.*``' Intrinsics
9728 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
9729
9730 Syntax:
9731 """""""
9732
9733 This is an overloaded intrinsic. You can use llvm.memset on any integer
9734 bit width and for different address spaces. However, not all targets
9735 support all bit widths.
9736
9737 ::
9738
9739       declare void @llvm.memset.p0i8.i32(i8* <dest>, i8 <val>,
9740                                          i32 <len>, i32 <align>, i1 <isvolatile>)
9741       declare void @llvm.memset.p0i8.i64(i8* <dest>, i8 <val>,
9742                                          i64 <len>, i32 <align>, i1 <isvolatile>)
9743
9744 Overview:
9745 """""""""
9746
9747 The '``llvm.memset.*``' intrinsics fill a block of memory with a
9748 particular byte value.
9749
9750 Note that, unlike the standard libc function, the ``llvm.memset``
9751 intrinsic does not return a value and takes extra alignment/volatile
9752 arguments. Also, the destination can be in an arbitrary address space.
9753
9754 Arguments:
9755 """"""""""
9756
9757 The first argument is a pointer to the destination to fill, the second
9758 is the byte value with which to fill it, the third argument is an
9759 integer argument specifying the number of bytes to fill, and the fourth
9760 argument is the known alignment of the destination location.
9761
9762 If the call to this intrinsic has an alignment value that is not 0 or 1,
9763 then the caller guarantees that the destination pointer is aligned to
9764 that boundary.
9765
9766 If the ``isvolatile`` parameter is ``true``, the ``llvm.memset`` call is
9767 a :ref:`volatile operation <volatile>`. The detailed access behavior is not
9768 very cleanly specified and it is unwise to depend on it.
9769
9770 Semantics:
9771 """"""""""
9772
9773 The '``llvm.memset.*``' intrinsics fill "len" bytes of memory starting
9774 at the destination location. If the argument is known to be aligned to
9775 some boundary, this can be specified as the fourth argument, otherwise
9776 it should be set to 0 or 1 (both meaning no alignment).
9777
9778 '``llvm.sqrt.*``' Intrinsic
9779 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
9780
9781 Syntax:
9782 """""""
9783
9784 This is an overloaded intrinsic. You can use ``llvm.sqrt`` on any
9785 floating point or vector of floating point type. Not all targets support
9786 all types however.
9787
9788 ::
9789
9790       declare float     @llvm.sqrt.f32(float %Val)
9791       declare double    @llvm.sqrt.f64(double %Val)
9792       declare x86_fp80  @llvm.sqrt.f80(x86_fp80 %Val)
9793       declare fp128     @llvm.sqrt.f128(fp128 %Val)
9794       declare ppc_fp128 @llvm.sqrt.ppcf128(ppc_fp128 %Val)
9795
9796 Overview:
9797 """""""""
9798
9799 The '``llvm.sqrt``' intrinsics return the sqrt of the specified operand,
9800 returning the same value as the libm '``sqrt``' functions would. Unlike
9801 ``sqrt`` in libm, however, ``llvm.sqrt`` has undefined behavior for
9802 negative numbers other than -0.0 (which allows for better optimization,
9803 because there is no need to worry about errno being set).
9804 ``llvm.sqrt(-0.0)`` is defined to return -0.0 like IEEE sqrt.
9805
9806 Arguments:
9807 """"""""""
9808
9809 The argument and return value are floating point numbers of the same
9810 type.
9811
9812 Semantics:
9813 """"""""""
9814
9815 This function returns the sqrt of the specified operand if it is a
9816 nonnegative floating point number.
9817
9818 '``llvm.powi.*``' Intrinsic
9819 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
9820
9821 Syntax:
9822 """""""
9823
9824 This is an overloaded intrinsic. You can use ``llvm.powi`` on any
9825 floating point or vector of floating point type. Not all targets support
9826 all types however.
9827
9828 ::
9829
9830       declare float     @llvm.powi.f32(float  %Val, i32 %power)
9831       declare double    @llvm.powi.f64(double %Val, i32 %power)
9832       declare x86_fp80  @llvm.powi.f80(x86_fp80  %Val, i32 %power)
9833       declare fp128     @llvm.powi.f128(fp128 %Val, i32 %power)
9834       declare ppc_fp128 @llvm.powi.ppcf128(ppc_fp128  %Val, i32 %power)
9835
9836 Overview:
9837 """""""""
9838
9839 The '``llvm.powi.*``' intrinsics return the first operand raised to the
9840 specified (positive or negative) power. The order of evaluation of
9841 multiplications is not defined. When a vector of floating point type is
9842 used, the second argument remains a scalar integer value.
9843
9844 Arguments:
9845 """"""""""
9846
9847 The second argument is an integer power, and the first is a value to
9848 raise to that power.
9849
9850 Semantics:
9851 """"""""""
9852
9853 This function returns the first value raised to the second power with an
9854 unspecified sequence of rounding operations.
9855
9856 '``llvm.sin.*``' Intrinsic
9857 ^^^^^^^^^^^^^^^^^^^^^^^^^^
9858
9859 Syntax:
9860 """""""
9861
9862 This is an overloaded intrinsic. You can use ``llvm.sin`` on any
9863 floating point or vector of floating point type. Not all targets support
9864 all types however.
9865
9866 ::
9867
9868       declare float     @llvm.sin.f32(float  %Val)
9869       declare double    @llvm.sin.f64(double %Val)
9870       declare x86_fp80  @llvm.sin.f80(x86_fp80  %Val)
9871       declare fp128     @llvm.sin.f128(fp128 %Val)
9872       declare ppc_fp128 @llvm.sin.ppcf128(ppc_fp128  %Val)
9873
9874 Overview:
9875 """""""""
9876
9877 The '``llvm.sin.*``' intrinsics return the sine of the operand.
9878
9879 Arguments:
9880 """"""""""
9881
9882 The argument and return value are floating point numbers of the same
9883 type.
9884
9885 Semantics:
9886 """"""""""
9887
9888 This function returns the sine of the specified operand, returning the
9889 same values as the libm ``sin`` functions would, and handles error
9890 conditions in the same way.
9891
9892 '``llvm.cos.*``' Intrinsic
9893 ^^^^^^^^^^^^^^^^^^^^^^^^^^
9894
9895 Syntax:
9896 """""""
9897
9898 This is an overloaded intrinsic. You can use ``llvm.cos`` on any
9899 floating point or vector of floating point type. Not all targets support
9900 all types however.
9901
9902 ::
9903
9904       declare float     @llvm.cos.f32(float  %Val)
9905       declare double    @llvm.cos.f64(double %Val)
9906       declare x86_fp80  @llvm.cos.f80(x86_fp80  %Val)
9907       declare fp128     @llvm.cos.f128(fp128 %Val)
9908       declare ppc_fp128 @llvm.cos.ppcf128(ppc_fp128  %Val)
9909
9910 Overview:
9911 """""""""
9912
9913 The '``llvm.cos.*``' intrinsics return the cosine of the operand.
9914
9915 Arguments:
9916 """"""""""
9917
9918 The argument and return value are floating point numbers of the same
9919 type.
9920
9921 Semantics:
9922 """"""""""
9923
9924 This function returns the cosine of the specified operand, returning the
9925 same values as the libm ``cos`` functions would, and handles error
9926 conditions in the same way.
9927
9928 '``llvm.pow.*``' Intrinsic
9929 ^^^^^^^^^^^^^^^^^^^^^^^^^^
9930
9931 Syntax:
9932 """""""
9933
9934 This is an overloaded intrinsic. You can use ``llvm.pow`` on any
9935 floating point or vector of floating point type. Not all targets support
9936 all types however.
9937
9938 ::
9939
9940       declare float     @llvm.pow.f32(float  %Val, float %Power)
9941       declare double    @llvm.pow.f64(double %Val, double %Power)
9942       declare x86_fp80  @llvm.pow.f80(x86_fp80  %Val, x86_fp80 %Power)
9943       declare fp128     @llvm.pow.f128(fp128 %Val, fp128 %Power)
9944       declare ppc_fp128 @llvm.pow.ppcf128(ppc_fp128  %Val, ppc_fp128 Power)
9945
9946 Overview:
9947 """""""""
9948
9949 The '``llvm.pow.*``' intrinsics return the first operand raised to the
9950 specified (positive or negative) power.
9951
9952 Arguments:
9953 """"""""""
9954
9955 The second argument is a floating point power, and the first is a value
9956 to raise to that power.
9957
9958 Semantics:
9959 """"""""""
9960
9961 This function returns the first value raised to the second power,
9962 returning the same values as the libm ``pow`` functions would, and
9963 handles error conditions in the same way.
9964
9965 '``llvm.exp.*``' Intrinsic
9966 ^^^^^^^^^^^^^^^^^^^^^^^^^^
9967
9968 Syntax:
9969 """""""
9970
9971 This is an overloaded intrinsic. You can use ``llvm.exp`` on any
9972 floating point or vector of floating point type. Not all targets support
9973 all types however.
9974
9975 ::
9976
9977       declare float     @llvm.exp.f32(float  %Val)
9978       declare double    @llvm.exp.f64(double %Val)
9979       declare x86_fp80  @llvm.exp.f80(x86_fp80  %Val)
9980       declare fp128     @llvm.exp.f128(fp128 %Val)
9981       declare ppc_fp128 @llvm.exp.ppcf128(ppc_fp128  %Val)
9982
9983 Overview:
9984 """""""""
9985
9986 The '``llvm.exp.*``' intrinsics perform the exp function.
9987
9988 Arguments:
9989 """"""""""
9990
9991 The argument and return value are floating point numbers of the same
9992 type.
9993
9994 Semantics:
9995 """"""""""
9996
9997 This function returns the same values as the libm ``exp`` functions
9998 would, and handles error conditions in the same way.
9999
10000 '``llvm.exp2.*``' Intrinsic
10001 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
10002
10003 Syntax:
10004 """""""
10005
10006 This is an overloaded intrinsic. You can use ``llvm.exp2`` on any
10007 floating point or vector of floating point type. Not all targets support
10008 all types however.
10009
10010 ::
10011
10012       declare float     @llvm.exp2.f32(float  %Val)
10013       declare double    @llvm.exp2.f64(double %Val)
10014       declare x86_fp80  @llvm.exp2.f80(x86_fp80  %Val)
10015       declare fp128     @llvm.exp2.f128(fp128 %Val)
10016       declare ppc_fp128 @llvm.exp2.ppcf128(ppc_fp128  %Val)
10017
10018 Overview:
10019 """""""""
10020
10021 The '``llvm.exp2.*``' intrinsics perform the exp2 function.
10022
10023 Arguments:
10024 """"""""""
10025
10026 The argument and return value are floating point numbers of the same
10027 type.
10028
10029 Semantics:
10030 """"""""""
10031
10032 This function returns the same values as the libm ``exp2`` functions
10033 would, and handles error conditions in the same way.
10034
10035 '``llvm.log.*``' Intrinsic
10036 ^^^^^^^^^^^^^^^^^^^^^^^^^^
10037
10038 Syntax:
10039 """""""
10040
10041 This is an overloaded intrinsic. You can use ``llvm.log`` on any
10042 floating point or vector of floating point type. Not all targets support
10043 all types however.
10044
10045 ::
10046
10047       declare float     @llvm.log.f32(float  %Val)
10048       declare double    @llvm.log.f64(double %Val)
10049       declare x86_fp80  @llvm.log.f80(x86_fp80  %Val)
10050       declare fp128     @llvm.log.f128(fp128 %Val)
10051       declare ppc_fp128 @llvm.log.ppcf128(ppc_fp128  %Val)
10052
10053 Overview:
10054 """""""""
10055
10056 The '``llvm.log.*``' intrinsics perform the log function.
10057
10058 Arguments:
10059 """"""""""
10060
10061 The argument and return value are floating point numbers of the same
10062 type.
10063
10064 Semantics:
10065 """"""""""
10066
10067 This function returns the same values as the libm ``log`` functions
10068 would, and handles error conditions in the same way.
10069
10070 '``llvm.log10.*``' Intrinsic
10071 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10072
10073 Syntax:
10074 """""""
10075
10076 This is an overloaded intrinsic. You can use ``llvm.log10`` on any
10077 floating point or vector of floating point type. Not all targets support
10078 all types however.
10079
10080 ::
10081
10082       declare float     @llvm.log10.f32(float  %Val)
10083       declare double    @llvm.log10.f64(double %Val)
10084       declare x86_fp80  @llvm.log10.f80(x86_fp80  %Val)
10085       declare fp128     @llvm.log10.f128(fp128 %Val)
10086       declare ppc_fp128 @llvm.log10.ppcf128(ppc_fp128  %Val)
10087
10088 Overview:
10089 """""""""
10090
10091 The '``llvm.log10.*``' intrinsics perform the log10 function.
10092
10093 Arguments:
10094 """"""""""
10095
10096 The argument and return value are floating point numbers of the same
10097 type.
10098
10099 Semantics:
10100 """"""""""
10101
10102 This function returns the same values as the libm ``log10`` functions
10103 would, and handles error conditions in the same way.
10104
10105 '``llvm.log2.*``' Intrinsic
10106 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
10107
10108 Syntax:
10109 """""""
10110
10111 This is an overloaded intrinsic. You can use ``llvm.log2`` on any
10112 floating point or vector of floating point type. Not all targets support
10113 all types however.
10114
10115 ::
10116
10117       declare float     @llvm.log2.f32(float  %Val)
10118       declare double    @llvm.log2.f64(double %Val)
10119       declare x86_fp80  @llvm.log2.f80(x86_fp80  %Val)
10120       declare fp128     @llvm.log2.f128(fp128 %Val)
10121       declare ppc_fp128 @llvm.log2.ppcf128(ppc_fp128  %Val)
10122
10123 Overview:
10124 """""""""
10125
10126 The '``llvm.log2.*``' intrinsics perform the log2 function.
10127
10128 Arguments:
10129 """"""""""
10130
10131 The argument and return value are floating point numbers of the same
10132 type.
10133
10134 Semantics:
10135 """"""""""
10136
10137 This function returns the same values as the libm ``log2`` functions
10138 would, and handles error conditions in the same way.
10139
10140 '``llvm.fma.*``' Intrinsic
10141 ^^^^^^^^^^^^^^^^^^^^^^^^^^
10142
10143 Syntax:
10144 """""""
10145
10146 This is an overloaded intrinsic. You can use ``llvm.fma`` on any
10147 floating point or vector of floating point type. Not all targets support
10148 all types however.
10149
10150 ::
10151
10152       declare float     @llvm.fma.f32(float  %a, float  %b, float  %c)
10153       declare double    @llvm.fma.f64(double %a, double %b, double %c)
10154       declare x86_fp80  @llvm.fma.f80(x86_fp80 %a, x86_fp80 %b, x86_fp80 %c)
10155       declare fp128     @llvm.fma.f128(fp128 %a, fp128 %b, fp128 %c)
10156       declare ppc_fp128 @llvm.fma.ppcf128(ppc_fp128 %a, ppc_fp128 %b, ppc_fp128 %c)
10157
10158 Overview:
10159 """""""""
10160
10161 The '``llvm.fma.*``' intrinsics perform the fused multiply-add
10162 operation.
10163
10164 Arguments:
10165 """"""""""
10166
10167 The argument and return value are floating point numbers of the same
10168 type.
10169
10170 Semantics:
10171 """"""""""
10172
10173 This function returns the same values as the libm ``fma`` functions
10174 would, and does not set errno.
10175
10176 '``llvm.fabs.*``' Intrinsic
10177 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
10178
10179 Syntax:
10180 """""""
10181
10182 This is an overloaded intrinsic. You can use ``llvm.fabs`` on any
10183 floating point or vector of floating point type. Not all targets support
10184 all types however.
10185
10186 ::
10187
10188       declare float     @llvm.fabs.f32(float  %Val)
10189       declare double    @llvm.fabs.f64(double %Val)
10190       declare x86_fp80  @llvm.fabs.f80(x86_fp80 %Val)
10191       declare fp128     @llvm.fabs.f128(fp128 %Val)
10192       declare ppc_fp128 @llvm.fabs.ppcf128(ppc_fp128 %Val)
10193
10194 Overview:
10195 """""""""
10196
10197 The '``llvm.fabs.*``' intrinsics return the absolute value of the
10198 operand.
10199
10200 Arguments:
10201 """"""""""
10202
10203 The argument and return value are floating point numbers of the same
10204 type.
10205
10206 Semantics:
10207 """"""""""
10208
10209 This function returns the same values as the libm ``fabs`` functions
10210 would, and handles error conditions in the same way.
10211
10212 '``llvm.minnum.*``' Intrinsic
10213 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10214
10215 Syntax:
10216 """""""
10217
10218 This is an overloaded intrinsic. You can use ``llvm.minnum`` on any
10219 floating point or vector of floating point type. Not all targets support
10220 all types however.
10221
10222 ::
10223
10224       declare float     @llvm.minnum.f32(float %Val0, float %Val1)
10225       declare double    @llvm.minnum.f64(double %Val0, double %Val1)
10226       declare x86_fp80  @llvm.minnum.f80(x86_fp80 %Val0, x86_fp80 %Val1)
10227       declare fp128     @llvm.minnum.f128(fp128 %Val0, fp128 %Val1)
10228       declare ppc_fp128 @llvm.minnum.ppcf128(ppc_fp128 %Val0, ppc_fp128 %Val1)
10229
10230 Overview:
10231 """""""""
10232
10233 The '``llvm.minnum.*``' intrinsics return the minimum of the two
10234 arguments.
10235
10236
10237 Arguments:
10238 """"""""""
10239
10240 The arguments and return value are floating point numbers of the same
10241 type.
10242
10243 Semantics:
10244 """"""""""
10245
10246 Follows the IEEE-754 semantics for minNum, which also match for libm's
10247 fmin.
10248
10249 If either operand is a NaN, returns the other non-NaN operand. Returns
10250 NaN only if both operands are NaN. If the operands compare equal,
10251 returns a value that compares equal to both operands. This means that
10252 fmin(+/-0.0, +/-0.0) could return either -0.0 or 0.0.
10253
10254 '``llvm.maxnum.*``' Intrinsic
10255 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10256
10257 Syntax:
10258 """""""
10259
10260 This is an overloaded intrinsic. You can use ``llvm.maxnum`` on any
10261 floating point or vector of floating point type. Not all targets support
10262 all types however.
10263
10264 ::
10265
10266       declare float     @llvm.maxnum.f32(float  %Val0, float  %Val1l)
10267       declare double    @llvm.maxnum.f64(double %Val0, double %Val1)
10268       declare x86_fp80  @llvm.maxnum.f80(x86_fp80  %Val0, x86_fp80  %Val1)
10269       declare fp128     @llvm.maxnum.f128(fp128 %Val0, fp128 %Val1)
10270       declare ppc_fp128 @llvm.maxnum.ppcf128(ppc_fp128  %Val0, ppc_fp128  %Val1)
10271
10272 Overview:
10273 """""""""
10274
10275 The '``llvm.maxnum.*``' intrinsics return the maximum of the two
10276 arguments.
10277
10278
10279 Arguments:
10280 """"""""""
10281
10282 The arguments and return value are floating point numbers of the same
10283 type.
10284
10285 Semantics:
10286 """"""""""
10287 Follows the IEEE-754 semantics for maxNum, which also match for libm's
10288 fmax.
10289
10290 If either operand is a NaN, returns the other non-NaN operand. Returns
10291 NaN only if both operands are NaN. If the operands compare equal,
10292 returns a value that compares equal to both operands. This means that
10293 fmax(+/-0.0, +/-0.0) could return either -0.0 or 0.0.
10294
10295 '``llvm.copysign.*``' Intrinsic
10296 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10297
10298 Syntax:
10299 """""""
10300
10301 This is an overloaded intrinsic. You can use ``llvm.copysign`` on any
10302 floating point or vector of floating point type. Not all targets support
10303 all types however.
10304
10305 ::
10306
10307       declare float     @llvm.copysign.f32(float  %Mag, float  %Sgn)
10308       declare double    @llvm.copysign.f64(double %Mag, double %Sgn)
10309       declare x86_fp80  @llvm.copysign.f80(x86_fp80  %Mag, x86_fp80  %Sgn)
10310       declare fp128     @llvm.copysign.f128(fp128 %Mag, fp128 %Sgn)
10311       declare ppc_fp128 @llvm.copysign.ppcf128(ppc_fp128  %Mag, ppc_fp128  %Sgn)
10312
10313 Overview:
10314 """""""""
10315
10316 The '``llvm.copysign.*``' intrinsics return a value with the magnitude of the
10317 first operand and the sign of the second operand.
10318
10319 Arguments:
10320 """"""""""
10321
10322 The arguments and return value are floating point numbers of the same
10323 type.
10324
10325 Semantics:
10326 """"""""""
10327
10328 This function returns the same values as the libm ``copysign``
10329 functions would, and handles error conditions in the same way.
10330
10331 '``llvm.floor.*``' Intrinsic
10332 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10333
10334 Syntax:
10335 """""""
10336
10337 This is an overloaded intrinsic. You can use ``llvm.floor`` on any
10338 floating point or vector of floating point type. Not all targets support
10339 all types however.
10340
10341 ::
10342
10343       declare float     @llvm.floor.f32(float  %Val)
10344       declare double    @llvm.floor.f64(double %Val)
10345       declare x86_fp80  @llvm.floor.f80(x86_fp80  %Val)
10346       declare fp128     @llvm.floor.f128(fp128 %Val)
10347       declare ppc_fp128 @llvm.floor.ppcf128(ppc_fp128  %Val)
10348
10349 Overview:
10350 """""""""
10351
10352 The '``llvm.floor.*``' intrinsics return the floor of the operand.
10353
10354 Arguments:
10355 """"""""""
10356
10357 The argument and return value are floating point numbers of the same
10358 type.
10359
10360 Semantics:
10361 """"""""""
10362
10363 This function returns the same values as the libm ``floor`` functions
10364 would, and handles error conditions in the same way.
10365
10366 '``llvm.ceil.*``' Intrinsic
10367 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
10368
10369 Syntax:
10370 """""""
10371
10372 This is an overloaded intrinsic. You can use ``llvm.ceil`` on any
10373 floating point or vector of floating point type. Not all targets support
10374 all types however.
10375
10376 ::
10377
10378       declare float     @llvm.ceil.f32(float  %Val)
10379       declare double    @llvm.ceil.f64(double %Val)
10380       declare x86_fp80  @llvm.ceil.f80(x86_fp80  %Val)
10381       declare fp128     @llvm.ceil.f128(fp128 %Val)
10382       declare ppc_fp128 @llvm.ceil.ppcf128(ppc_fp128  %Val)
10383
10384 Overview:
10385 """""""""
10386
10387 The '``llvm.ceil.*``' intrinsics return the ceiling of the operand.
10388
10389 Arguments:
10390 """"""""""
10391
10392 The argument and return value are floating point numbers of the same
10393 type.
10394
10395 Semantics:
10396 """"""""""
10397
10398 This function returns the same values as the libm ``ceil`` functions
10399 would, and handles error conditions in the same way.
10400
10401 '``llvm.trunc.*``' Intrinsic
10402 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10403
10404 Syntax:
10405 """""""
10406
10407 This is an overloaded intrinsic. You can use ``llvm.trunc`` on any
10408 floating point or vector of floating point type. Not all targets support
10409 all types however.
10410
10411 ::
10412
10413       declare float     @llvm.trunc.f32(float  %Val)
10414       declare double    @llvm.trunc.f64(double %Val)
10415       declare x86_fp80  @llvm.trunc.f80(x86_fp80  %Val)
10416       declare fp128     @llvm.trunc.f128(fp128 %Val)
10417       declare ppc_fp128 @llvm.trunc.ppcf128(ppc_fp128  %Val)
10418
10419 Overview:
10420 """""""""
10421
10422 The '``llvm.trunc.*``' intrinsics returns the operand rounded to the
10423 nearest integer not larger in magnitude than the operand.
10424
10425 Arguments:
10426 """"""""""
10427
10428 The argument and return value are floating point numbers of the same
10429 type.
10430
10431 Semantics:
10432 """"""""""
10433
10434 This function returns the same values as the libm ``trunc`` functions
10435 would, and handles error conditions in the same way.
10436
10437 '``llvm.rint.*``' Intrinsic
10438 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
10439
10440 Syntax:
10441 """""""
10442
10443 This is an overloaded intrinsic. You can use ``llvm.rint`` on any
10444 floating point or vector of floating point type. Not all targets support
10445 all types however.
10446
10447 ::
10448
10449       declare float     @llvm.rint.f32(float  %Val)
10450       declare double    @llvm.rint.f64(double %Val)
10451       declare x86_fp80  @llvm.rint.f80(x86_fp80  %Val)
10452       declare fp128     @llvm.rint.f128(fp128 %Val)
10453       declare ppc_fp128 @llvm.rint.ppcf128(ppc_fp128  %Val)
10454
10455 Overview:
10456 """""""""
10457
10458 The '``llvm.rint.*``' intrinsics returns the operand rounded to the
10459 nearest integer. It may raise an inexact floating-point exception if the
10460 operand isn't an integer.
10461
10462 Arguments:
10463 """"""""""
10464
10465 The argument and return value are floating point numbers of the same
10466 type.
10467
10468 Semantics:
10469 """"""""""
10470
10471 This function returns the same values as the libm ``rint`` functions
10472 would, and handles error conditions in the same way.
10473
10474 '``llvm.nearbyint.*``' Intrinsic
10475 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10476
10477 Syntax:
10478 """""""
10479
10480 This is an overloaded intrinsic. You can use ``llvm.nearbyint`` on any
10481 floating point or vector of floating point type. Not all targets support
10482 all types however.
10483
10484 ::
10485
10486       declare float     @llvm.nearbyint.f32(float  %Val)
10487       declare double    @llvm.nearbyint.f64(double %Val)
10488       declare x86_fp80  @llvm.nearbyint.f80(x86_fp80  %Val)
10489       declare fp128     @llvm.nearbyint.f128(fp128 %Val)
10490       declare ppc_fp128 @llvm.nearbyint.ppcf128(ppc_fp128  %Val)
10491
10492 Overview:
10493 """""""""
10494
10495 The '``llvm.nearbyint.*``' intrinsics returns the operand rounded to the
10496 nearest integer.
10497
10498 Arguments:
10499 """"""""""
10500
10501 The argument and return value are floating point numbers of the same
10502 type.
10503
10504 Semantics:
10505 """"""""""
10506
10507 This function returns the same values as the libm ``nearbyint``
10508 functions would, and handles error conditions in the same way.
10509
10510 '``llvm.round.*``' Intrinsic
10511 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10512
10513 Syntax:
10514 """""""
10515
10516 This is an overloaded intrinsic. You can use ``llvm.round`` on any
10517 floating point or vector of floating point type. Not all targets support
10518 all types however.
10519
10520 ::
10521
10522       declare float     @llvm.round.f32(float  %Val)
10523       declare double    @llvm.round.f64(double %Val)
10524       declare x86_fp80  @llvm.round.f80(x86_fp80  %Val)
10525       declare fp128     @llvm.round.f128(fp128 %Val)
10526       declare ppc_fp128 @llvm.round.ppcf128(ppc_fp128  %Val)
10527
10528 Overview:
10529 """""""""
10530
10531 The '``llvm.round.*``' intrinsics returns the operand rounded to the
10532 nearest integer.
10533
10534 Arguments:
10535 """"""""""
10536
10537 The argument and return value are floating point numbers of the same
10538 type.
10539
10540 Semantics:
10541 """"""""""
10542
10543 This function returns the same values as the libm ``round``
10544 functions would, and handles error conditions in the same way.
10545
10546 Bit Manipulation Intrinsics
10547 ---------------------------
10548
10549 LLVM provides intrinsics for a few important bit manipulation
10550 operations. These allow efficient code generation for some algorithms.
10551
10552 '``llvm.bitreverse.*``' Intrinsics
10553 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10554
10555 Syntax:
10556 """""""
10557
10558 This is an overloaded intrinsic function. You can use bitreverse on any
10559 integer type.
10560
10561 ::
10562
10563       declare i16 @llvm.bitreverse.i16(i16 <id>)
10564       declare i32 @llvm.bitreverse.i32(i32 <id>)
10565       declare i64 @llvm.bitreverse.i64(i64 <id>)
10566
10567 Overview:
10568 """""""""
10569
10570 The '``llvm.bitreverse``' family of intrinsics is used to reverse the
10571 bitpattern of an integer value; for example ``0b1234567`` becomes
10572 ``0b7654321``.
10573
10574 Semantics:
10575 """"""""""
10576
10577 The ``llvm.bitreverse.iN`` intrinsic returns an i16 value that has bit
10578 ``M`` in the input moved to bit ``N-M`` in the output.
10579
10580 '``llvm.bswap.*``' Intrinsics
10581 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10582
10583 Syntax:
10584 """""""
10585
10586 This is an overloaded intrinsic function. You can use bswap on any
10587 integer type that is an even number of bytes (i.e. BitWidth % 16 == 0).
10588
10589 ::
10590
10591       declare i16 @llvm.bswap.i16(i16 <id>)
10592       declare i32 @llvm.bswap.i32(i32 <id>)
10593       declare i64 @llvm.bswap.i64(i64 <id>)
10594
10595 Overview:
10596 """""""""
10597
10598 The '``llvm.bswap``' family of intrinsics is used to byte swap integer
10599 values with an even number of bytes (positive multiple of 16 bits).
10600 These are useful for performing operations on data that is not in the
10601 target's native byte order.
10602
10603 Semantics:
10604 """"""""""
10605
10606 The ``llvm.bswap.i16`` intrinsic returns an i16 value that has the high
10607 and low byte of the input i16 swapped. Similarly, the ``llvm.bswap.i32``
10608 intrinsic returns an i32 value that has the four bytes of the input i32
10609 swapped, so that if the input bytes are numbered 0, 1, 2, 3 then the
10610 returned i32 will have its bytes in 3, 2, 1, 0 order. The
10611 ``llvm.bswap.i48``, ``llvm.bswap.i64`` and other intrinsics extend this
10612 concept to additional even-byte lengths (6 bytes, 8 bytes and more,
10613 respectively).
10614
10615 '``llvm.ctpop.*``' Intrinsic
10616 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10617
10618 Syntax:
10619 """""""
10620
10621 This is an overloaded intrinsic. You can use llvm.ctpop on any integer
10622 bit width, or on any vector with integer elements. Not all targets
10623 support all bit widths or vector types, however.
10624
10625 ::
10626
10627       declare i8 @llvm.ctpop.i8(i8  <src>)
10628       declare i16 @llvm.ctpop.i16(i16 <src>)
10629       declare i32 @llvm.ctpop.i32(i32 <src>)
10630       declare i64 @llvm.ctpop.i64(i64 <src>)
10631       declare i256 @llvm.ctpop.i256(i256 <src>)
10632       declare <2 x i32> @llvm.ctpop.v2i32(<2 x i32> <src>)
10633
10634 Overview:
10635 """""""""
10636
10637 The '``llvm.ctpop``' family of intrinsics counts the number of bits set
10638 in a value.
10639
10640 Arguments:
10641 """"""""""
10642
10643 The only argument is the value to be counted. The argument may be of any
10644 integer type, or a vector with integer elements. The return type must
10645 match the argument type.
10646
10647 Semantics:
10648 """"""""""
10649
10650 The '``llvm.ctpop``' intrinsic counts the 1's in a variable, or within
10651 each element of a vector.
10652
10653 '``llvm.ctlz.*``' Intrinsic
10654 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
10655
10656 Syntax:
10657 """""""
10658
10659 This is an overloaded intrinsic. You can use ``llvm.ctlz`` on any
10660 integer bit width, or any vector whose elements are integers. Not all
10661 targets support all bit widths or vector types, however.
10662
10663 ::
10664
10665       declare i8   @llvm.ctlz.i8  (i8   <src>, i1 <is_zero_undef>)
10666       declare i16  @llvm.ctlz.i16 (i16  <src>, i1 <is_zero_undef>)
10667       declare i32  @llvm.ctlz.i32 (i32  <src>, i1 <is_zero_undef>)
10668       declare i64  @llvm.ctlz.i64 (i64  <src>, i1 <is_zero_undef>)
10669       declare i256 @llvm.ctlz.i256(i256 <src>, i1 <is_zero_undef>)
10670       declase <2 x i32> @llvm.ctlz.v2i32(<2 x i32> <src>, i1 <is_zero_undef>)
10671
10672 Overview:
10673 """""""""
10674
10675 The '``llvm.ctlz``' family of intrinsic functions counts the number of
10676 leading zeros in a variable.
10677
10678 Arguments:
10679 """"""""""
10680
10681 The first argument is the value to be counted. This argument may be of
10682 any integer type, or a vector with integer element type. The return
10683 type must match the first argument type.
10684
10685 The second argument must be a constant and is a flag to indicate whether
10686 the intrinsic should ensure that a zero as the first argument produces a
10687 defined result. Historically some architectures did not provide a
10688 defined result for zero values as efficiently, and many algorithms are
10689 now predicated on avoiding zero-value inputs.
10690
10691 Semantics:
10692 """"""""""
10693
10694 The '``llvm.ctlz``' intrinsic counts the leading (most significant)
10695 zeros in a variable, or within each element of the vector. If
10696 ``src == 0`` then the result is the size in bits of the type of ``src``
10697 if ``is_zero_undef == 0`` and ``undef`` otherwise. For example,
10698 ``llvm.ctlz(i32 2) = 30``.
10699
10700 '``llvm.cttz.*``' Intrinsic
10701 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
10702
10703 Syntax:
10704 """""""
10705
10706 This is an overloaded intrinsic. You can use ``llvm.cttz`` on any
10707 integer bit width, or any vector of integer elements. Not all targets
10708 support all bit widths or vector types, however.
10709
10710 ::
10711
10712       declare i8   @llvm.cttz.i8  (i8   <src>, i1 <is_zero_undef>)
10713       declare i16  @llvm.cttz.i16 (i16  <src>, i1 <is_zero_undef>)
10714       declare i32  @llvm.cttz.i32 (i32  <src>, i1 <is_zero_undef>)
10715       declare i64  @llvm.cttz.i64 (i64  <src>, i1 <is_zero_undef>)
10716       declare i256 @llvm.cttz.i256(i256 <src>, i1 <is_zero_undef>)
10717       declase <2 x i32> @llvm.cttz.v2i32(<2 x i32> <src>, i1 <is_zero_undef>)
10718
10719 Overview:
10720 """""""""
10721
10722 The '``llvm.cttz``' family of intrinsic functions counts the number of
10723 trailing zeros.
10724
10725 Arguments:
10726 """"""""""
10727
10728 The first argument is the value to be counted. This argument may be of
10729 any integer type, or a vector with integer element type. The return
10730 type must match the first argument type.
10731
10732 The second argument must be a constant and is a flag to indicate whether
10733 the intrinsic should ensure that a zero as the first argument produces a
10734 defined result. Historically some architectures did not provide a
10735 defined result for zero values as efficiently, and many algorithms are
10736 now predicated on avoiding zero-value inputs.
10737
10738 Semantics:
10739 """"""""""
10740
10741 The '``llvm.cttz``' intrinsic counts the trailing (least significant)
10742 zeros in a variable, or within each element of a vector. If ``src == 0``
10743 then the result is the size in bits of the type of ``src`` if
10744 ``is_zero_undef == 0`` and ``undef`` otherwise. For example,
10745 ``llvm.cttz(2) = 1``.
10746
10747 .. _int_overflow:
10748
10749 Arithmetic with Overflow Intrinsics
10750 -----------------------------------
10751
10752 LLVM provides intrinsics for some arithmetic with overflow operations.
10753
10754 '``llvm.sadd.with.overflow.*``' Intrinsics
10755 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10756
10757 Syntax:
10758 """""""
10759
10760 This is an overloaded intrinsic. You can use ``llvm.sadd.with.overflow``
10761 on any integer bit width.
10762
10763 ::
10764
10765       declare {i16, i1} @llvm.sadd.with.overflow.i16(i16 %a, i16 %b)
10766       declare {i32, i1} @llvm.sadd.with.overflow.i32(i32 %a, i32 %b)
10767       declare {i64, i1} @llvm.sadd.with.overflow.i64(i64 %a, i64 %b)
10768
10769 Overview:
10770 """""""""
10771
10772 The '``llvm.sadd.with.overflow``' family of intrinsic functions perform
10773 a signed addition of the two arguments, and indicate whether an overflow
10774 occurred during the signed summation.
10775
10776 Arguments:
10777 """"""""""
10778
10779 The arguments (%a and %b) and the first element of the result structure
10780 may be of integer types of any bit width, but they must have the same
10781 bit width. The second element of the result structure must be of type
10782 ``i1``. ``%a`` and ``%b`` are the two values that will undergo signed
10783 addition.
10784
10785 Semantics:
10786 """"""""""
10787
10788 The '``llvm.sadd.with.overflow``' family of intrinsic functions perform
10789 a signed addition of the two variables. They return a structure --- the
10790 first element of which is the signed summation, and the second element
10791 of which is a bit specifying if the signed summation resulted in an
10792 overflow.
10793
10794 Examples:
10795 """""""""
10796
10797 .. code-block:: llvm
10798
10799       %res = call {i32, i1} @llvm.sadd.with.overflow.i32(i32 %a, i32 %b)
10800       %sum = extractvalue {i32, i1} %res, 0
10801       %obit = extractvalue {i32, i1} %res, 1
10802       br i1 %obit, label %overflow, label %normal
10803
10804 '``llvm.uadd.with.overflow.*``' Intrinsics
10805 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10806
10807 Syntax:
10808 """""""
10809
10810 This is an overloaded intrinsic. You can use ``llvm.uadd.with.overflow``
10811 on any integer bit width.
10812
10813 ::
10814
10815       declare {i16, i1} @llvm.uadd.with.overflow.i16(i16 %a, i16 %b)
10816       declare {i32, i1} @llvm.uadd.with.overflow.i32(i32 %a, i32 %b)
10817       declare {i64, i1} @llvm.uadd.with.overflow.i64(i64 %a, i64 %b)
10818
10819 Overview:
10820 """""""""
10821
10822 The '``llvm.uadd.with.overflow``' family of intrinsic functions perform
10823 an unsigned addition of the two arguments, and indicate whether a carry
10824 occurred during the unsigned summation.
10825
10826 Arguments:
10827 """"""""""
10828
10829 The arguments (%a and %b) and the first element of the result structure
10830 may be of integer types of any bit width, but they must have the same
10831 bit width. The second element of the result structure must be of type
10832 ``i1``. ``%a`` and ``%b`` are the two values that will undergo unsigned
10833 addition.
10834
10835 Semantics:
10836 """"""""""
10837
10838 The '``llvm.uadd.with.overflow``' family of intrinsic functions perform
10839 an unsigned addition of the two arguments. They return a structure --- the
10840 first element of which is the sum, and the second element of which is a
10841 bit specifying if the unsigned summation resulted in a carry.
10842
10843 Examples:
10844 """""""""
10845
10846 .. code-block:: llvm
10847
10848       %res = call {i32, i1} @llvm.uadd.with.overflow.i32(i32 %a, i32 %b)
10849       %sum = extractvalue {i32, i1} %res, 0
10850       %obit = extractvalue {i32, i1} %res, 1
10851       br i1 %obit, label %carry, label %normal
10852
10853 '``llvm.ssub.with.overflow.*``' Intrinsics
10854 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10855
10856 Syntax:
10857 """""""
10858
10859 This is an overloaded intrinsic. You can use ``llvm.ssub.with.overflow``
10860 on any integer bit width.
10861
10862 ::
10863
10864       declare {i16, i1} @llvm.ssub.with.overflow.i16(i16 %a, i16 %b)
10865       declare {i32, i1} @llvm.ssub.with.overflow.i32(i32 %a, i32 %b)
10866       declare {i64, i1} @llvm.ssub.with.overflow.i64(i64 %a, i64 %b)
10867
10868 Overview:
10869 """""""""
10870
10871 The '``llvm.ssub.with.overflow``' family of intrinsic functions perform
10872 a signed subtraction of the two arguments, and indicate whether an
10873 overflow occurred during the signed subtraction.
10874
10875 Arguments:
10876 """"""""""
10877
10878 The arguments (%a and %b) and the first element of the result structure
10879 may be of integer types of any bit width, but they must have the same
10880 bit width. The second element of the result structure must be of type
10881 ``i1``. ``%a`` and ``%b`` are the two values that will undergo signed
10882 subtraction.
10883
10884 Semantics:
10885 """"""""""
10886
10887 The '``llvm.ssub.with.overflow``' family of intrinsic functions perform
10888 a signed subtraction of the two arguments. They return a structure --- the
10889 first element of which is the subtraction, and the second element of
10890 which is a bit specifying if the signed subtraction resulted in an
10891 overflow.
10892
10893 Examples:
10894 """""""""
10895
10896 .. code-block:: llvm
10897
10898       %res = call {i32, i1} @llvm.ssub.with.overflow.i32(i32 %a, i32 %b)
10899       %sum = extractvalue {i32, i1} %res, 0
10900       %obit = extractvalue {i32, i1} %res, 1
10901       br i1 %obit, label %overflow, label %normal
10902
10903 '``llvm.usub.with.overflow.*``' Intrinsics
10904 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10905
10906 Syntax:
10907 """""""
10908
10909 This is an overloaded intrinsic. You can use ``llvm.usub.with.overflow``
10910 on any integer bit width.
10911
10912 ::
10913
10914       declare {i16, i1} @llvm.usub.with.overflow.i16(i16 %a, i16 %b)
10915       declare {i32, i1} @llvm.usub.with.overflow.i32(i32 %a, i32 %b)
10916       declare {i64, i1} @llvm.usub.with.overflow.i64(i64 %a, i64 %b)
10917
10918 Overview:
10919 """""""""
10920
10921 The '``llvm.usub.with.overflow``' family of intrinsic functions perform
10922 an unsigned subtraction of the two arguments, and indicate whether an
10923 overflow occurred during the unsigned subtraction.
10924
10925 Arguments:
10926 """"""""""
10927
10928 The arguments (%a and %b) and the first element of the result structure
10929 may be of integer types of any bit width, but they must have the same
10930 bit width. The second element of the result structure must be of type
10931 ``i1``. ``%a`` and ``%b`` are the two values that will undergo unsigned
10932 subtraction.
10933
10934 Semantics:
10935 """"""""""
10936
10937 The '``llvm.usub.with.overflow``' family of intrinsic functions perform
10938 an unsigned subtraction of the two arguments. They return a structure ---
10939 the first element of which is the subtraction, and the second element of
10940 which is a bit specifying if the unsigned subtraction resulted in an
10941 overflow.
10942
10943 Examples:
10944 """""""""
10945
10946 .. code-block:: llvm
10947
10948       %res = call {i32, i1} @llvm.usub.with.overflow.i32(i32 %a, i32 %b)
10949       %sum = extractvalue {i32, i1} %res, 0
10950       %obit = extractvalue {i32, i1} %res, 1
10951       br i1 %obit, label %overflow, label %normal
10952
10953 '``llvm.smul.with.overflow.*``' Intrinsics
10954 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
10955
10956 Syntax:
10957 """""""
10958
10959 This is an overloaded intrinsic. You can use ``llvm.smul.with.overflow``
10960 on any integer bit width.
10961
10962 ::
10963
10964       declare {i16, i1} @llvm.smul.with.overflow.i16(i16 %a, i16 %b)
10965       declare {i32, i1} @llvm.smul.with.overflow.i32(i32 %a, i32 %b)
10966       declare {i64, i1} @llvm.smul.with.overflow.i64(i64 %a, i64 %b)
10967
10968 Overview:
10969 """""""""
10970
10971 The '``llvm.smul.with.overflow``' family of intrinsic functions perform
10972 a signed multiplication of the two arguments, and indicate whether an
10973 overflow occurred during the signed multiplication.
10974
10975 Arguments:
10976 """"""""""
10977
10978 The arguments (%a and %b) and the first element of the result structure
10979 may be of integer types of any bit width, but they must have the same
10980 bit width. The second element of the result structure must be of type
10981 ``i1``. ``%a`` and ``%b`` are the two values that will undergo signed
10982 multiplication.
10983
10984 Semantics:
10985 """"""""""
10986
10987 The '``llvm.smul.with.overflow``' family of intrinsic functions perform
10988 a signed multiplication of the two arguments. They return a structure ---
10989 the first element of which is the multiplication, and the second element
10990 of which is a bit specifying if the signed multiplication resulted in an
10991 overflow.
10992
10993 Examples:
10994 """""""""
10995
10996 .. code-block:: llvm
10997
10998       %res = call {i32, i1} @llvm.smul.with.overflow.i32(i32 %a, i32 %b)
10999       %sum = extractvalue {i32, i1} %res, 0
11000       %obit = extractvalue {i32, i1} %res, 1
11001       br i1 %obit, label %overflow, label %normal
11002
11003 '``llvm.umul.with.overflow.*``' Intrinsics
11004 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11005
11006 Syntax:
11007 """""""
11008
11009 This is an overloaded intrinsic. You can use ``llvm.umul.with.overflow``
11010 on any integer bit width.
11011
11012 ::
11013
11014       declare {i16, i1} @llvm.umul.with.overflow.i16(i16 %a, i16 %b)
11015       declare {i32, i1} @llvm.umul.with.overflow.i32(i32 %a, i32 %b)
11016       declare {i64, i1} @llvm.umul.with.overflow.i64(i64 %a, i64 %b)
11017
11018 Overview:
11019 """""""""
11020
11021 The '``llvm.umul.with.overflow``' family of intrinsic functions perform
11022 a unsigned multiplication of the two arguments, and indicate whether an
11023 overflow occurred during the unsigned multiplication.
11024
11025 Arguments:
11026 """"""""""
11027
11028 The arguments (%a and %b) and the first element of the result structure
11029 may be of integer types of any bit width, but they must have the same
11030 bit width. The second element of the result structure must be of type
11031 ``i1``. ``%a`` and ``%b`` are the two values that will undergo unsigned
11032 multiplication.
11033
11034 Semantics:
11035 """"""""""
11036
11037 The '``llvm.umul.with.overflow``' family of intrinsic functions perform
11038 an unsigned multiplication of the two arguments. They return a structure ---
11039 the first element of which is the multiplication, and the second
11040 element of which is a bit specifying if the unsigned multiplication
11041 resulted in an overflow.
11042
11043 Examples:
11044 """""""""
11045
11046 .. code-block:: llvm
11047
11048       %res = call {i32, i1} @llvm.umul.with.overflow.i32(i32 %a, i32 %b)
11049       %sum = extractvalue {i32, i1} %res, 0
11050       %obit = extractvalue {i32, i1} %res, 1
11051       br i1 %obit, label %overflow, label %normal
11052
11053 Specialised Arithmetic Intrinsics
11054 ---------------------------------
11055
11056 '``llvm.canonicalize.*``' Intrinsic
11057 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11058
11059 Syntax:
11060 """""""
11061
11062 ::
11063
11064       declare float @llvm.canonicalize.f32(float %a)
11065       declare double @llvm.canonicalize.f64(double %b)
11066
11067 Overview:
11068 """""""""
11069
11070 The '``llvm.canonicalize.*``' intrinsic returns the platform specific canonical
11071 encoding of a floating point number. This canonicalization is useful for
11072 implementing certain numeric primitives such as frexp. The canonical encoding is
11073 defined by IEEE-754-2008 to be:
11074
11075 ::
11076
11077       2.1.8 canonical encoding: The preferred encoding of a floating-point
11078       representation in a format. Applied to declets, significands of finite
11079       numbers, infinities, and NaNs, especially in decimal formats.
11080
11081 This operation can also be considered equivalent to the IEEE-754-2008
11082 conversion of a floating-point value to the same format. NaNs are handled
11083 according to section 6.2.
11084
11085 Examples of non-canonical encodings:
11086
11087 - x87 pseudo denormals, pseudo NaNs, pseudo Infinity, Unnormals. These are
11088   converted to a canonical representation per hardware-specific protocol.
11089 - Many normal decimal floating point numbers have non-canonical alternative
11090   encodings.
11091 - Some machines, like GPUs or ARMv7 NEON, do not support subnormal values.
11092   These are treated as non-canonical encodings of zero and with be flushed to
11093   a zero of the same sign by this operation.
11094
11095 Note that per IEEE-754-2008 6.2, systems that support signaling NaNs with
11096 default exception handling must signal an invalid exception, and produce a
11097 quiet NaN result.
11098
11099 This function should always be implementable as multiplication by 1.0, provided
11100 that the compiler does not constant fold the operation. Likewise, division by
11101 1.0 and ``llvm.minnum(x, x)`` are possible implementations. Addition with
11102 -0.0 is also sufficient provided that the rounding mode is not -Infinity.
11103
11104 ``@llvm.canonicalize`` must preserve the equality relation. That is:
11105
11106 - ``(@llvm.canonicalize(x) == x)`` is equivalent to ``(x == x)``
11107 - ``(@llvm.canonicalize(x) == @llvm.canonicalize(y))`` is equivalent to
11108   to ``(x == y)``
11109
11110 Additionally, the sign of zero must be conserved:
11111 ``@llvm.canonicalize(-0.0) = -0.0`` and ``@llvm.canonicalize(+0.0) = +0.0``
11112
11113 The payload bits of a NaN must be conserved, with two exceptions.
11114 First, environments which use only a single canonical representation of NaN
11115 must perform said canonicalization. Second, SNaNs must be quieted per the
11116 usual methods.
11117
11118 The canonicalization operation may be optimized away if:
11119
11120 - The input is known to be canonical. For example, it was produced by a
11121   floating-point operation that is required by the standard to be canonical.
11122 - The result is consumed only by (or fused with) other floating-point
11123   operations. That is, the bits of the floating point value are not examined.
11124
11125 '``llvm.fmuladd.*``' Intrinsic
11126 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11127
11128 Syntax:
11129 """""""
11130
11131 ::
11132
11133       declare float @llvm.fmuladd.f32(float %a, float %b, float %c)
11134       declare double @llvm.fmuladd.f64(double %a, double %b, double %c)
11135
11136 Overview:
11137 """""""""
11138
11139 The '``llvm.fmuladd.*``' intrinsic functions represent multiply-add
11140 expressions that can be fused if the code generator determines that (a) the
11141 target instruction set has support for a fused operation, and (b) that the
11142 fused operation is more efficient than the equivalent, separate pair of mul
11143 and add instructions.
11144
11145 Arguments:
11146 """"""""""
11147
11148 The '``llvm.fmuladd.*``' intrinsics each take three arguments: two
11149 multiplicands, a and b, and an addend c.
11150
11151 Semantics:
11152 """"""""""
11153
11154 The expression:
11155
11156 ::
11157
11158       %0 = call float @llvm.fmuladd.f32(%a, %b, %c)
11159
11160 is equivalent to the expression a \* b + c, except that rounding will
11161 not be performed between the multiplication and addition steps if the
11162 code generator fuses the operations. Fusion is not guaranteed, even if
11163 the target platform supports it. If a fused multiply-add is required the
11164 corresponding llvm.fma.\* intrinsic function should be used
11165 instead. This never sets errno, just as '``llvm.fma.*``'.
11166
11167 Examples:
11168 """""""""
11169
11170 .. code-block:: llvm
11171
11172       %r2 = call float @llvm.fmuladd.f32(float %a, float %b, float %c) ; yields float:r2 = (a * b) + c
11173
11174
11175 '``llvm.uabsdiff.*``' and '``llvm.sabsdiff.*``' Intrinsics
11176 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11177
11178 Syntax:
11179 """""""
11180 This is an overloaded intrinsic. The loaded data is a vector of any integer bit width.
11181
11182 .. code-block:: llvm
11183
11184       declare <4 x integer> @llvm.uabsdiff.v4i32(<4 x integer> %a, <4 x integer> %b)
11185
11186
11187 Overview:
11188 """""""""
11189
11190 The ``llvm.uabsdiff`` intrinsic returns a vector result of the absolute difference
11191 of the two operands, treating them both as unsigned integers. The intermediate
11192 calculations are computed using infinitely precise unsigned arithmetic. The final
11193 result will be truncated to the given type.
11194
11195 The ``llvm.sabsdiff`` intrinsic returns a vector result of the absolute difference of
11196 the two operands, treating them both as signed integers. If the result overflows, the
11197 behavior is undefined.
11198
11199 .. note::
11200
11201     These intrinsics are primarily used during the code generation stage of compilation.
11202     They are generated by compiler passes such as the Loop and SLP vectorizers. It is not
11203     recommended for users to create them manually.
11204
11205 Arguments:
11206 """"""""""
11207
11208 Both intrinsics take two integer of the same bitwidth.
11209
11210 Semantics:
11211 """"""""""
11212
11213 The expression::
11214
11215     call <4 x i32> @llvm.uabsdiff.v4i32(<4 x i32> %a, <4 x i32> %b)
11216
11217 is equivalent to::
11218
11219     %1 = zext <4 x i32> %a to <4 x i64>
11220     %2 = zext <4 x i32> %b to <4 x i64>
11221     %sub = sub <4 x i64> %1, %2
11222     %trunc = trunc <4 x i64> to <4 x i32>
11223
11224 and the expression::
11225
11226     call <4 x i32> @llvm.sabsdiff.v4i32(<4 x i32> %a, <4 x i32> %b)
11227
11228 is equivalent to::
11229
11230     %sub = sub nsw <4 x i32> %a, %b
11231     %ispos = icmp sge <4 x i32> %sub, zeroinitializer
11232     %neg = sub nsw <4 x i32> zeroinitializer, %sub
11233     %1 = select <4 x i1> %ispos, <4 x i32> %sub, <4 x i32> %neg
11234
11235
11236 Half Precision Floating Point Intrinsics
11237 ----------------------------------------
11238
11239 For most target platforms, half precision floating point is a
11240 storage-only format. This means that it is a dense encoding (in memory)
11241 but does not support computation in the format.
11242
11243 This means that code must first load the half-precision floating point
11244 value as an i16, then convert it to float with
11245 :ref:`llvm.convert.from.fp16 <int_convert_from_fp16>`. Computation can
11246 then be performed on the float value (including extending to double
11247 etc). To store the value back to memory, it is first converted to float
11248 if needed, then converted to i16 with
11249 :ref:`llvm.convert.to.fp16 <int_convert_to_fp16>`, then storing as an
11250 i16 value.
11251
11252 .. _int_convert_to_fp16:
11253
11254 '``llvm.convert.to.fp16``' Intrinsic
11255 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11256
11257 Syntax:
11258 """""""
11259
11260 ::
11261
11262       declare i16 @llvm.convert.to.fp16.f32(float %a)
11263       declare i16 @llvm.convert.to.fp16.f64(double %a)
11264
11265 Overview:
11266 """""""""
11267
11268 The '``llvm.convert.to.fp16``' intrinsic function performs a conversion from a
11269 conventional floating point type to half precision floating point format.
11270
11271 Arguments:
11272 """"""""""
11273
11274 The intrinsic function contains single argument - the value to be
11275 converted.
11276
11277 Semantics:
11278 """"""""""
11279
11280 The '``llvm.convert.to.fp16``' intrinsic function performs a conversion from a
11281 conventional floating point format to half precision floating point format. The
11282 return value is an ``i16`` which contains the converted number.
11283
11284 Examples:
11285 """""""""
11286
11287 .. code-block:: llvm
11288
11289       %res = call i16 @llvm.convert.to.fp16.f32(float %a)
11290       store i16 %res, i16* @x, align 2
11291
11292 .. _int_convert_from_fp16:
11293
11294 '``llvm.convert.from.fp16``' Intrinsic
11295 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11296
11297 Syntax:
11298 """""""
11299
11300 ::
11301
11302       declare float @llvm.convert.from.fp16.f32(i16 %a)
11303       declare double @llvm.convert.from.fp16.f64(i16 %a)
11304
11305 Overview:
11306 """""""""
11307
11308 The '``llvm.convert.from.fp16``' intrinsic function performs a
11309 conversion from half precision floating point format to single precision
11310 floating point format.
11311
11312 Arguments:
11313 """"""""""
11314
11315 The intrinsic function contains single argument - the value to be
11316 converted.
11317
11318 Semantics:
11319 """"""""""
11320
11321 The '``llvm.convert.from.fp16``' intrinsic function performs a
11322 conversion from half single precision floating point format to single
11323 precision floating point format. The input half-float value is
11324 represented by an ``i16`` value.
11325
11326 Examples:
11327 """""""""
11328
11329 .. code-block:: llvm
11330
11331       %a = load i16, i16* @x, align 2
11332       %res = call float @llvm.convert.from.fp16(i16 %a)
11333
11334 .. _dbg_intrinsics:
11335
11336 Debugger Intrinsics
11337 -------------------
11338
11339 The LLVM debugger intrinsics (which all start with ``llvm.dbg.``
11340 prefix), are described in the `LLVM Source Level
11341 Debugging <SourceLevelDebugging.html#format_common_intrinsics>`_
11342 document.
11343
11344 Exception Handling Intrinsics
11345 -----------------------------
11346
11347 The LLVM exception handling intrinsics (which all start with
11348 ``llvm.eh.`` prefix), are described in the `LLVM Exception
11349 Handling <ExceptionHandling.html#format_common_intrinsics>`_ document.
11350
11351 .. _int_trampoline:
11352
11353 Trampoline Intrinsics
11354 ---------------------
11355
11356 These intrinsics make it possible to excise one parameter, marked with
11357 the :ref:`nest <nest>` attribute, from a function. The result is a
11358 callable function pointer lacking the nest parameter - the caller does
11359 not need to provide a value for it. Instead, the value to use is stored
11360 in advance in a "trampoline", a block of memory usually allocated on the
11361 stack, which also contains code to splice the nest value into the
11362 argument list. This is used to implement the GCC nested function address
11363 extension.
11364
11365 For example, if the function is ``i32 f(i8* nest %c, i32 %x, i32 %y)``
11366 then the resulting function pointer has signature ``i32 (i32, i32)*``.
11367 It can be created as follows:
11368
11369 .. code-block:: llvm
11370
11371       %tramp = alloca [10 x i8], align 4 ; size and alignment only correct for X86
11372       %tramp1 = getelementptr [10 x i8], [10 x i8]* %tramp, i32 0, i32 0
11373       call i8* @llvm.init.trampoline(i8* %tramp1, i8* bitcast (i32 (i8*, i32, i32)* @f to i8*), i8* %nval)
11374       %p = call i8* @llvm.adjust.trampoline(i8* %tramp1)
11375       %fp = bitcast i8* %p to i32 (i32, i32)*
11376
11377 The call ``%val = call i32 %fp(i32 %x, i32 %y)`` is then equivalent to
11378 ``%val = call i32 %f(i8* %nval, i32 %x, i32 %y)``.
11379
11380 .. _int_it:
11381
11382 '``llvm.init.trampoline``' Intrinsic
11383 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11384
11385 Syntax:
11386 """""""
11387
11388 ::
11389
11390       declare void @llvm.init.trampoline(i8* <tramp>, i8* <func>, i8* <nval>)
11391
11392 Overview:
11393 """""""""
11394
11395 This fills the memory pointed to by ``tramp`` with executable code,
11396 turning it into a trampoline.
11397
11398 Arguments:
11399 """"""""""
11400
11401 The ``llvm.init.trampoline`` intrinsic takes three arguments, all
11402 pointers. The ``tramp`` argument must point to a sufficiently large and
11403 sufficiently aligned block of memory; this memory is written to by the
11404 intrinsic. Note that the size and the alignment are target-specific -
11405 LLVM currently provides no portable way of determining them, so a
11406 front-end that generates this intrinsic needs to have some
11407 target-specific knowledge. The ``func`` argument must hold a function
11408 bitcast to an ``i8*``.
11409
11410 Semantics:
11411 """"""""""
11412
11413 The block of memory pointed to by ``tramp`` is filled with target
11414 dependent code, turning it into a function. Then ``tramp`` needs to be
11415 passed to :ref:`llvm.adjust.trampoline <int_at>` to get a pointer which can
11416 be :ref:`bitcast (to a new function) and called <int_trampoline>`. The new
11417 function's signature is the same as that of ``func`` with any arguments
11418 marked with the ``nest`` attribute removed. At most one such ``nest``
11419 argument is allowed, and it must be of pointer type. Calling the new
11420 function is equivalent to calling ``func`` with the same argument list,
11421 but with ``nval`` used for the missing ``nest`` argument. If, after
11422 calling ``llvm.init.trampoline``, the memory pointed to by ``tramp`` is
11423 modified, then the effect of any later call to the returned function
11424 pointer is undefined.
11425
11426 .. _int_at:
11427
11428 '``llvm.adjust.trampoline``' Intrinsic
11429 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11430
11431 Syntax:
11432 """""""
11433
11434 ::
11435
11436       declare i8* @llvm.adjust.trampoline(i8* <tramp>)
11437
11438 Overview:
11439 """""""""
11440
11441 This performs any required machine-specific adjustment to the address of
11442 a trampoline (passed as ``tramp``).
11443
11444 Arguments:
11445 """"""""""
11446
11447 ``tramp`` must point to a block of memory which already has trampoline
11448 code filled in by a previous call to
11449 :ref:`llvm.init.trampoline <int_it>`.
11450
11451 Semantics:
11452 """"""""""
11453
11454 On some architectures the address of the code to be executed needs to be
11455 different than the address where the trampoline is actually stored. This
11456 intrinsic returns the executable address corresponding to ``tramp``
11457 after performing the required machine specific adjustments. The pointer
11458 returned can then be :ref:`bitcast and executed <int_trampoline>`.
11459
11460 .. _int_mload_mstore:
11461
11462 Masked Vector Load and Store Intrinsics
11463 ---------------------------------------
11464
11465 LLVM provides intrinsics for predicated vector load and store operations. The predicate is specified by a mask operand, which holds one bit per vector element, switching the associated vector lane on or off. The memory addresses corresponding to the "off" lanes are not accessed. When all bits of the mask are on, the intrinsic is identical to a regular vector load or store. When all bits are off, no memory is accessed.
11466
11467 .. _int_mload:
11468
11469 '``llvm.masked.load.*``' Intrinsics
11470 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11471
11472 Syntax:
11473 """""""
11474 This is an overloaded intrinsic. The loaded data is a vector of any integer, floating point or pointer data type.
11475
11476 ::
11477
11478       declare <16 x float>  @llvm.masked.load.v16f32 (<16 x float>* <ptr>, i32 <alignment>, <16 x i1> <mask>, <16 x float> <passthru>)
11479       declare <2 x double>  @llvm.masked.load.v2f64  (<2 x double>* <ptr>, i32 <alignment>, <2 x i1>  <mask>, <2 x double> <passthru>)
11480       ;; The data is a vector of pointers to double
11481       declare <8 x double*> @llvm.masked.load.v8p0f64    (<8 x double*>* <ptr>, i32 <alignment>, <8 x i1> <mask>, <8 x double*> <passthru>)
11482       ;; The data is a vector of function pointers
11483       declare <8 x i32 ()*> @llvm.masked.load.v8p0f_i32f (<8 x i32 ()*>* <ptr>, i32 <alignment>, <8 x i1> <mask>, <8 x i32 ()*> <passthru>)
11484
11485 Overview:
11486 """""""""
11487
11488 Reads a vector from memory according to the provided mask. The mask holds a bit for each vector lane, and is used to prevent memory accesses to the masked-off lanes. The masked-off lanes in the result vector are taken from the corresponding lanes of the '``passthru``' operand.
11489
11490
11491 Arguments:
11492 """"""""""
11493
11494 The first operand is the base pointer for the load. The second operand is the alignment of the source location. It must be a constant integer value. The third operand, mask, is a vector of boolean values with the same number of elements as the return type. The fourth is a pass-through value that is used to fill the masked-off lanes of the result. The return type, underlying type of the base pointer and the type of the '``passthru``' operand are the same vector types.
11495
11496
11497 Semantics:
11498 """"""""""
11499
11500 The '``llvm.masked.load``' intrinsic is designed for conditional reading of selected vector elements in a single IR operation. It is useful for targets that support vector masked loads and allows vectorizing predicated basic blocks on these targets. Other targets may support this intrinsic differently, for example by lowering it into a sequence of branches that guard scalar load operations.
11501 The result of this operation is equivalent to a regular vector load instruction followed by a 'select' between the loaded and the passthru values, predicated on the same mask. However, using this intrinsic prevents exceptions on memory access to masked-off lanes.
11502
11503
11504 ::
11505
11506        %res = call <16 x float> @llvm.masked.load.v16f32 (<16 x float>* %ptr, i32 4, <16 x i1>%mask, <16 x float> %passthru)
11507
11508        ;; The result of the two following instructions is identical aside from potential memory access exception
11509        %loadlal = load <16 x float>, <16 x float>* %ptr, align 4
11510        %res = select <16 x i1> %mask, <16 x float> %loadlal, <16 x float> %passthru
11511
11512 .. _int_mstore:
11513
11514 '``llvm.masked.store.*``' Intrinsics
11515 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11516
11517 Syntax:
11518 """""""
11519 This is an overloaded intrinsic. The data stored in memory is a vector of any integer, floating point or pointer data type.
11520
11521 ::
11522
11523        declare void @llvm.masked.store.v8i32  (<8  x i32>   <value>, <8  x i32>*   <ptr>, i32 <alignment>,  <8  x i1> <mask>)
11524        declare void @llvm.masked.store.v16f32 (<16 x float> <value>, <16 x float>* <ptr>, i32 <alignment>,  <16 x i1> <mask>)
11525        ;; The data is a vector of pointers to double
11526        declare void @llvm.masked.store.v8p0f64    (<8 x double*> <value>, <8 x double*>* <ptr>, i32 <alignment>, <8 x i1> <mask>)
11527        ;; The data is a vector of function pointers
11528        declare void @llvm.masked.store.v4p0f_i32f (<4 x i32 ()*> <value>, <4 x i32 ()*>* <ptr>, i32 <alignment>, <4 x i1> <mask>)
11529
11530 Overview:
11531 """""""""
11532
11533 Writes a vector to memory according to the provided mask. The mask holds a bit for each vector lane, and is used to prevent memory accesses to the masked-off lanes.
11534
11535 Arguments:
11536 """"""""""
11537
11538 The first operand is the vector value to be written to memory. The second operand is the base pointer for the store, it has the same underlying type as the value operand. The third operand is the alignment of the destination location. The fourth operand, mask, is a vector of boolean values. The types of the mask and the value operand must have the same number of vector elements.
11539
11540
11541 Semantics:
11542 """"""""""
11543
11544 The '``llvm.masked.store``' intrinsics is designed for conditional writing of selected vector elements in a single IR operation. It is useful for targets that support vector masked store and allows vectorizing predicated basic blocks on these targets. Other targets may support this intrinsic differently, for example by lowering it into a sequence of branches that guard scalar store operations.
11545 The result of this operation is equivalent to a load-modify-store sequence. However, using this intrinsic prevents exceptions and data races on memory access to masked-off lanes.
11546
11547 ::
11548
11549        call void @llvm.masked.store.v16f32(<16 x float> %value, <16 x float>* %ptr, i32 4,  <16 x i1> %mask)
11550
11551        ;; The result of the following instructions is identical aside from potential data races and memory access exceptions
11552        %oldval = load <16 x float>, <16 x float>* %ptr, align 4
11553        %res = select <16 x i1> %mask, <16 x float> %value, <16 x float> %oldval
11554        store <16 x float> %res, <16 x float>* %ptr, align 4
11555
11556
11557 Masked Vector Gather and Scatter Intrinsics
11558 -------------------------------------------
11559
11560 LLVM provides intrinsics for vector gather and scatter operations. They are similar to :ref:`Masked Vector Load and Store <int_mload_mstore>`, except they are designed for arbitrary memory accesses, rather than sequential memory accesses. Gather and scatter also employ a mask operand, which holds one bit per vector element, switching the associated vector lane on or off. The memory addresses corresponding to the "off" lanes are not accessed. When all bits are off, no memory is accessed.
11561
11562 .. _int_mgather:
11563
11564 '``llvm.masked.gather.*``' Intrinsics
11565 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11566
11567 Syntax:
11568 """""""
11569 This is an overloaded intrinsic. The loaded data are multiple scalar values of any integer, floating point or pointer data type gathered together into one vector.
11570
11571 ::
11572
11573       declare <16 x float> @llvm.masked.gather.v16f32   (<16 x float*> <ptrs>, i32 <alignment>, <16 x i1> <mask>, <16 x float> <passthru>)
11574       declare <2 x double> @llvm.masked.gather.v2f64    (<2 x double*> <ptrs>, i32 <alignment>, <2 x i1>  <mask>, <2 x double> <passthru>)
11575       declare <8 x float*> @llvm.masked.gather.v8p0f32  (<8 x float**> <ptrs>, i32 <alignment>, <8 x i1>  <mask>, <8 x float*> <passthru>)
11576
11577 Overview:
11578 """""""""
11579
11580 Reads scalar values from arbitrary memory locations and gathers them into one vector. The memory locations are provided in the vector of pointers '``ptrs``'. The memory is accessed according to the provided mask. The mask holds a bit for each vector lane, and is used to prevent memory accesses to the masked-off lanes. The masked-off lanes in the result vector are taken from the corresponding lanes of the '``passthru``' operand.
11581
11582
11583 Arguments:
11584 """"""""""
11585
11586 The first operand is a vector of pointers which holds all memory addresses to read. The second operand is an alignment of the source addresses. It must be a constant integer value. The third operand, mask, is a vector of boolean values with the same number of elements as the return type. The fourth is a pass-through value that is used to fill the masked-off lanes of the result. The return type, underlying type of the vector of pointers and the type of the '``passthru``' operand are the same vector types.
11587
11588
11589 Semantics:
11590 """"""""""
11591
11592 The '``llvm.masked.gather``' intrinsic is designed for conditional reading of multiple scalar values from arbitrary memory locations in a single IR operation. It is useful for targets that support vector masked gathers and allows vectorizing basic blocks with data and control divergence. Other targets may support this intrinsic differently, for example by lowering it into a sequence of scalar load operations.
11593 The semantics of this operation are equivalent to a sequence of conditional scalar loads with subsequent gathering all loaded values into a single vector. The mask restricts memory access to certain lanes and facilitates vectorization of predicated basic blocks.
11594
11595
11596 ::
11597
11598        %res = call <4 x double> @llvm.masked.gather.v4f64 (<4 x double*> %ptrs, i32 8, <4 x i1>%mask, <4 x double> <true, true, true, true>)
11599
11600        ;; The gather with all-true mask is equivalent to the following instruction sequence
11601        %ptr0 = extractelement <4 x double*> %ptrs, i32 0
11602        %ptr1 = extractelement <4 x double*> %ptrs, i32 1
11603        %ptr2 = extractelement <4 x double*> %ptrs, i32 2
11604        %ptr3 = extractelement <4 x double*> %ptrs, i32 3
11605
11606        %val0 = load double, double* %ptr0, align 8
11607        %val1 = load double, double* %ptr1, align 8
11608        %val2 = load double, double* %ptr2, align 8
11609        %val3 = load double, double* %ptr3, align 8
11610
11611        %vec0    = insertelement <4 x double>undef, %val0, 0
11612        %vec01   = insertelement <4 x double>%vec0, %val1, 1
11613        %vec012  = insertelement <4 x double>%vec01, %val2, 2
11614        %vec0123 = insertelement <4 x double>%vec012, %val3, 3
11615
11616 .. _int_mscatter:
11617
11618 '``llvm.masked.scatter.*``' Intrinsics
11619 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11620
11621 Syntax:
11622 """""""
11623 This is an overloaded intrinsic. The data stored in memory is a vector of any integer, floating point or pointer data type. Each vector element is stored in an arbitrary memory address. Scatter with overlapping addresses is guaranteed to be ordered from least-significant to most-significant element.
11624
11625 ::
11626
11627        declare void @llvm.masked.scatter.v8i32   (<8 x i32>     <value>, <8 x i32*>     <ptrs>, i32 <alignment>, <8 x i1>  <mask>)
11628        declare void @llvm.masked.scatter.v16f32  (<16 x float>  <value>, <16 x float*>  <ptrs>, i32 <alignment>, <16 x i1> <mask>)
11629        declare void @llvm.masked.scatter.v4p0f64 (<4 x double*> <value>, <4 x double**> <ptrs>, i32 <alignment>, <4 x i1>  <mask>)
11630
11631 Overview:
11632 """""""""
11633
11634 Writes each element from the value vector to the corresponding memory address. The memory addresses are represented as a vector of pointers. Writing is done according to the provided mask. The mask holds a bit for each vector lane, and is used to prevent memory accesses to the masked-off lanes.
11635
11636 Arguments:
11637 """"""""""
11638
11639 The first operand is a vector value to be written to memory. The second operand is a vector of pointers, pointing to where the value elements should be stored. It has the same underlying type as the value operand. The third operand is an alignment of the destination addresses. The fourth operand, mask, is a vector of boolean values. The types of the mask and the value operand must have the same number of vector elements.
11640
11641
11642 Semantics:
11643 """"""""""
11644
11645 The '``llvm.masked.scatter``' intrinsics is designed for writing selected vector elements to arbitrary memory addresses in a single IR operation. The operation may be conditional, when not all bits in the mask are switched on. It is useful for targets that support vector masked scatter and allows vectorizing basic blocks with data and control divergence. Other targets may support this intrinsic differently, for example by lowering it into a sequence of branches that guard scalar store operations.
11646
11647 ::
11648
11649        ;; This instruction unconditionaly stores data vector in multiple addresses
11650        call @llvm.masked.scatter.v8i32 (<8 x i32> %value, <8 x i32*> %ptrs, i32 4,  <8 x i1>  <true, true, .. true>)
11651
11652        ;; It is equivalent to a list of scalar stores
11653        %val0 = extractelement <8 x i32> %value, i32 0
11654        %val1 = extractelement <8 x i32> %value, i32 1
11655        ..
11656        %val7 = extractelement <8 x i32> %value, i32 7
11657        %ptr0 = extractelement <8 x i32*> %ptrs, i32 0
11658        %ptr1 = extractelement <8 x i32*> %ptrs, i32 1
11659        ..
11660        %ptr7 = extractelement <8 x i32*> %ptrs, i32 7
11661        ;; Note: the order of the following stores is important when they overlap:
11662        store i32 %val0, i32* %ptr0, align 4
11663        store i32 %val1, i32* %ptr1, align 4
11664        ..
11665        store i32 %val7, i32* %ptr7, align 4
11666
11667
11668 Memory Use Markers
11669 ------------------
11670
11671 This class of intrinsics provides information about the lifetime of
11672 memory objects and ranges where variables are immutable.
11673
11674 .. _int_lifestart:
11675
11676 '``llvm.lifetime.start``' Intrinsic
11677 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11678
11679 Syntax:
11680 """""""
11681
11682 ::
11683
11684       declare void @llvm.lifetime.start(i64 <size>, i8* nocapture <ptr>)
11685
11686 Overview:
11687 """""""""
11688
11689 The '``llvm.lifetime.start``' intrinsic specifies the start of a memory
11690 object's lifetime.
11691
11692 Arguments:
11693 """"""""""
11694
11695 The first argument is a constant integer representing the size of the
11696 object, or -1 if it is variable sized. The second argument is a pointer
11697 to the object.
11698
11699 Semantics:
11700 """"""""""
11701
11702 This intrinsic indicates that before this point in the code, the value
11703 of the memory pointed to by ``ptr`` is dead. This means that it is known
11704 to never be used and has an undefined value. A load from the pointer
11705 that precedes this intrinsic can be replaced with ``'undef'``.
11706
11707 .. _int_lifeend:
11708
11709 '``llvm.lifetime.end``' Intrinsic
11710 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11711
11712 Syntax:
11713 """""""
11714
11715 ::
11716
11717       declare void @llvm.lifetime.end(i64 <size>, i8* nocapture <ptr>)
11718
11719 Overview:
11720 """""""""
11721
11722 The '``llvm.lifetime.end``' intrinsic specifies the end of a memory
11723 object's lifetime.
11724
11725 Arguments:
11726 """"""""""
11727
11728 The first argument is a constant integer representing the size of the
11729 object, or -1 if it is variable sized. The second argument is a pointer
11730 to the object.
11731
11732 Semantics:
11733 """"""""""
11734
11735 This intrinsic indicates that after this point in the code, the value of
11736 the memory pointed to by ``ptr`` is dead. This means that it is known to
11737 never be used and has an undefined value. Any stores into the memory
11738 object following this intrinsic may be removed as dead.
11739
11740 '``llvm.invariant.start``' Intrinsic
11741 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11742
11743 Syntax:
11744 """""""
11745
11746 ::
11747
11748       declare {}* @llvm.invariant.start(i64 <size>, i8* nocapture <ptr>)
11749
11750 Overview:
11751 """""""""
11752
11753 The '``llvm.invariant.start``' intrinsic specifies that the contents of
11754 a memory object will not change.
11755
11756 Arguments:
11757 """"""""""
11758
11759 The first argument is a constant integer representing the size of the
11760 object, or -1 if it is variable sized. The second argument is a pointer
11761 to the object.
11762
11763 Semantics:
11764 """"""""""
11765
11766 This intrinsic indicates that until an ``llvm.invariant.end`` that uses
11767 the return value, the referenced memory location is constant and
11768 unchanging.
11769
11770 '``llvm.invariant.end``' Intrinsic
11771 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11772
11773 Syntax:
11774 """""""
11775
11776 ::
11777
11778       declare void @llvm.invariant.end({}* <start>, i64 <size>, i8* nocapture <ptr>)
11779
11780 Overview:
11781 """""""""
11782
11783 The '``llvm.invariant.end``' intrinsic specifies that the contents of a
11784 memory object are mutable.
11785
11786 Arguments:
11787 """"""""""
11788
11789 The first argument is the matching ``llvm.invariant.start`` intrinsic.
11790 The second argument is a constant integer representing the size of the
11791 object, or -1 if it is variable sized and the third argument is a
11792 pointer to the object.
11793
11794 Semantics:
11795 """"""""""
11796
11797 This intrinsic indicates that the memory is mutable again.
11798
11799 '``llvm.invariant.group.barrier``' Intrinsic
11800 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11801
11802 Syntax:
11803 """""""
11804
11805 ::
11806
11807       declare i8* @llvm.invariant.group.barrier(i8* <ptr>)
11808
11809 Overview:
11810 """""""""
11811
11812 The '``llvm.invariant.group.barrier``' intrinsic can be used when an invariant 
11813 established by invariant.group metadata no longer holds, to obtain a new pointer
11814 value that does not carry the invariant information.
11815
11816
11817 Arguments:
11818 """"""""""
11819
11820 The ``llvm.invariant.group.barrier`` takes only one argument, which is
11821 the pointer to the memory for which the ``invariant.group`` no longer holds.
11822
11823 Semantics:
11824 """"""""""
11825
11826 Returns another pointer that aliases its argument but which is considered different 
11827 for the purposes of ``load``/``store`` ``invariant.group`` metadata.
11828
11829 General Intrinsics
11830 ------------------
11831
11832 This class of intrinsics is designed to be generic and has no specific
11833 purpose.
11834
11835 '``llvm.var.annotation``' Intrinsic
11836 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11837
11838 Syntax:
11839 """""""
11840
11841 ::
11842
11843       declare void @llvm.var.annotation(i8* <val>, i8* <str>, i8* <str>, i32  <int>)
11844
11845 Overview:
11846 """""""""
11847
11848 The '``llvm.var.annotation``' intrinsic.
11849
11850 Arguments:
11851 """"""""""
11852
11853 The first argument is a pointer to a value, the second is a pointer to a
11854 global string, the third is a pointer to a global string which is the
11855 source file name, and the last argument is the line number.
11856
11857 Semantics:
11858 """"""""""
11859
11860 This intrinsic allows annotation of local variables with arbitrary
11861 strings. This can be useful for special purpose optimizations that want
11862 to look for these annotations. These have no other defined use; they are
11863 ignored by code generation and optimization.
11864
11865 '``llvm.ptr.annotation.*``' Intrinsic
11866 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11867
11868 Syntax:
11869 """""""
11870
11871 This is an overloaded intrinsic. You can use '``llvm.ptr.annotation``' on a
11872 pointer to an integer of any width. *NOTE* you must specify an address space for
11873 the pointer. The identifier for the default address space is the integer
11874 '``0``'.
11875
11876 ::
11877
11878       declare i8*   @llvm.ptr.annotation.p<address space>i8(i8* <val>, i8* <str>, i8* <str>, i32  <int>)
11879       declare i16*  @llvm.ptr.annotation.p<address space>i16(i16* <val>, i8* <str>, i8* <str>, i32  <int>)
11880       declare i32*  @llvm.ptr.annotation.p<address space>i32(i32* <val>, i8* <str>, i8* <str>, i32  <int>)
11881       declare i64*  @llvm.ptr.annotation.p<address space>i64(i64* <val>, i8* <str>, i8* <str>, i32  <int>)
11882       declare i256* @llvm.ptr.annotation.p<address space>i256(i256* <val>, i8* <str>, i8* <str>, i32  <int>)
11883
11884 Overview:
11885 """""""""
11886
11887 The '``llvm.ptr.annotation``' intrinsic.
11888
11889 Arguments:
11890 """"""""""
11891
11892 The first argument is a pointer to an integer value of arbitrary bitwidth
11893 (result of some expression), the second is a pointer to a global string, the
11894 third is a pointer to a global string which is the source file name, and the
11895 last argument is the line number. It returns the value of the first argument.
11896
11897 Semantics:
11898 """"""""""
11899
11900 This intrinsic allows annotation of a pointer to an integer with arbitrary
11901 strings. This can be useful for special purpose optimizations that want to look
11902 for these annotations. These have no other defined use; they are ignored by code
11903 generation and optimization.
11904
11905 '``llvm.annotation.*``' Intrinsic
11906 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11907
11908 Syntax:
11909 """""""
11910
11911 This is an overloaded intrinsic. You can use '``llvm.annotation``' on
11912 any integer bit width.
11913
11914 ::
11915
11916       declare i8 @llvm.annotation.i8(i8 <val>, i8* <str>, i8* <str>, i32  <int>)
11917       declare i16 @llvm.annotation.i16(i16 <val>, i8* <str>, i8* <str>, i32  <int>)
11918       declare i32 @llvm.annotation.i32(i32 <val>, i8* <str>, i8* <str>, i32  <int>)
11919       declare i64 @llvm.annotation.i64(i64 <val>, i8* <str>, i8* <str>, i32  <int>)
11920       declare i256 @llvm.annotation.i256(i256 <val>, i8* <str>, i8* <str>, i32  <int>)
11921
11922 Overview:
11923 """""""""
11924
11925 The '``llvm.annotation``' intrinsic.
11926
11927 Arguments:
11928 """"""""""
11929
11930 The first argument is an integer value (result of some expression), the
11931 second is a pointer to a global string, the third is a pointer to a
11932 global string which is the source file name, and the last argument is
11933 the line number. It returns the value of the first argument.
11934
11935 Semantics:
11936 """"""""""
11937
11938 This intrinsic allows annotations to be put on arbitrary expressions
11939 with arbitrary strings. This can be useful for special purpose
11940 optimizations that want to look for these annotations. These have no
11941 other defined use; they are ignored by code generation and optimization.
11942
11943 '``llvm.trap``' Intrinsic
11944 ^^^^^^^^^^^^^^^^^^^^^^^^^
11945
11946 Syntax:
11947 """""""
11948
11949 ::
11950
11951       declare void @llvm.trap() noreturn nounwind
11952
11953 Overview:
11954 """""""""
11955
11956 The '``llvm.trap``' intrinsic.
11957
11958 Arguments:
11959 """"""""""
11960
11961 None.
11962
11963 Semantics:
11964 """"""""""
11965
11966 This intrinsic is lowered to the target dependent trap instruction. If
11967 the target does not have a trap instruction, this intrinsic will be
11968 lowered to a call of the ``abort()`` function.
11969
11970 '``llvm.debugtrap``' Intrinsic
11971 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11972
11973 Syntax:
11974 """""""
11975
11976 ::
11977
11978       declare void @llvm.debugtrap() nounwind
11979
11980 Overview:
11981 """""""""
11982
11983 The '``llvm.debugtrap``' intrinsic.
11984
11985 Arguments:
11986 """"""""""
11987
11988 None.
11989
11990 Semantics:
11991 """"""""""
11992
11993 This intrinsic is lowered to code which is intended to cause an
11994 execution trap with the intention of requesting the attention of a
11995 debugger.
11996
11997 '``llvm.stackprotector``' Intrinsic
11998 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
11999
12000 Syntax:
12001 """""""
12002
12003 ::
12004
12005       declare void @llvm.stackprotector(i8* <guard>, i8** <slot>)
12006
12007 Overview:
12008 """""""""
12009
12010 The ``llvm.stackprotector`` intrinsic takes the ``guard`` and stores it
12011 onto the stack at ``slot``. The stack slot is adjusted to ensure that it
12012 is placed on the stack before local variables.
12013
12014 Arguments:
12015 """"""""""
12016
12017 The ``llvm.stackprotector`` intrinsic requires two pointer arguments.
12018 The first argument is the value loaded from the stack guard
12019 ``@__stack_chk_guard``. The second variable is an ``alloca`` that has
12020 enough space to hold the value of the guard.
12021
12022 Semantics:
12023 """"""""""
12024
12025 This intrinsic causes the prologue/epilogue inserter to force the position of
12026 the ``AllocaInst`` stack slot to be before local variables on the stack. This is
12027 to ensure that if a local variable on the stack is overwritten, it will destroy
12028 the value of the guard. When the function exits, the guard on the stack is
12029 checked against the original guard by ``llvm.stackprotectorcheck``. If they are
12030 different, then ``llvm.stackprotectorcheck`` causes the program to abort by
12031 calling the ``__stack_chk_fail()`` function.
12032
12033 '``llvm.stackprotectorcheck``' Intrinsic
12034 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
12035
12036 Syntax:
12037 """""""
12038
12039 ::
12040
12041       declare void @llvm.stackprotectorcheck(i8** <guard>)
12042
12043 Overview:
12044 """""""""
12045
12046 The ``llvm.stackprotectorcheck`` intrinsic compares ``guard`` against an already
12047 created stack protector and if they are not equal calls the
12048 ``__stack_chk_fail()`` function.
12049
12050 Arguments:
12051 """"""""""
12052
12053 The ``llvm.stackprotectorcheck`` intrinsic requires one pointer argument, the
12054 the variable ``@__stack_chk_guard``.
12055
12056 Semantics:
12057 """"""""""
12058
12059 This intrinsic is provided to perform the stack protector check by comparing
12060 ``guard`` with the stack slot created by ``llvm.stackprotector`` and if the
12061 values do not match call the ``__stack_chk_fail()`` function.
12062
12063 The reason to provide this as an IR level intrinsic instead of implementing it
12064 via other IR operations is that in order to perform this operation at the IR
12065 level without an intrinsic, one would need to create additional basic blocks to
12066 handle the success/failure cases. This makes it difficult to stop the stack
12067 protector check from disrupting sibling tail calls in Codegen. With this
12068 intrinsic, we are able to generate the stack protector basic blocks late in
12069 codegen after the tail call decision has occurred.
12070
12071 '``llvm.objectsize``' Intrinsic
12072 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
12073
12074 Syntax:
12075 """""""
12076
12077 ::
12078
12079       declare i32 @llvm.objectsize.i32(i8* <object>, i1 <min>)
12080       declare i64 @llvm.objectsize.i64(i8* <object>, i1 <min>)
12081
12082 Overview:
12083 """""""""
12084
12085 The ``llvm.objectsize`` intrinsic is designed to provide information to
12086 the optimizers to determine at compile time whether a) an operation
12087 (like memcpy) will overflow a buffer that corresponds to an object, or
12088 b) that a runtime check for overflow isn't necessary. An object in this
12089 context means an allocation of a specific class, structure, array, or
12090 other object.
12091
12092 Arguments:
12093 """"""""""
12094
12095 The ``llvm.objectsize`` intrinsic takes two arguments. The first
12096 argument is a pointer to or into the ``object``. The second argument is
12097 a boolean and determines whether ``llvm.objectsize`` returns 0 (if true)
12098 or -1 (if false) when the object size is unknown. The second argument
12099 only accepts constants.
12100
12101 Semantics:
12102 """"""""""
12103
12104 The ``llvm.objectsize`` intrinsic is lowered to a constant representing
12105 the size of the object concerned. If the size cannot be determined at
12106 compile time, ``llvm.objectsize`` returns ``i32/i64 -1 or 0`` (depending
12107 on the ``min`` argument).
12108
12109 '``llvm.expect``' Intrinsic
12110 ^^^^^^^^^^^^^^^^^^^^^^^^^^^
12111
12112 Syntax:
12113 """""""
12114
12115 This is an overloaded intrinsic. You can use ``llvm.expect`` on any
12116 integer bit width.
12117
12118 ::
12119
12120       declare i1 @llvm.expect.i1(i1 <val>, i1 <expected_val>)
12121       declare i32 @llvm.expect.i32(i32 <val>, i32 <expected_val>)
12122       declare i64 @llvm.expect.i64(i64 <val>, i64 <expected_val>)
12123
12124 Overview:
12125 """""""""
12126
12127 The ``llvm.expect`` intrinsic provides information about expected (the
12128 most probable) value of ``val``, which can be used by optimizers.
12129
12130 Arguments:
12131 """"""""""
12132
12133 The ``llvm.expect`` intrinsic takes two arguments. The first argument is
12134 a value. The second argument is an expected value, this needs to be a
12135 constant value, variables are not allowed.
12136
12137 Semantics:
12138 """"""""""
12139
12140 This intrinsic is lowered to the ``val``.
12141
12142 .. _int_assume:
12143
12144 '``llvm.assume``' Intrinsic
12145 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
12146
12147 Syntax:
12148 """""""
12149
12150 ::
12151
12152       declare void @llvm.assume(i1 %cond)
12153
12154 Overview:
12155 """""""""
12156
12157 The ``llvm.assume`` allows the optimizer to assume that the provided
12158 condition is true. This information can then be used in simplifying other parts
12159 of the code.
12160
12161 Arguments:
12162 """"""""""
12163
12164 The condition which the optimizer may assume is always true.
12165
12166 Semantics:
12167 """"""""""
12168
12169 The intrinsic allows the optimizer to assume that the provided condition is
12170 always true whenever the control flow reaches the intrinsic call. No code is
12171 generated for this intrinsic, and instructions that contribute only to the
12172 provided condition are not used for code generation. If the condition is
12173 violated during execution, the behavior is undefined.
12174
12175 Note that the optimizer might limit the transformations performed on values
12176 used by the ``llvm.assume`` intrinsic in order to preserve the instructions
12177 only used to form the intrinsic's input argument. This might prove undesirable
12178 if the extra information provided by the ``llvm.assume`` intrinsic does not cause
12179 sufficient overall improvement in code quality. For this reason,
12180 ``llvm.assume`` should not be used to document basic mathematical invariants
12181 that the optimizer can otherwise deduce or facts that are of little use to the
12182 optimizer.
12183
12184 .. _bitset.test:
12185
12186 '``llvm.bitset.test``' Intrinsic
12187 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
12188
12189 Syntax:
12190 """""""
12191
12192 ::
12193
12194       declare i1 @llvm.bitset.test(i8* %ptr, metadata %bitset) nounwind readnone
12195
12196
12197 Arguments:
12198 """"""""""
12199
12200 The first argument is a pointer to be tested. The second argument is a
12201 metadata object representing an identifier for a :doc:`bitset <BitSets>`.
12202
12203 Overview:
12204 """""""""
12205
12206 The ``llvm.bitset.test`` intrinsic tests whether the given pointer is a
12207 member of the given bitset.
12208
12209 '``llvm.donothing``' Intrinsic
12210 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
12211
12212 Syntax:
12213 """""""
12214
12215 ::
12216
12217       declare void @llvm.donothing() nounwind readnone
12218
12219 Overview:
12220 """""""""
12221
12222 The ``llvm.donothing`` intrinsic doesn't perform any operation. It's one of only
12223 two intrinsics (besides ``llvm.experimental.patchpoint``) that can be called
12224 with an invoke instruction.
12225
12226 Arguments:
12227 """"""""""
12228
12229 None.
12230
12231 Semantics:
12232 """"""""""
12233
12234 This intrinsic does nothing, and it's removed by optimizers and ignored
12235 by codegen.
12236
12237 Stack Map Intrinsics
12238 --------------------
12239
12240 LLVM provides experimental intrinsics to support runtime patching
12241 mechanisms commonly desired in dynamic language JITs. These intrinsics
12242 are described in :doc:`StackMaps`.