Add PREFETCHW codegen support
[oota-llvm.git] / lib / Target / X86 / X86InstrInfo.td
1 //===-- X86InstrInfo.td - Main X86 Instruction Definition --*- tablegen -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file describes the X86 instruction set, defining the instructions, and
11 // properties of the instructions which are needed for code generation, machine
12 // code emission, and analysis.
13 //
14 //===----------------------------------------------------------------------===//
15
16 //===----------------------------------------------------------------------===//
17 // X86 specific DAG Nodes.
18 //
19
20 def SDTIntShiftDOp: SDTypeProfile<1, 3,
21                                   [SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>,
22                                    SDTCisInt<0>, SDTCisInt<3>]>;
23
24 def SDTX86CmpTest : SDTypeProfile<1, 2, [SDTCisVT<0, i32>, SDTCisSameAs<1, 2>]>;
25
26 def SDTX86Cmpsd : SDTypeProfile<1, 3, [SDTCisVT<0, f64>, SDTCisSameAs<1, 2>, SDTCisVT<3, i8>]>;
27 def SDTX86Cmpss : SDTypeProfile<1, 3, [SDTCisVT<0, f32>, SDTCisSameAs<1, 2>, SDTCisVT<3, i8>]>;
28
29 def SDTX86Cmov    : SDTypeProfile<1, 4,
30                                   [SDTCisSameAs<0, 1>, SDTCisSameAs<1, 2>,
31                                    SDTCisVT<3, i8>, SDTCisVT<4, i32>]>;
32
33 // Unary and binary operator instructions that set EFLAGS as a side-effect.
34 def SDTUnaryArithWithFlags : SDTypeProfile<2, 1,
35                                            [SDTCisInt<0>, SDTCisVT<1, i32>]>;
36
37 def SDTBinaryArithWithFlags : SDTypeProfile<2, 2,
38                                             [SDTCisSameAs<0, 2>,
39                                              SDTCisSameAs<0, 3>,
40                                              SDTCisInt<0>, SDTCisVT<1, i32>]>;
41
42 // SDTBinaryArithWithFlagsInOut - RES1, EFLAGS = op LHS, RHS, EFLAGS
43 def SDTBinaryArithWithFlagsInOut : SDTypeProfile<2, 3,
44                                             [SDTCisSameAs<0, 2>,
45                                              SDTCisSameAs<0, 3>,
46                                              SDTCisInt<0>,
47                                              SDTCisVT<1, i32>,
48                                              SDTCisVT<4, i32>]>;
49 // RES1, RES2, FLAGS = op LHS, RHS
50 def SDT2ResultBinaryArithWithFlags : SDTypeProfile<3, 2,
51                                             [SDTCisSameAs<0, 1>,
52                                              SDTCisSameAs<0, 2>,
53                                              SDTCisSameAs<0, 3>,
54                                              SDTCisInt<0>, SDTCisVT<1, i32>]>;
55 def SDTX86BrCond  : SDTypeProfile<0, 3,
56                                   [SDTCisVT<0, OtherVT>,
57                                    SDTCisVT<1, i8>, SDTCisVT<2, i32>]>;
58
59 def SDTX86SetCC   : SDTypeProfile<1, 2,
60                                   [SDTCisVT<0, i8>,
61                                    SDTCisVT<1, i8>, SDTCisVT<2, i32>]>;
62 def SDTX86SetCC_C : SDTypeProfile<1, 2,
63                                   [SDTCisInt<0>,
64                                    SDTCisVT<1, i8>, SDTCisVT<2, i32>]>;
65
66 def SDTX86sahf : SDTypeProfile<1, 1, [SDTCisVT<0, i32>, SDTCisVT<1, i8>]>;
67
68 def SDTX86rdrand : SDTypeProfile<2, 0, [SDTCisInt<0>, SDTCisVT<1, i32>]>;
69
70 def SDTX86cas : SDTypeProfile<0, 3, [SDTCisPtrTy<0>, SDTCisInt<1>,
71                                      SDTCisVT<2, i8>]>;
72 def SDTX86caspair : SDTypeProfile<0, 1, [SDTCisPtrTy<0>]>;
73
74 def SDTX86atomicBinary : SDTypeProfile<2, 3, [SDTCisInt<0>, SDTCisInt<1>,
75                                 SDTCisPtrTy<2>, SDTCisInt<3>,SDTCisInt<4>]>;
76 def SDTX86Ret     : SDTypeProfile<0, -1, [SDTCisVT<0, i16>]>;
77
78 def SDT_X86CallSeqStart : SDCallSeqStart<[SDTCisVT<0, i32>]>;
79 def SDT_X86CallSeqEnd   : SDCallSeqEnd<[SDTCisVT<0, i32>,
80                                         SDTCisVT<1, i32>]>;
81
82 def SDT_X86Call   : SDTypeProfile<0, -1, [SDTCisVT<0, iPTR>]>;
83
84 def SDT_X86VASTART_SAVE_XMM_REGS : SDTypeProfile<0, -1, [SDTCisVT<0, i8>,
85                                                          SDTCisVT<1, iPTR>,
86                                                          SDTCisVT<2, iPTR>]>;
87
88 def SDT_X86VAARG_64 : SDTypeProfile<1, -1, [SDTCisPtrTy<0>,
89                                             SDTCisPtrTy<1>,
90                                             SDTCisVT<2, i32>,
91                                             SDTCisVT<3, i8>,
92                                             SDTCisVT<4, i32>]>;
93
94 def SDTX86RepStr  : SDTypeProfile<0, 1, [SDTCisVT<0, OtherVT>]>;
95
96 def SDTX86Void    : SDTypeProfile<0, 0, []>;
97
98 def SDTX86Wrapper : SDTypeProfile<1, 1, [SDTCisSameAs<0, 1>, SDTCisPtrTy<0>]>;
99
100 def SDT_X86TLSADDR : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
101
102 def SDT_X86TLSBASEADDR : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
103
104 def SDT_X86TLSCALL : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
105
106 def SDT_X86SEG_ALLOCA : SDTypeProfile<1, 1, [SDTCisVT<0, iPTR>, SDTCisVT<1, iPTR>]>;
107
108 def SDT_X86WIN_FTOL : SDTypeProfile<0, 1, [SDTCisFP<0>]>;
109
110 def SDT_X86EHRET : SDTypeProfile<0, 1, [SDTCisInt<0>]>;
111
112 def SDT_X86TCRET : SDTypeProfile<0, 2, [SDTCisPtrTy<0>, SDTCisVT<1, i32>]>;
113
114 def SDT_X86MEMBARRIER : SDTypeProfile<0, 0, []>;
115
116 def X86MemBarrier : SDNode<"X86ISD::MEMBARRIER", SDT_X86MEMBARRIER,
117                             [SDNPHasChain,SDNPSideEffect]>;
118 def X86MFence : SDNode<"X86ISD::MFENCE", SDT_X86MEMBARRIER,
119                         [SDNPHasChain]>;
120 def X86SFence : SDNode<"X86ISD::SFENCE", SDT_X86MEMBARRIER,
121                         [SDNPHasChain]>;
122 def X86LFence : SDNode<"X86ISD::LFENCE", SDT_X86MEMBARRIER,
123                         [SDNPHasChain]>;
124
125
126 def X86bsf     : SDNode<"X86ISD::BSF",      SDTUnaryArithWithFlags>;
127 def X86bsr     : SDNode<"X86ISD::BSR",      SDTUnaryArithWithFlags>;
128 def X86shld    : SDNode<"X86ISD::SHLD",     SDTIntShiftDOp>;
129 def X86shrd    : SDNode<"X86ISD::SHRD",     SDTIntShiftDOp>;
130
131 def X86cmp     : SDNode<"X86ISD::CMP" ,     SDTX86CmpTest>;
132 def X86bt      : SDNode<"X86ISD::BT",       SDTX86CmpTest>;
133
134 def X86cmov    : SDNode<"X86ISD::CMOV",     SDTX86Cmov>;
135 def X86brcond  : SDNode<"X86ISD::BRCOND",   SDTX86BrCond,
136                         [SDNPHasChain]>;
137 def X86setcc   : SDNode<"X86ISD::SETCC",    SDTX86SetCC>;
138 def X86setcc_c : SDNode<"X86ISD::SETCC_CARRY", SDTX86SetCC_C>;
139
140 def X86sahf    : SDNode<"X86ISD::SAHF",     SDTX86sahf>;
141
142 def X86rdrand  : SDNode<"X86ISD::RDRAND",   SDTX86rdrand,
143                         [SDNPHasChain, SDNPSideEffect]>;
144
145 def X86cas : SDNode<"X86ISD::LCMPXCHG_DAG", SDTX86cas,
146                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
147                          SDNPMayLoad, SDNPMemOperand]>;
148 def X86cas8 : SDNode<"X86ISD::LCMPXCHG8_DAG", SDTX86caspair,
149                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
150                          SDNPMayLoad, SDNPMemOperand]>;
151 def X86cas16 : SDNode<"X86ISD::LCMPXCHG16_DAG", SDTX86caspair,
152                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
153                          SDNPMayLoad, SDNPMemOperand]>;
154
155 def X86AtomAdd64 : SDNode<"X86ISD::ATOMADD64_DAG", SDTX86atomicBinary,
156                         [SDNPHasChain, SDNPMayStore,
157                          SDNPMayLoad, SDNPMemOperand]>;
158 def X86AtomSub64 : SDNode<"X86ISD::ATOMSUB64_DAG", SDTX86atomicBinary,
159                         [SDNPHasChain, SDNPMayStore,
160                          SDNPMayLoad, SDNPMemOperand]>;
161 def X86AtomOr64 : SDNode<"X86ISD::ATOMOR64_DAG", SDTX86atomicBinary,
162                         [SDNPHasChain, SDNPMayStore,
163                          SDNPMayLoad, SDNPMemOperand]>;
164 def X86AtomXor64 : SDNode<"X86ISD::ATOMXOR64_DAG", SDTX86atomicBinary,
165                         [SDNPHasChain, SDNPMayStore,
166                          SDNPMayLoad, SDNPMemOperand]>;
167 def X86AtomAnd64 : SDNode<"X86ISD::ATOMAND64_DAG", SDTX86atomicBinary,
168                         [SDNPHasChain, SDNPMayStore,
169                          SDNPMayLoad, SDNPMemOperand]>;
170 def X86AtomNand64 : SDNode<"X86ISD::ATOMNAND64_DAG", SDTX86atomicBinary,
171                         [SDNPHasChain, SDNPMayStore,
172                          SDNPMayLoad, SDNPMemOperand]>;
173 def X86AtomSwap64 : SDNode<"X86ISD::ATOMSWAP64_DAG", SDTX86atomicBinary,
174                         [SDNPHasChain, SDNPMayStore,
175                          SDNPMayLoad, SDNPMemOperand]>;
176 def X86retflag : SDNode<"X86ISD::RET_FLAG", SDTX86Ret,
177                         [SDNPHasChain, SDNPOptInGlue, SDNPVariadic]>;
178
179 def X86vastart_save_xmm_regs :
180                  SDNode<"X86ISD::VASTART_SAVE_XMM_REGS",
181                         SDT_X86VASTART_SAVE_XMM_REGS,
182                         [SDNPHasChain, SDNPVariadic]>;
183 def X86vaarg64 :
184                  SDNode<"X86ISD::VAARG_64", SDT_X86VAARG_64,
185                         [SDNPHasChain, SDNPMayLoad, SDNPMayStore,
186                          SDNPMemOperand]>;
187 def X86callseq_start :
188                  SDNode<"ISD::CALLSEQ_START", SDT_X86CallSeqStart,
189                         [SDNPHasChain, SDNPOutGlue]>;
190 def X86callseq_end :
191                  SDNode<"ISD::CALLSEQ_END",   SDT_X86CallSeqEnd,
192                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
193
194 def X86call    : SDNode<"X86ISD::CALL",     SDT_X86Call,
195                         [SDNPHasChain, SDNPOutGlue, SDNPOptInGlue,
196                          SDNPVariadic]>;
197
198 def X86rep_stos: SDNode<"X86ISD::REP_STOS", SDTX86RepStr,
199                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore]>;
200 def X86rep_movs: SDNode<"X86ISD::REP_MOVS", SDTX86RepStr,
201                         [SDNPHasChain, SDNPInGlue, SDNPOutGlue, SDNPMayStore,
202                          SDNPMayLoad]>;
203
204 def X86rdtsc   : SDNode<"X86ISD::RDTSC_DAG", SDTX86Void,
205                         [SDNPHasChain, SDNPOutGlue, SDNPSideEffect]>;
206
207 def X86Wrapper    : SDNode<"X86ISD::Wrapper",     SDTX86Wrapper>;
208 def X86WrapperRIP : SDNode<"X86ISD::WrapperRIP",  SDTX86Wrapper>;
209
210 def X86tlsaddr : SDNode<"X86ISD::TLSADDR", SDT_X86TLSADDR,
211                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
212
213 def X86tlsbaseaddr : SDNode<"X86ISD::TLSBASEADDR", SDT_X86TLSBASEADDR,
214                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
215
216 def X86ehret : SDNode<"X86ISD::EH_RETURN", SDT_X86EHRET,
217                         [SDNPHasChain]>;
218
219 def X86eh_sjlj_setjmp  : SDNode<"X86ISD::EH_SJLJ_SETJMP",
220                                 SDTypeProfile<1, 1, [SDTCisInt<0>,
221                                                      SDTCisPtrTy<1>]>,
222                                 [SDNPHasChain, SDNPSideEffect]>;
223 def X86eh_sjlj_longjmp : SDNode<"X86ISD::EH_SJLJ_LONGJMP",
224                                 SDTypeProfile<0, 1, [SDTCisPtrTy<0>]>,
225                                 [SDNPHasChain, SDNPSideEffect]>;
226
227 def X86tcret : SDNode<"X86ISD::TC_RETURN", SDT_X86TCRET,
228                         [SDNPHasChain,  SDNPOptInGlue, SDNPVariadic]>;
229
230 def X86add_flag  : SDNode<"X86ISD::ADD",  SDTBinaryArithWithFlags,
231                           [SDNPCommutative]>;
232 def X86sub_flag  : SDNode<"X86ISD::SUB",  SDTBinaryArithWithFlags>;
233 def X86smul_flag : SDNode<"X86ISD::SMUL", SDTBinaryArithWithFlags,
234                           [SDNPCommutative]>;
235 def X86umul_flag : SDNode<"X86ISD::UMUL", SDT2ResultBinaryArithWithFlags,
236                           [SDNPCommutative]>;
237 def X86adc_flag  : SDNode<"X86ISD::ADC",  SDTBinaryArithWithFlagsInOut>;
238 def X86sbb_flag  : SDNode<"X86ISD::SBB",  SDTBinaryArithWithFlagsInOut>;
239
240 def X86inc_flag  : SDNode<"X86ISD::INC",  SDTUnaryArithWithFlags>;
241 def X86dec_flag  : SDNode<"X86ISD::DEC",  SDTUnaryArithWithFlags>;
242 def X86or_flag   : SDNode<"X86ISD::OR",   SDTBinaryArithWithFlags,
243                           [SDNPCommutative]>;
244 def X86xor_flag  : SDNode<"X86ISD::XOR",  SDTBinaryArithWithFlags,
245                           [SDNPCommutative]>;
246 def X86and_flag  : SDNode<"X86ISD::AND",  SDTBinaryArithWithFlags,
247                           [SDNPCommutative]>;
248 def X86andn_flag : SDNode<"X86ISD::ANDN", SDTBinaryArithWithFlags>;
249
250 def X86blsi   : SDNode<"X86ISD::BLSI",   SDTIntUnaryOp>;
251 def X86blsmsk : SDNode<"X86ISD::BLSMSK", SDTIntUnaryOp>;
252 def X86blsr   : SDNode<"X86ISD::BLSR",   SDTIntUnaryOp>;
253
254 def X86mul_imm : SDNode<"X86ISD::MUL_IMM", SDTIntBinOp>;
255
256 def X86WinAlloca : SDNode<"X86ISD::WIN_ALLOCA", SDTX86Void,
257                           [SDNPHasChain, SDNPInGlue, SDNPOutGlue]>;
258
259 def X86SegAlloca : SDNode<"X86ISD::SEG_ALLOCA", SDT_X86SEG_ALLOCA,
260                           [SDNPHasChain]>;
261
262 def X86TLSCall : SDNode<"X86ISD::TLSCALL", SDT_X86TLSCALL,
263                         [SDNPHasChain, SDNPOptInGlue, SDNPOutGlue]>;
264
265 def X86WinFTOL : SDNode<"X86ISD::WIN_FTOL", SDT_X86WIN_FTOL,
266                         [SDNPHasChain, SDNPOutGlue]>;
267
268 //===----------------------------------------------------------------------===//
269 // X86 Operand Definitions.
270 //
271
272 // A version of ptr_rc which excludes SP, ESP, and RSP. This is used for
273 // the index operand of an address, to conform to x86 encoding restrictions.
274 def ptr_rc_nosp : PointerLikeRegClass<1>;
275
276 // *mem - Operand definitions for the funky X86 addressing mode operands.
277 //
278 def X86MemAsmOperand : AsmOperandClass { 
279  let Name = "Mem"; let PredicateMethod = "isMem"; 
280 }
281 def X86Mem8AsmOperand : AsmOperandClass { 
282   let Name = "Mem8"; let PredicateMethod = "isMem8";
283 }
284 def X86Mem16AsmOperand : AsmOperandClass { 
285   let Name = "Mem16"; let PredicateMethod = "isMem16";
286 }
287 def X86Mem32AsmOperand : AsmOperandClass { 
288   let Name = "Mem32"; let PredicateMethod = "isMem32";
289 }
290 def X86Mem64AsmOperand : AsmOperandClass { 
291   let Name = "Mem64"; let PredicateMethod = "isMem64";
292 }
293 def X86Mem80AsmOperand : AsmOperandClass { 
294   let Name = "Mem80"; let PredicateMethod = "isMem80";
295 }
296 def X86Mem128AsmOperand : AsmOperandClass { 
297   let Name = "Mem128"; let PredicateMethod = "isMem128";
298 }
299 def X86Mem256AsmOperand : AsmOperandClass { 
300   let Name = "Mem256"; let PredicateMethod = "isMem256";
301 }
302
303 // Gather mem operands
304 def X86MemVX32Operand : AsmOperandClass {
305   let Name = "MemVX32"; let PredicateMethod = "isMemVX32";
306 }
307 def X86MemVY32Operand : AsmOperandClass {
308   let Name = "MemVY32"; let PredicateMethod = "isMemVY32";
309 }
310 def X86MemVX64Operand : AsmOperandClass {
311   let Name = "MemVX64"; let PredicateMethod = "isMemVX64";
312 }
313 def X86MemVY64Operand : AsmOperandClass {
314   let Name = "MemVY64"; let PredicateMethod = "isMemVY64";
315 }
316
317 def X86AbsMemAsmOperand : AsmOperandClass {
318   let Name = "AbsMem";
319   let SuperClasses = [X86MemAsmOperand];
320 }
321 class X86MemOperand<string printMethod> : Operand<iPTR> {
322   let PrintMethod = printMethod;
323   let MIOperandInfo = (ops ptr_rc, i8imm, ptr_rc_nosp, i32imm, i8imm);
324   let ParserMatchClass = X86MemAsmOperand;
325 }
326
327 let OperandType = "OPERAND_MEMORY" in {
328 def opaque32mem : X86MemOperand<"printopaquemem">;
329 def opaque48mem : X86MemOperand<"printopaquemem">;
330 def opaque80mem : X86MemOperand<"printopaquemem">;
331 def opaque512mem : X86MemOperand<"printopaquemem">;
332
333 def i8mem   : X86MemOperand<"printi8mem"> { 
334   let ParserMatchClass = X86Mem8AsmOperand; }
335 def i16mem  : X86MemOperand<"printi16mem"> { 
336   let ParserMatchClass = X86Mem16AsmOperand; }
337 def i32mem  : X86MemOperand<"printi32mem"> { 
338   let ParserMatchClass = X86Mem32AsmOperand; }
339 def i64mem  : X86MemOperand<"printi64mem"> { 
340   let ParserMatchClass = X86Mem64AsmOperand; }
341 def i128mem : X86MemOperand<"printi128mem"> { 
342   let ParserMatchClass = X86Mem128AsmOperand; }
343 def i256mem : X86MemOperand<"printi256mem"> { 
344   let ParserMatchClass = X86Mem256AsmOperand; }
345 def f32mem  : X86MemOperand<"printf32mem"> { 
346   let ParserMatchClass = X86Mem32AsmOperand; }
347 def f64mem  : X86MemOperand<"printf64mem"> { 
348   let ParserMatchClass = X86Mem64AsmOperand; }
349 def f80mem  : X86MemOperand<"printf80mem"> { 
350   let ParserMatchClass = X86Mem80AsmOperand; }
351 def f128mem : X86MemOperand<"printf128mem"> { 
352   let ParserMatchClass = X86Mem128AsmOperand; }
353 def f256mem : X86MemOperand<"printf256mem">{ 
354   let ParserMatchClass = X86Mem256AsmOperand; }
355
356 // Gather mem operands
357 def vx32mem : X86MemOperand<"printi32mem">{
358   let MIOperandInfo = (ops ptr_rc, i8imm, VR128, i32imm, i8imm);
359   let ParserMatchClass = X86MemVX32Operand; }
360 def vy32mem : X86MemOperand<"printi32mem">{
361   let MIOperandInfo = (ops ptr_rc, i8imm, VR256, i32imm, i8imm);
362   let ParserMatchClass = X86MemVY32Operand; }
363 def vx64mem : X86MemOperand<"printi64mem">{
364   let MIOperandInfo = (ops ptr_rc, i8imm, VR128, i32imm, i8imm);
365   let ParserMatchClass = X86MemVX64Operand; }
366 def vy64mem : X86MemOperand<"printi64mem">{
367   let MIOperandInfo = (ops ptr_rc, i8imm, VR256, i32imm, i8imm);
368   let ParserMatchClass = X86MemVY64Operand; }
369 }
370
371 // A version of i8mem for use on x86-64 that uses GR64_NOREX instead of
372 // plain GR64, so that it doesn't potentially require a REX prefix.
373 def i8mem_NOREX : Operand<i64> {
374   let PrintMethod = "printi8mem";
375   let MIOperandInfo = (ops GR64_NOREX, i8imm, GR64_NOREX_NOSP, i32imm, i8imm);
376   let ParserMatchClass = X86Mem8AsmOperand;
377   let OperandType = "OPERAND_MEMORY";
378 }
379
380 // GPRs available for tailcall.
381 // It represents GR32_TC, GR64_TC or GR64_TCW64.
382 def ptr_rc_tailcall : PointerLikeRegClass<2>;
383
384 // Special i32mem for addresses of load folding tail calls. These are not
385 // allowed to use callee-saved registers since they must be scheduled
386 // after callee-saved register are popped.
387 def i32mem_TC : Operand<i32> {
388   let PrintMethod = "printi32mem";
389   let MIOperandInfo = (ops ptr_rc_tailcall, i8imm, ptr_rc_tailcall,
390                        i32imm, i8imm);
391   let ParserMatchClass = X86Mem32AsmOperand;
392   let OperandType = "OPERAND_MEMORY";
393 }
394
395 // Special i64mem for addresses of load folding tail calls. These are not
396 // allowed to use callee-saved registers since they must be scheduled
397 // after callee-saved register are popped.
398 def i64mem_TC : Operand<i64> {
399   let PrintMethod = "printi64mem";
400   let MIOperandInfo = (ops ptr_rc_tailcall, i8imm,
401                        ptr_rc_tailcall, i32imm, i8imm);
402   let ParserMatchClass = X86Mem64AsmOperand;
403   let OperandType = "OPERAND_MEMORY";
404 }
405
406 let OperandType = "OPERAND_PCREL",
407     ParserMatchClass = X86AbsMemAsmOperand,
408     PrintMethod = "printPCRelImm" in {
409 def i32imm_pcrel : Operand<i32>;
410 def i16imm_pcrel : Operand<i16>;
411
412 def offset8 : Operand<i64>;
413 def offset16 : Operand<i64>;
414 def offset32 : Operand<i64>;
415 def offset64 : Operand<i64>;
416
417 // Branch targets have OtherVT type and print as pc-relative values.
418 def brtarget : Operand<OtherVT>;
419 def brtarget8 : Operand<OtherVT>;
420
421 }
422
423 def SSECC : Operand<i8> {
424   let PrintMethod = "printSSECC";
425   let OperandType = "OPERAND_IMMEDIATE";
426 }
427
428 def AVXCC : Operand<i8> {
429   let PrintMethod = "printAVXCC";
430   let OperandType = "OPERAND_IMMEDIATE";
431 }
432
433 class ImmSExtAsmOperandClass : AsmOperandClass {
434   let SuperClasses = [ImmAsmOperand];
435   let RenderMethod = "addImmOperands";
436 }
437
438 class ImmZExtAsmOperandClass : AsmOperandClass {
439   let SuperClasses = [ImmAsmOperand];
440   let RenderMethod = "addImmOperands";
441 }
442
443 // Sign-extended immediate classes. We don't need to define the full lattice
444 // here because there is no instruction with an ambiguity between ImmSExti64i32
445 // and ImmSExti32i8.
446 //
447 // The strange ranges come from the fact that the assembler always works with
448 // 64-bit immediates, but for a 16-bit target value we want to accept both "-1"
449 // (which will be a -1ULL), and "0xFF" (-1 in 16-bits).
450
451 // [0, 0x7FFFFFFF]                                            |
452 //   [0xFFFFFFFF80000000, 0xFFFFFFFFFFFFFFFF]
453 def ImmSExti64i32AsmOperand : ImmSExtAsmOperandClass {
454   let Name = "ImmSExti64i32";
455 }
456
457 // [0, 0x0000007F] | [0x000000000000FF80, 0x000000000000FFFF] |
458 //   [0xFFFFFFFFFFFFFF80, 0xFFFFFFFFFFFFFFFF]
459 def ImmSExti16i8AsmOperand : ImmSExtAsmOperandClass {
460   let Name = "ImmSExti16i8";
461   let SuperClasses = [ImmSExti64i32AsmOperand];
462 }
463
464 // [0, 0x0000007F] | [0x00000000FFFFFF80, 0x00000000FFFFFFFF] |
465 //   [0xFFFFFFFFFFFFFF80, 0xFFFFFFFFFFFFFFFF]
466 def ImmSExti32i8AsmOperand : ImmSExtAsmOperandClass {
467   let Name = "ImmSExti32i8";
468 }
469
470 // [0, 0x000000FF]
471 def ImmZExtu32u8AsmOperand : ImmZExtAsmOperandClass {
472   let Name = "ImmZExtu32u8";
473 }
474
475
476 // [0, 0x0000007F]                                            |
477 //   [0xFFFFFFFFFFFFFF80, 0xFFFFFFFFFFFFFFFF]
478 def ImmSExti64i8AsmOperand : ImmSExtAsmOperandClass {
479   let Name = "ImmSExti64i8";
480   let SuperClasses = [ImmSExti16i8AsmOperand, ImmSExti32i8AsmOperand,
481                       ImmSExti64i32AsmOperand];
482 }
483
484 // A couple of more descriptive operand definitions.
485 // 16-bits but only 8 bits are significant.
486 def i16i8imm  : Operand<i16> {
487   let ParserMatchClass = ImmSExti16i8AsmOperand;
488   let OperandType = "OPERAND_IMMEDIATE";
489 }
490 // 32-bits but only 8 bits are significant.
491 def i32i8imm  : Operand<i32> {
492   let ParserMatchClass = ImmSExti32i8AsmOperand;
493   let OperandType = "OPERAND_IMMEDIATE";
494 }
495 // 32-bits but only 8 bits are significant, and those 8 bits are unsigned.
496 def u32u8imm  : Operand<i32> {
497   let ParserMatchClass = ImmZExtu32u8AsmOperand;
498   let OperandType = "OPERAND_IMMEDIATE";
499 }
500
501 // 64-bits but only 32 bits are significant.
502 def i64i32imm  : Operand<i64> {
503   let ParserMatchClass = ImmSExti64i32AsmOperand;
504   let OperandType = "OPERAND_IMMEDIATE";
505 }
506
507 // 64-bits but only 32 bits are significant, and those bits are treated as being
508 // pc relative.
509 def i64i32imm_pcrel : Operand<i64> {
510   let PrintMethod = "printPCRelImm";
511   let ParserMatchClass = X86AbsMemAsmOperand;
512   let OperandType = "OPERAND_PCREL";
513 }
514
515 // 64-bits but only 8 bits are significant.
516 def i64i8imm   : Operand<i64> {
517   let ParserMatchClass = ImmSExti64i8AsmOperand;
518   let OperandType = "OPERAND_IMMEDIATE";
519 }
520
521 def lea64_32mem : Operand<i32> {
522   let PrintMethod = "printi32mem";
523   let AsmOperandLowerMethod = "lower_lea64_32mem";
524   let MIOperandInfo = (ops GR32, i8imm, GR32_NOSP, i32imm, i8imm);
525   let ParserMatchClass = X86MemAsmOperand;
526 }
527
528 // Memory operands that use 64-bit pointers in both ILP32 and LP64.
529 def lea64mem : Operand<i64> {
530   let PrintMethod = "printi64mem";
531   let MIOperandInfo = (ops GR64, i8imm, GR64_NOSP, i32imm, i8imm);
532   let ParserMatchClass = X86MemAsmOperand;
533 }
534
535
536 //===----------------------------------------------------------------------===//
537 // X86 Complex Pattern Definitions.
538 //
539
540 // Define X86 specific addressing mode.
541 def addr      : ComplexPattern<iPTR, 5, "SelectAddr", [], [SDNPWantParent]>;
542 def lea32addr : ComplexPattern<i32, 5, "SelectLEAAddr",
543                                [add, sub, mul, X86mul_imm, shl, or, frameindex],
544                                []>;
545 // In 64-bit mode 32-bit LEAs can use RIP-relative addressing.
546 def lea64_32addr : ComplexPattern<i32, 5, "SelectLEAAddr",
547                                   [add, sub, mul, X86mul_imm, shl, or,
548                                    frameindex, X86WrapperRIP],
549                                   []>;
550
551 def tls32addr : ComplexPattern<i32, 5, "SelectTLSADDRAddr",
552                                [tglobaltlsaddr], []>;
553
554 def tls32baseaddr : ComplexPattern<i32, 5, "SelectTLSADDRAddr",
555                                [tglobaltlsaddr], []>;
556
557 def lea64addr : ComplexPattern<i64, 5, "SelectLEAAddr",
558                         [add, sub, mul, X86mul_imm, shl, or, frameindex,
559                          X86WrapperRIP], []>;
560
561 def tls64addr : ComplexPattern<i64, 5, "SelectTLSADDRAddr",
562                                [tglobaltlsaddr], []>;
563
564 def tls64baseaddr : ComplexPattern<i64, 5, "SelectTLSADDRAddr",
565                                [tglobaltlsaddr], []>;
566
567 //===----------------------------------------------------------------------===//
568 // X86 Instruction Predicate Definitions.
569 def HasCMov      : Predicate<"Subtarget->hasCMov()">;
570 def NoCMov       : Predicate<"!Subtarget->hasCMov()">;
571
572 def HasMMX       : Predicate<"Subtarget->hasMMX()">;
573 def Has3DNow     : Predicate<"Subtarget->has3DNow()">;
574 def Has3DNowA    : Predicate<"Subtarget->has3DNowA()">;
575 def HasSSE1      : Predicate<"Subtarget->hasSSE1()">;
576 def UseSSE1      : Predicate<"Subtarget->hasSSE1() && !Subtarget->hasAVX()">;
577 def HasSSE2      : Predicate<"Subtarget->hasSSE2()">;
578 def UseSSE2      : Predicate<"Subtarget->hasSSE2() && !Subtarget->hasAVX()">;
579 def HasSSE3      : Predicate<"Subtarget->hasSSE3()">;
580 def UseSSE3      : Predicate<"Subtarget->hasSSE3() && !Subtarget->hasAVX()">;
581 def HasSSSE3     : Predicate<"Subtarget->hasSSSE3()">;
582 def UseSSSE3     : Predicate<"Subtarget->hasSSSE3() && !Subtarget->hasAVX()">;
583 def HasSSE41     : Predicate<"Subtarget->hasSSE41()">;
584 def UseSSE41     : Predicate<"Subtarget->hasSSE41() && !Subtarget->hasAVX()">;
585 def HasSSE42     : Predicate<"Subtarget->hasSSE42()">;
586 def UseSSE42     : Predicate<"Subtarget->hasSSE42() && !Subtarget->hasAVX()">;
587 def HasSSE4A     : Predicate<"Subtarget->hasSSE4A()">;
588 def HasAVX       : Predicate<"Subtarget->hasAVX()">;
589 def HasAVX2      : Predicate<"Subtarget->hasAVX2()">;
590 def HasAVX1Only  : Predicate<"Subtarget->hasAVX() && !Subtarget->hasAVX2()">;
591
592 def HasPOPCNT    : Predicate<"Subtarget->hasPOPCNT()">;
593 def HasAES       : Predicate<"Subtarget->hasAES()">;
594 def HasPCLMUL    : Predicate<"Subtarget->hasPCLMUL()">;
595 def HasFMA       : Predicate<"Subtarget->hasFMA()">;
596 def HasFMA4      : Predicate<"Subtarget->hasFMA4()">;
597 def HasXOP       : Predicate<"Subtarget->hasXOP()">;
598 def HasMOVBE     : Predicate<"Subtarget->hasMOVBE()">;
599 def HasRDRAND    : Predicate<"Subtarget->hasRDRAND()">;
600 def HasF16C      : Predicate<"Subtarget->hasF16C()">;
601 def HasFSGSBase  : Predicate<"Subtarget->hasFSGSBase()">;
602 def HasLZCNT     : Predicate<"Subtarget->hasLZCNT()">;
603 def HasBMI       : Predicate<"Subtarget->hasBMI()">;
604 def HasBMI2      : Predicate<"Subtarget->hasBMI2()">;
605 def HasRTM       : Predicate<"Subtarget->hasRTM()">;
606 def HasADX       : Predicate<"Subtarget->hasADX()">;
607 def HasPRFCHW    : Predicate<"Subtarget->hasPRFCHW()">;
608 def HasPrefetchW : Predicate<"Subtarget->has3DNow() || Subtarget->hasPRFCHW()">;
609 def FPStackf32   : Predicate<"!Subtarget->hasSSE1()">;
610 def FPStackf64   : Predicate<"!Subtarget->hasSSE2()">;
611 def HasCmpxchg16b: Predicate<"Subtarget->hasCmpxchg16b()">;
612 def In32BitMode  : Predicate<"!Subtarget->is64Bit()">,
613                              AssemblerPredicate<"!Mode64Bit", "32-bit mode">;
614 def In64BitMode  : Predicate<"Subtarget->is64Bit()">,
615                              AssemblerPredicate<"Mode64Bit", "64-bit mode">;
616 def IsWin64      : Predicate<"Subtarget->isTargetWin64()">;
617 def IsNaCl       : Predicate<"Subtarget->isTargetNaCl()">;
618 def NotNaCl      : Predicate<"!Subtarget->isTargetNaCl()">;
619 def SmallCode    : Predicate<"TM.getCodeModel() == CodeModel::Small">;
620 def KernelCode   : Predicate<"TM.getCodeModel() == CodeModel::Kernel">;
621 def FarData      : Predicate<"TM.getCodeModel() != CodeModel::Small &&"
622                              "TM.getCodeModel() != CodeModel::Kernel">;
623 def NearData     : Predicate<"TM.getCodeModel() == CodeModel::Small ||"
624                              "TM.getCodeModel() == CodeModel::Kernel">;
625 def IsStatic     : Predicate<"TM.getRelocationModel() == Reloc::Static">;
626 def IsNotPIC     : Predicate<"TM.getRelocationModel() != Reloc::PIC_">;
627 def OptForSize   : Predicate<"OptForSize">;
628 def OptForSpeed  : Predicate<"!OptForSize">;
629 def FastBTMem    : Predicate<"!Subtarget->isBTMemSlow()">;
630 def CallImmAddr  : Predicate<"Subtarget->IsLegalToCallImmediateAddr(TM)">;
631
632 //===----------------------------------------------------------------------===//
633 // X86 Instruction Format Definitions.
634 //
635
636 include "X86InstrFormats.td"
637
638 //===----------------------------------------------------------------------===//
639 // Pattern fragments.
640 //
641
642 // X86 specific condition code. These correspond to CondCode in
643 // X86InstrInfo.h. They must be kept in synch.
644 def X86_COND_A   : PatLeaf<(i8 0)>;  // alt. COND_NBE
645 def X86_COND_AE  : PatLeaf<(i8 1)>;  // alt. COND_NC
646 def X86_COND_B   : PatLeaf<(i8 2)>;  // alt. COND_C
647 def X86_COND_BE  : PatLeaf<(i8 3)>;  // alt. COND_NA
648 def X86_COND_E   : PatLeaf<(i8 4)>;  // alt. COND_Z
649 def X86_COND_G   : PatLeaf<(i8 5)>;  // alt. COND_NLE
650 def X86_COND_GE  : PatLeaf<(i8 6)>;  // alt. COND_NL
651 def X86_COND_L   : PatLeaf<(i8 7)>;  // alt. COND_NGE
652 def X86_COND_LE  : PatLeaf<(i8 8)>;  // alt. COND_NG
653 def X86_COND_NE  : PatLeaf<(i8 9)>;  // alt. COND_NZ
654 def X86_COND_NO  : PatLeaf<(i8 10)>;
655 def X86_COND_NP  : PatLeaf<(i8 11)>; // alt. COND_PO
656 def X86_COND_NS  : PatLeaf<(i8 12)>;
657 def X86_COND_O   : PatLeaf<(i8 13)>;
658 def X86_COND_P   : PatLeaf<(i8 14)>; // alt. COND_PE
659 def X86_COND_S   : PatLeaf<(i8 15)>;
660
661 let FastIselShouldIgnore = 1 in { // FastIsel should ignore all simm8 instrs.
662   def i16immSExt8  : ImmLeaf<i16, [{ return Imm == (int8_t)Imm; }]>;
663   def i32immSExt8  : ImmLeaf<i32, [{ return Imm == (int8_t)Imm; }]>;
664   def i64immSExt8  : ImmLeaf<i64, [{ return Imm == (int8_t)Imm; }]>;
665 }
666
667 def i64immSExt32 : ImmLeaf<i64, [{ return Imm == (int32_t)Imm; }]>;
668
669
670 // i64immZExt32 predicate - True if the 64-bit immediate fits in a 32-bit
671 // unsigned field.
672 def i64immZExt32 : ImmLeaf<i64, [{ return (uint64_t)Imm == (uint32_t)Imm; }]>;
673
674 def i64immZExt32SExt8 : ImmLeaf<i64, [{
675   return (uint64_t)Imm == (uint32_t)Imm && (int32_t)Imm == (int8_t)Imm;
676 }]>;
677
678 // Helper fragments for loads.
679 // It's always safe to treat a anyext i16 load as a i32 load if the i16 is
680 // known to be 32-bit aligned or better. Ditto for i8 to i16.
681 def loadi16 : PatFrag<(ops node:$ptr), (i16 (unindexedload node:$ptr)), [{
682   LoadSDNode *LD = cast<LoadSDNode>(N);
683   ISD::LoadExtType ExtType = LD->getExtensionType();
684   if (ExtType == ISD::NON_EXTLOAD)
685     return true;
686   if (ExtType == ISD::EXTLOAD)
687     return LD->getAlignment() >= 2 && !LD->isVolatile();
688   return false;
689 }]>;
690
691 def loadi16_anyext : PatFrag<(ops node:$ptr), (i32 (unindexedload node:$ptr)),[{
692   LoadSDNode *LD = cast<LoadSDNode>(N);
693   ISD::LoadExtType ExtType = LD->getExtensionType();
694   if (ExtType == ISD::EXTLOAD)
695     return LD->getAlignment() >= 2 && !LD->isVolatile();
696   return false;
697 }]>;
698
699 def loadi32 : PatFrag<(ops node:$ptr), (i32 (unindexedload node:$ptr)), [{
700   LoadSDNode *LD = cast<LoadSDNode>(N);
701   ISD::LoadExtType ExtType = LD->getExtensionType();
702   if (ExtType == ISD::NON_EXTLOAD)
703     return true;
704   if (ExtType == ISD::EXTLOAD)
705     return LD->getAlignment() >= 4 && !LD->isVolatile();
706   return false;
707 }]>;
708
709 def loadi8  : PatFrag<(ops node:$ptr), (i8  (load node:$ptr))>;
710 def loadi64 : PatFrag<(ops node:$ptr), (i64 (load node:$ptr))>;
711 def loadf32 : PatFrag<(ops node:$ptr), (f32 (load node:$ptr))>;
712 def loadf64 : PatFrag<(ops node:$ptr), (f64 (load node:$ptr))>;
713 def loadf80 : PatFrag<(ops node:$ptr), (f80 (load node:$ptr))>;
714
715 def sextloadi16i8  : PatFrag<(ops node:$ptr), (i16 (sextloadi8 node:$ptr))>;
716 def sextloadi32i8  : PatFrag<(ops node:$ptr), (i32 (sextloadi8 node:$ptr))>;
717 def sextloadi32i16 : PatFrag<(ops node:$ptr), (i32 (sextloadi16 node:$ptr))>;
718 def sextloadi64i8  : PatFrag<(ops node:$ptr), (i64 (sextloadi8 node:$ptr))>;
719 def sextloadi64i16 : PatFrag<(ops node:$ptr), (i64 (sextloadi16 node:$ptr))>;
720 def sextloadi64i32 : PatFrag<(ops node:$ptr), (i64 (sextloadi32 node:$ptr))>;
721
722 def zextloadi8i1   : PatFrag<(ops node:$ptr), (i8  (zextloadi1 node:$ptr))>;
723 def zextloadi16i1  : PatFrag<(ops node:$ptr), (i16 (zextloadi1 node:$ptr))>;
724 def zextloadi32i1  : PatFrag<(ops node:$ptr), (i32 (zextloadi1 node:$ptr))>;
725 def zextloadi16i8  : PatFrag<(ops node:$ptr), (i16 (zextloadi8 node:$ptr))>;
726 def zextloadi32i8  : PatFrag<(ops node:$ptr), (i32 (zextloadi8 node:$ptr))>;
727 def zextloadi32i16 : PatFrag<(ops node:$ptr), (i32 (zextloadi16 node:$ptr))>;
728 def zextloadi64i1  : PatFrag<(ops node:$ptr), (i64 (zextloadi1 node:$ptr))>;
729 def zextloadi64i8  : PatFrag<(ops node:$ptr), (i64 (zextloadi8 node:$ptr))>;
730 def zextloadi64i16 : PatFrag<(ops node:$ptr), (i64 (zextloadi16 node:$ptr))>;
731 def zextloadi64i32 : PatFrag<(ops node:$ptr), (i64 (zextloadi32 node:$ptr))>;
732
733 def extloadi8i1    : PatFrag<(ops node:$ptr), (i8  (extloadi1 node:$ptr))>;
734 def extloadi16i1   : PatFrag<(ops node:$ptr), (i16 (extloadi1 node:$ptr))>;
735 def extloadi32i1   : PatFrag<(ops node:$ptr), (i32 (extloadi1 node:$ptr))>;
736 def extloadi16i8   : PatFrag<(ops node:$ptr), (i16 (extloadi8 node:$ptr))>;
737 def extloadi32i8   : PatFrag<(ops node:$ptr), (i32 (extloadi8 node:$ptr))>;
738 def extloadi32i16  : PatFrag<(ops node:$ptr), (i32 (extloadi16 node:$ptr))>;
739 def extloadi64i1   : PatFrag<(ops node:$ptr), (i64 (extloadi1 node:$ptr))>;
740 def extloadi64i8   : PatFrag<(ops node:$ptr), (i64 (extloadi8 node:$ptr))>;
741 def extloadi64i16  : PatFrag<(ops node:$ptr), (i64 (extloadi16 node:$ptr))>;
742 def extloadi64i32  : PatFrag<(ops node:$ptr), (i64 (extloadi32 node:$ptr))>;
743
744
745 // An 'and' node with a single use.
746 def and_su : PatFrag<(ops node:$lhs, node:$rhs), (and node:$lhs, node:$rhs), [{
747   return N->hasOneUse();
748 }]>;
749 // An 'srl' node with a single use.
750 def srl_su : PatFrag<(ops node:$lhs, node:$rhs), (srl node:$lhs, node:$rhs), [{
751   return N->hasOneUse();
752 }]>;
753 // An 'trunc' node with a single use.
754 def trunc_su : PatFrag<(ops node:$src), (trunc node:$src), [{
755   return N->hasOneUse();
756 }]>;
757
758 //===----------------------------------------------------------------------===//
759 // Instruction list.
760 //
761
762 // Nop
763 let neverHasSideEffects = 1 in {
764   def NOOP : I<0x90, RawFrm, (outs), (ins), "nop", [], IIC_NOP>;
765   def NOOPW : I<0x1f, MRM0m, (outs), (ins i16mem:$zero),
766                 "nop{w}\t$zero", [], IIC_NOP>, TB, OpSize;
767   def NOOPL : I<0x1f, MRM0m, (outs), (ins i32mem:$zero),
768                 "nop{l}\t$zero", [], IIC_NOP>, TB;
769 }
770
771
772 // Constructing a stack frame.
773 def ENTER : Ii16<0xC8, RawFrmImm8, (outs), (ins i16imm:$len, i8imm:$lvl),
774                  "enter\t$len, $lvl", [], IIC_ENTER>;
775
776 let Defs = [EBP, ESP], Uses = [EBP, ESP], mayLoad = 1, neverHasSideEffects=1 in
777 def LEAVE    : I<0xC9, RawFrm,
778                  (outs), (ins), "leave", [], IIC_LEAVE>,
779                  Requires<[In32BitMode]>;
780
781 let Defs = [RBP,RSP], Uses = [RBP,RSP], mayLoad = 1, neverHasSideEffects = 1 in
782 def LEAVE64  : I<0xC9, RawFrm,
783                  (outs), (ins), "leave", [], IIC_LEAVE>,
784                  Requires<[In64BitMode]>;
785
786 //===----------------------------------------------------------------------===//
787 //  Miscellaneous Instructions.
788 //
789
790 let Defs = [ESP], Uses = [ESP], neverHasSideEffects=1 in {
791 let mayLoad = 1, SchedRW = [WriteLoad] in {
792 def POP16r  : I<0x58, AddRegFrm, (outs GR16:$reg), (ins), "pop{w}\t$reg", [],
793                 IIC_POP_REG16>, OpSize;
794 def POP32r  : I<0x58, AddRegFrm, (outs GR32:$reg), (ins), "pop{l}\t$reg", [],
795                 IIC_POP_REG>;
796 def POP16rmr: I<0x8F, MRM0r, (outs GR16:$reg), (ins), "pop{w}\t$reg", [],
797                 IIC_POP_REG>, OpSize;
798 def POP16rmm: I<0x8F, MRM0m, (outs i16mem:$dst), (ins), "pop{w}\t$dst", [],
799                 IIC_POP_MEM>, OpSize;
800 def POP32rmr: I<0x8F, MRM0r, (outs GR32:$reg), (ins), "pop{l}\t$reg", [],
801                 IIC_POP_REG>;
802 def POP32rmm: I<0x8F, MRM0m, (outs i32mem:$dst), (ins), "pop{l}\t$dst", [],
803                 IIC_POP_MEM>;
804
805 def POPF16   : I<0x9D, RawFrm, (outs), (ins), "popf{w}", [], IIC_POP_F>, OpSize;
806 def POPF32   : I<0x9D, RawFrm, (outs), (ins), "popf{l|d}", [], IIC_POP_FD>,
807                Requires<[In32BitMode]>;
808 } // mayLoad, SchedRW
809
810 let mayStore = 1, SchedRW = [WriteStore] in {
811 def PUSH16r  : I<0x50, AddRegFrm, (outs), (ins GR16:$reg), "push{w}\t$reg",[],
812                  IIC_PUSH_REG>, OpSize;
813 def PUSH32r  : I<0x50, AddRegFrm, (outs), (ins GR32:$reg), "push{l}\t$reg",[],
814                  IIC_PUSH_REG>;
815 def PUSH16rmr: I<0xFF, MRM6r, (outs), (ins GR16:$reg), "push{w}\t$reg",[],
816                  IIC_PUSH_REG>, OpSize;
817 def PUSH16rmm: I<0xFF, MRM6m, (outs), (ins i16mem:$src), "push{w}\t$src",[],
818                  IIC_PUSH_MEM>,
819   OpSize;
820 def PUSH32rmr: I<0xFF, MRM6r, (outs), (ins GR32:$reg), "push{l}\t$reg",[],
821                  IIC_PUSH_REG>;
822 def PUSH32rmm: I<0xFF, MRM6m, (outs), (ins i32mem:$src), "push{l}\t$src",[],
823                  IIC_PUSH_MEM>;
824
825 def PUSHi8   : Ii8<0x6a, RawFrm, (outs), (ins i32i8imm:$imm),
826                       "push{l}\t$imm", [], IIC_PUSH_IMM>;
827 def PUSHi16  : Ii16<0x68, RawFrm, (outs), (ins i16imm:$imm),
828                       "push{w}\t$imm", [], IIC_PUSH_IMM>, OpSize;
829 def PUSHi32  : Ii32<0x68, RawFrm, (outs), (ins i32imm:$imm),
830                       "push{l}\t$imm", [], IIC_PUSH_IMM>;
831
832 def PUSHF16  : I<0x9C, RawFrm, (outs), (ins), "pushf{w}", [], IIC_PUSH_F>,
833                  OpSize;
834 def PUSHF32  : I<0x9C, RawFrm, (outs), (ins), "pushf{l|d}", [], IIC_PUSH_F>,
835                Requires<[In32BitMode]>;
836
837 } // mayStore, SchedRW
838 }
839
840 let Defs = [RSP], Uses = [RSP], neverHasSideEffects=1 in {
841 let mayLoad = 1, SchedRW = [WriteLoad] in {
842 def POP64r   : I<0x58, AddRegFrm,
843                  (outs GR64:$reg), (ins), "pop{q}\t$reg", [], IIC_POP_REG>;
844 def POP64rmr: I<0x8F, MRM0r, (outs GR64:$reg), (ins), "pop{q}\t$reg", [],
845                 IIC_POP_REG>;
846 def POP64rmm: I<0x8F, MRM0m, (outs i64mem:$dst), (ins), "pop{q}\t$dst", [],
847                 IIC_POP_MEM>;
848 } // mayLoad, SchedRW
849 let mayStore = 1, SchedRW = [WriteStore] in {
850 def PUSH64r  : I<0x50, AddRegFrm,
851                  (outs), (ins GR64:$reg), "push{q}\t$reg", [], IIC_PUSH_REG>;
852 def PUSH64rmr: I<0xFF, MRM6r, (outs), (ins GR64:$reg), "push{q}\t$reg", [],
853                  IIC_PUSH_REG>;
854 def PUSH64rmm: I<0xFF, MRM6m, (outs), (ins i64mem:$src), "push{q}\t$src", [],
855                  IIC_PUSH_MEM>;
856 } // mayStore, SchedRW
857 }
858
859 let Defs = [RSP], Uses = [RSP], neverHasSideEffects = 1, mayStore = 1,
860     SchedRW = [WriteStore] in {
861 def PUSH64i8   : Ii8<0x6a, RawFrm, (outs), (ins i64i8imm:$imm),
862                      "push{q}\t$imm", [], IIC_PUSH_IMM>;
863 def PUSH64i16  : Ii16<0x68, RawFrm, (outs), (ins i16imm:$imm),
864                       "push{q}\t$imm", [], IIC_PUSH_IMM>;
865 def PUSH64i32  : Ii32<0x68, RawFrm, (outs), (ins i64i32imm:$imm),
866                       "push{q}\t$imm", [], IIC_PUSH_IMM>;
867 }
868
869 let Defs = [RSP, EFLAGS], Uses = [RSP], mayLoad = 1, neverHasSideEffects=1 in
870 def POPF64   : I<0x9D, RawFrm, (outs), (ins), "popfq", [], IIC_POP_FD>,
871                Requires<[In64BitMode]>;
872 let Defs = [RSP], Uses = [RSP, EFLAGS], mayStore = 1, neverHasSideEffects=1 in
873 def PUSHF64    : I<0x9C, RawFrm, (outs), (ins), "pushfq", [], IIC_PUSH_F>,
874                  Requires<[In64BitMode]>;
875
876 let Defs = [EDI, ESI, EBP, EBX, EDX, ECX, EAX, ESP], Uses = [ESP],
877     mayLoad = 1, neverHasSideEffects = 1, SchedRW = [WriteLoad] in {
878 def POPA32   : I<0x61, RawFrm, (outs), (ins), "popa{l|d}", [], IIC_POP_A>,
879                Requires<[In32BitMode]>;
880 }
881 let Defs = [ESP], Uses = [EDI, ESI, EBP, EBX, EDX, ECX, EAX, ESP],
882     mayStore = 1, neverHasSideEffects = 1, SchedRW = [WriteStore] in {
883 def PUSHA32  : I<0x60, RawFrm, (outs), (ins), "pusha{l|d}", [], IIC_PUSH_A>,
884                Requires<[In32BitMode]>;
885 }
886
887 let Constraints = "$src = $dst", SchedRW = [WriteALU] in {
888 // GR32 = bswap GR32
889 def BSWAP32r : I<0xC8, AddRegFrm,
890                  (outs GR32:$dst), (ins GR32:$src),
891                  "bswap{l}\t$dst",
892                  [(set GR32:$dst, (bswap GR32:$src))], IIC_BSWAP>, TB;
893
894 def BSWAP64r : RI<0xC8, AddRegFrm, (outs GR64:$dst), (ins GR64:$src),
895                   "bswap{q}\t$dst",
896                   [(set GR64:$dst, (bswap GR64:$src))], IIC_BSWAP>, TB;
897 } // Constraints = "$src = $dst", SchedRW
898
899 // Bit scan instructions.
900 let Defs = [EFLAGS] in {
901 def BSF16rr  : I<0xBC, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
902                  "bsf{w}\t{$src, $dst|$dst, $src}",
903                  [(set GR16:$dst, EFLAGS, (X86bsf GR16:$src))],
904                   IIC_BSF>, TB, OpSize;
905 def BSF16rm  : I<0xBC, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
906                  "bsf{w}\t{$src, $dst|$dst, $src}",
907                  [(set GR16:$dst, EFLAGS, (X86bsf (loadi16 addr:$src)))],
908                   IIC_BSF>, TB, OpSize;
909 def BSF32rr  : I<0xBC, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
910                  "bsf{l}\t{$src, $dst|$dst, $src}",
911                  [(set GR32:$dst, EFLAGS, (X86bsf GR32:$src))], IIC_BSF>, TB;
912 def BSF32rm  : I<0xBC, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
913                  "bsf{l}\t{$src, $dst|$dst, $src}",
914                  [(set GR32:$dst, EFLAGS, (X86bsf (loadi32 addr:$src)))],
915                  IIC_BSF>, TB;
916 def BSF64rr  : RI<0xBC, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
917                   "bsf{q}\t{$src, $dst|$dst, $src}",
918                   [(set GR64:$dst, EFLAGS, (X86bsf GR64:$src))],
919                   IIC_BSF>, TB;
920 def BSF64rm  : RI<0xBC, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
921                   "bsf{q}\t{$src, $dst|$dst, $src}",
922                   [(set GR64:$dst, EFLAGS, (X86bsf (loadi64 addr:$src)))],
923                   IIC_BSF>, TB;
924
925 def BSR16rr  : I<0xBD, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
926                  "bsr{w}\t{$src, $dst|$dst, $src}",
927                  [(set GR16:$dst, EFLAGS, (X86bsr GR16:$src))], IIC_BSR>,
928                  TB, OpSize;
929 def BSR16rm  : I<0xBD, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
930                  "bsr{w}\t{$src, $dst|$dst, $src}",
931                  [(set GR16:$dst, EFLAGS, (X86bsr (loadi16 addr:$src)))],
932                  IIC_BSR>, TB,
933                  OpSize;
934 def BSR32rr  : I<0xBD, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
935                  "bsr{l}\t{$src, $dst|$dst, $src}",
936                  [(set GR32:$dst, EFLAGS, (X86bsr GR32:$src))], IIC_BSR>, TB;
937 def BSR32rm  : I<0xBD, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
938                  "bsr{l}\t{$src, $dst|$dst, $src}",
939                  [(set GR32:$dst, EFLAGS, (X86bsr (loadi32 addr:$src)))],
940                  IIC_BSR>, TB;
941 def BSR64rr  : RI<0xBD, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
942                   "bsr{q}\t{$src, $dst|$dst, $src}",
943                   [(set GR64:$dst, EFLAGS, (X86bsr GR64:$src))], IIC_BSR>, TB;
944 def BSR64rm  : RI<0xBD, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
945                   "bsr{q}\t{$src, $dst|$dst, $src}",
946                   [(set GR64:$dst, EFLAGS, (X86bsr (loadi64 addr:$src)))],
947                   IIC_BSR>, TB;
948 } // Defs = [EFLAGS]
949
950
951 // These uses the DF flag in the EFLAGS register to inc or dec EDI and ESI
952 let Defs = [EDI,ESI], Uses = [EDI,ESI,EFLAGS] in {
953 def MOVSB : I<0xA4, RawFrm, (outs), (ins), "movsb", [], IIC_MOVS>;
954 def MOVSW : I<0xA5, RawFrm, (outs), (ins), "movsw", [], IIC_MOVS>, OpSize;
955 def MOVSD : I<0xA5, RawFrm, (outs), (ins), "movs{l|d}", [], IIC_MOVS>;
956 def MOVSQ : RI<0xA5, RawFrm, (outs), (ins), "movsq", [], IIC_MOVS>;
957 }
958
959 // These uses the DF flag in the EFLAGS register to inc or dec EDI and ESI
960 let Defs = [EDI], Uses = [AL,EDI,EFLAGS] in
961 def STOSB : I<0xAA, RawFrm, (outs), (ins), "stosb", [], IIC_STOS>;
962 let Defs = [EDI], Uses = [AX,EDI,EFLAGS] in
963 def STOSW : I<0xAB, RawFrm, (outs), (ins), "stosw", [], IIC_STOS>, OpSize;
964 let Defs = [EDI], Uses = [EAX,EDI,EFLAGS] in
965 def STOSD : I<0xAB, RawFrm, (outs), (ins), "stos{l|d}", [], IIC_STOS>;
966 let Defs = [RCX,RDI], Uses = [RAX,RCX,RDI,EFLAGS] in
967 def STOSQ : RI<0xAB, RawFrm, (outs), (ins), "stosq", [], IIC_STOS>;
968
969 def SCAS8 : I<0xAE, RawFrm, (outs), (ins), "scasb", [], IIC_SCAS>;
970 def SCAS16 : I<0xAF, RawFrm, (outs), (ins), "scasw", [], IIC_SCAS>, OpSize;
971 def SCAS32 : I<0xAF, RawFrm, (outs), (ins), "scas{l|d}", [], IIC_SCAS>;
972 def SCAS64 : RI<0xAF, RawFrm, (outs), (ins), "scasq", [], IIC_SCAS>;
973
974 def CMPS8 : I<0xA6, RawFrm, (outs), (ins), "cmpsb", [], IIC_CMPS>;
975 def CMPS16 : I<0xA7, RawFrm, (outs), (ins), "cmpsw", [], IIC_CMPS>, OpSize;
976 def CMPS32 : I<0xA7, RawFrm, (outs), (ins), "cmps{l|d}", [], IIC_CMPS>;
977 def CMPS64 : RI<0xA7, RawFrm, (outs), (ins), "cmpsq", [], IIC_CMPS>;
978
979
980 //===----------------------------------------------------------------------===//
981 //  Move Instructions.
982 //
983 let SchedRW = [WriteMove] in {
984 let neverHasSideEffects = 1 in {
985 def MOV8rr  : I<0x88, MRMDestReg, (outs GR8 :$dst), (ins GR8 :$src),
986                 "mov{b}\t{$src, $dst|$dst, $src}", [], IIC_MOV>;
987 def MOV16rr : I<0x89, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
988                 "mov{w}\t{$src, $dst|$dst, $src}", [], IIC_MOV>, OpSize;
989 def MOV32rr : I<0x89, MRMDestReg, (outs GR32:$dst), (ins GR32:$src),
990                 "mov{l}\t{$src, $dst|$dst, $src}", [], IIC_MOV>;
991 def MOV64rr : RI<0x89, MRMDestReg, (outs GR64:$dst), (ins GR64:$src),
992                  "mov{q}\t{$src, $dst|$dst, $src}", [], IIC_MOV>;
993 }
994
995 let isReMaterializable = 1, isAsCheapAsAMove = 1 in {
996 def MOV8ri  : Ii8 <0xB0, AddRegFrm, (outs GR8 :$dst), (ins i8imm :$src),
997                    "mov{b}\t{$src, $dst|$dst, $src}",
998                    [(set GR8:$dst, imm:$src)], IIC_MOV>;
999 def MOV16ri : Ii16<0xB8, AddRegFrm, (outs GR16:$dst), (ins i16imm:$src),
1000                    "mov{w}\t{$src, $dst|$dst, $src}",
1001                    [(set GR16:$dst, imm:$src)], IIC_MOV>, OpSize;
1002 def MOV32ri : Ii32<0xB8, AddRegFrm, (outs GR32:$dst), (ins i32imm:$src),
1003                    "mov{l}\t{$src, $dst|$dst, $src}",
1004                    [(set GR32:$dst, imm:$src)], IIC_MOV>;
1005 def MOV64ri : RIi64<0xB8, AddRegFrm, (outs GR64:$dst), (ins i64imm:$src),
1006                     "movabs{q}\t{$src, $dst|$dst, $src}",
1007                     [(set GR64:$dst, imm:$src)], IIC_MOV>;
1008 def MOV64ri32 : RIi32<0xC7, MRM0r, (outs GR64:$dst), (ins i64i32imm:$src),
1009                       "mov{q}\t{$src, $dst|$dst, $src}",
1010                       [(set GR64:$dst, i64immSExt32:$src)], IIC_MOV>;
1011 }
1012 } // SchedRW
1013
1014 let SchedRW = [WriteStore] in {
1015 def MOV8mi  : Ii8 <0xC6, MRM0m, (outs), (ins i8mem :$dst, i8imm :$src),
1016                    "mov{b}\t{$src, $dst|$dst, $src}",
1017                    [(store (i8 imm:$src), addr:$dst)], IIC_MOV_MEM>;
1018 def MOV16mi : Ii16<0xC7, MRM0m, (outs), (ins i16mem:$dst, i16imm:$src),
1019                    "mov{w}\t{$src, $dst|$dst, $src}",
1020                    [(store (i16 imm:$src), addr:$dst)], IIC_MOV_MEM>, OpSize;
1021 def MOV32mi : Ii32<0xC7, MRM0m, (outs), (ins i32mem:$dst, i32imm:$src),
1022                    "mov{l}\t{$src, $dst|$dst, $src}",
1023                    [(store (i32 imm:$src), addr:$dst)], IIC_MOV_MEM>;
1024 def MOV64mi32 : RIi32<0xC7, MRM0m, (outs), (ins i64mem:$dst, i64i32imm:$src),
1025                       "mov{q}\t{$src, $dst|$dst, $src}",
1026                       [(store i64immSExt32:$src, addr:$dst)], IIC_MOV_MEM>;
1027 } // SchedRW
1028
1029 /// moffs8, moffs16 and moffs32 versions of moves.  The immediate is a
1030 /// 32-bit offset from the PC.  These are only valid in x86-32 mode.
1031 let SchedRW = [WriteALU] in {
1032 def MOV8o8a : Ii32 <0xA0, RawFrm, (outs), (ins offset8:$src),
1033                    "mov{b}\t{$src, %al|AL, $src}", [], IIC_MOV_MEM>,
1034                    Requires<[In32BitMode]>;
1035 def MOV16o16a : Ii32 <0xA1, RawFrm, (outs), (ins offset16:$src),
1036                       "mov{w}\t{$src, %ax|AL, $src}", [], IIC_MOV_MEM>, OpSize,
1037                      Requires<[In32BitMode]>;
1038 def MOV32o32a : Ii32 <0xA1, RawFrm, (outs), (ins offset32:$src),
1039                       "mov{l}\t{$src, %eax|EAX, $src}", [], IIC_MOV_MEM>,
1040                      Requires<[In32BitMode]>;
1041 def MOV8ao8 : Ii32 <0xA2, RawFrm, (outs offset8:$dst), (ins),
1042                    "mov{b}\t{%al, $dst|$dst, AL}", [], IIC_MOV_MEM>,
1043                   Requires<[In32BitMode]>;
1044 def MOV16ao16 : Ii32 <0xA3, RawFrm, (outs offset16:$dst), (ins),
1045                       "mov{w}\t{%ax, $dst|$dst, AL}", [], IIC_MOV_MEM>, OpSize,
1046                      Requires<[In32BitMode]>;
1047 def MOV32ao32 : Ii32 <0xA3, RawFrm, (outs offset32:$dst), (ins),
1048                       "mov{l}\t{%eax, $dst|$dst, EAX}", [], IIC_MOV_MEM>,
1049                      Requires<[In32BitMode]>;
1050 }
1051
1052 // FIXME: These definitions are utterly broken
1053 // Just leave them commented out for now because they're useless outside
1054 // of the large code model, and most compilers won't generate the instructions
1055 // in question.
1056 /*
1057 def MOV64o8a : RIi8<0xA0, RawFrm, (outs), (ins offset8:$src),
1058                       "mov{q}\t{$src, %rax|RAX, $src}", []>;
1059 def MOV64o64a : RIi32<0xA1, RawFrm, (outs), (ins offset64:$src),
1060                        "mov{q}\t{$src, %rax|RAX, $src}", []>;
1061 def MOV64ao8 : RIi8<0xA2, RawFrm, (outs offset8:$dst), (ins),
1062                        "mov{q}\t{%rax, $dst|$dst, RAX}", []>;
1063 def MOV64ao64 : RIi32<0xA3, RawFrm, (outs offset64:$dst), (ins),
1064                        "mov{q}\t{%rax, $dst|$dst, RAX}", []>;
1065 */
1066
1067
1068 let isCodeGenOnly = 1, hasSideEffects = 0, SchedRW = [WriteMove] in {
1069 def MOV8rr_REV : I<0x8A, MRMSrcReg, (outs GR8:$dst), (ins GR8:$src),
1070                    "mov{b}\t{$src, $dst|$dst, $src}", [], IIC_MOV>;
1071 def MOV16rr_REV : I<0x8B, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
1072                     "mov{w}\t{$src, $dst|$dst, $src}", [], IIC_MOV>, OpSize;
1073 def MOV32rr_REV : I<0x8B, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
1074                     "mov{l}\t{$src, $dst|$dst, $src}", [], IIC_MOV>;
1075 def MOV64rr_REV : RI<0x8B, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
1076                      "mov{q}\t{$src, $dst|$dst, $src}", [], IIC_MOV>;
1077 }
1078
1079 let canFoldAsLoad = 1, isReMaterializable = 1, SchedRW = [WriteLoad] in {
1080 def MOV8rm  : I<0x8A, MRMSrcMem, (outs GR8 :$dst), (ins i8mem :$src),
1081                 "mov{b}\t{$src, $dst|$dst, $src}",
1082                 [(set GR8:$dst, (loadi8 addr:$src))], IIC_MOV_MEM>;
1083 def MOV16rm : I<0x8B, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1084                 "mov{w}\t{$src, $dst|$dst, $src}",
1085                 [(set GR16:$dst, (loadi16 addr:$src))], IIC_MOV_MEM>, OpSize;
1086 def MOV32rm : I<0x8B, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1087                 "mov{l}\t{$src, $dst|$dst, $src}",
1088                 [(set GR32:$dst, (loadi32 addr:$src))], IIC_MOV_MEM>;
1089 def MOV64rm : RI<0x8B, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
1090                  "mov{q}\t{$src, $dst|$dst, $src}",
1091                  [(set GR64:$dst, (load addr:$src))], IIC_MOV_MEM>;
1092 }
1093
1094 let SchedRW = [WriteStore] in {
1095 def MOV8mr  : I<0x88, MRMDestMem, (outs), (ins i8mem :$dst, GR8 :$src),
1096                 "mov{b}\t{$src, $dst|$dst, $src}",
1097                 [(store GR8:$src, addr:$dst)], IIC_MOV_MEM>;
1098 def MOV16mr : I<0x89, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
1099                 "mov{w}\t{$src, $dst|$dst, $src}",
1100                 [(store GR16:$src, addr:$dst)], IIC_MOV_MEM>, OpSize;
1101 def MOV32mr : I<0x89, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
1102                 "mov{l}\t{$src, $dst|$dst, $src}",
1103                 [(store GR32:$src, addr:$dst)], IIC_MOV_MEM>;
1104 def MOV64mr : RI<0x89, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
1105                  "mov{q}\t{$src, $dst|$dst, $src}",
1106                  [(store GR64:$src, addr:$dst)], IIC_MOV_MEM>;
1107 } // SchedRW
1108
1109 // Versions of MOV8rr, MOV8mr, and MOV8rm that use i8mem_NOREX and GR8_NOREX so
1110 // that they can be used for copying and storing h registers, which can't be
1111 // encoded when a REX prefix is present.
1112 let isCodeGenOnly = 1 in {
1113 let neverHasSideEffects = 1 in
1114 def MOV8rr_NOREX : I<0x88, MRMDestReg,
1115                      (outs GR8_NOREX:$dst), (ins GR8_NOREX:$src),
1116                      "mov{b}\t{$src, $dst|$dst, $src}  # NOREX", [], IIC_MOV>,
1117                    Sched<[WriteMove]>;
1118 let mayStore = 1 in
1119 def MOV8mr_NOREX : I<0x88, MRMDestMem,
1120                      (outs), (ins i8mem_NOREX:$dst, GR8_NOREX:$src),
1121                      "mov{b}\t{$src, $dst|$dst, $src}  # NOREX", [],
1122                      IIC_MOV_MEM>, Sched<[WriteStore]>;
1123 let mayLoad = 1, neverHasSideEffects = 1,
1124     canFoldAsLoad = 1, isReMaterializable = 1 in
1125 def MOV8rm_NOREX : I<0x8A, MRMSrcMem,
1126                      (outs GR8_NOREX:$dst), (ins i8mem_NOREX:$src),
1127                      "mov{b}\t{$src, $dst|$dst, $src}  # NOREX", [],
1128                      IIC_MOV_MEM>, Sched<[WriteLoad]>;
1129 }
1130
1131
1132 // Condition code ops, incl. set if equal/not equal/...
1133 let SchedRW = [WriteALU] in {
1134 let Defs = [EFLAGS], Uses = [AH] in
1135 def SAHF     : I<0x9E, RawFrm, (outs),  (ins), "sahf",
1136                  [(set EFLAGS, (X86sahf AH))], IIC_AHF>;
1137 let Defs = [AH], Uses = [EFLAGS], neverHasSideEffects = 1 in
1138 def LAHF     : I<0x9F, RawFrm, (outs),  (ins), "lahf", [],
1139                 IIC_AHF>;  // AH = flags
1140 } // SchedRW
1141
1142 //===----------------------------------------------------------------------===//
1143 // Bit tests instructions: BT, BTS, BTR, BTC.
1144
1145 let Defs = [EFLAGS] in {
1146 let SchedRW = [WriteALU] in {
1147 def BT16rr : I<0xA3, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),
1148                "bt{w}\t{$src2, $src1|$src1, $src2}",
1149                [(set EFLAGS, (X86bt GR16:$src1, GR16:$src2))], IIC_BT_RR>,
1150                OpSize, TB;
1151 def BT32rr : I<0xA3, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),
1152                "bt{l}\t{$src2, $src1|$src1, $src2}",
1153                [(set EFLAGS, (X86bt GR32:$src1, GR32:$src2))], IIC_BT_RR>, TB;
1154 def BT64rr : RI<0xA3, MRMDestReg, (outs), (ins GR64:$src1, GR64:$src2),
1155                "bt{q}\t{$src2, $src1|$src1, $src2}",
1156                [(set EFLAGS, (X86bt GR64:$src1, GR64:$src2))], IIC_BT_RR>, TB;
1157 } // SchedRW
1158
1159 // Unlike with the register+register form, the memory+register form of the
1160 // bt instruction does not ignore the high bits of the index. From ISel's
1161 // perspective, this is pretty bizarre. Make these instructions disassembly
1162 // only for now.
1163
1164 let mayLoad = 1, hasSideEffects = 0, SchedRW = [WriteALULd] in {
1165   def BT16mr : I<0xA3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
1166                  "bt{w}\t{$src2, $src1|$src1, $src2}",
1167   //               [(X86bt (loadi16 addr:$src1), GR16:$src2),
1168   //                (implicit EFLAGS)]
1169                  [], IIC_BT_MR
1170                  >, OpSize, TB, Requires<[FastBTMem]>;
1171   def BT32mr : I<0xA3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
1172                  "bt{l}\t{$src2, $src1|$src1, $src2}",
1173   //               [(X86bt (loadi32 addr:$src1), GR32:$src2),
1174   //                (implicit EFLAGS)]
1175                  [], IIC_BT_MR
1176                  >, TB, Requires<[FastBTMem]>;
1177   def BT64mr : RI<0xA3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
1178                  "bt{q}\t{$src2, $src1|$src1, $src2}",
1179   //               [(X86bt (loadi64 addr:$src1), GR64:$src2),
1180   //                (implicit EFLAGS)]
1181                   [], IIC_BT_MR
1182                   >, TB;
1183 }
1184
1185 let SchedRW = [WriteALU] in {
1186 def BT16ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR16:$src1, i16i8imm:$src2),
1187                 "bt{w}\t{$src2, $src1|$src1, $src2}",
1188                 [(set EFLAGS, (X86bt GR16:$src1, i16immSExt8:$src2))],
1189                 IIC_BT_RI>, OpSize, TB;
1190 def BT32ri8 : Ii8<0xBA, MRM4r, (outs), (ins GR32:$src1, i32i8imm:$src2),
1191                 "bt{l}\t{$src2, $src1|$src1, $src2}",
1192                 [(set EFLAGS, (X86bt GR32:$src1, i32immSExt8:$src2))],
1193                 IIC_BT_RI>, TB;
1194 def BT64ri8 : RIi8<0xBA, MRM4r, (outs), (ins GR64:$src1, i64i8imm:$src2),
1195                 "bt{q}\t{$src2, $src1|$src1, $src2}",
1196                 [(set EFLAGS, (X86bt GR64:$src1, i64immSExt8:$src2))],
1197                 IIC_BT_RI>, TB;
1198 } // SchedRW
1199
1200 // Note that these instructions don't need FastBTMem because that
1201 // only applies when the other operand is in a register. When it's
1202 // an immediate, bt is still fast.
1203 let SchedRW = [WriteALU] in {
1204 def BT16mi8 : Ii8<0xBA, MRM4m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
1205                 "bt{w}\t{$src2, $src1|$src1, $src2}",
1206                 [(set EFLAGS, (X86bt (loadi16 addr:$src1), i16immSExt8:$src2))
1207                  ], IIC_BT_MI>, OpSize, TB;
1208 def BT32mi8 : Ii8<0xBA, MRM4m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
1209                 "bt{l}\t{$src2, $src1|$src1, $src2}",
1210                 [(set EFLAGS, (X86bt (loadi32 addr:$src1), i32immSExt8:$src2))
1211                  ], IIC_BT_MI>, TB;
1212 def BT64mi8 : RIi8<0xBA, MRM4m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
1213                 "bt{q}\t{$src2, $src1|$src1, $src2}",
1214                 [(set EFLAGS, (X86bt (loadi64 addr:$src1),
1215                                      i64immSExt8:$src2))], IIC_BT_MI>, TB;
1216 } // SchedRW
1217
1218 let hasSideEffects = 0 in {
1219 let SchedRW = [WriteALU] in {
1220 def BTC16rr : I<0xBB, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),
1221                 "btc{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>,
1222                 OpSize, TB;
1223 def BTC32rr : I<0xBB, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),
1224                 "btc{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>, TB;
1225 def BTC64rr : RI<0xBB, MRMDestReg, (outs), (ins GR64:$src1, GR64:$src2),
1226                  "btc{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>, TB;
1227 } // SchedRW
1228
1229 let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd] in {
1230 def BTC16mr : I<0xBB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
1231                 "btc{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>,
1232                 OpSize, TB;
1233 def BTC32mr : I<0xBB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
1234                 "btc{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>, TB;
1235 def BTC64mr : RI<0xBB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
1236                  "btc{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>, TB;
1237 }
1238
1239 let SchedRW = [WriteALU] in {
1240 def BTC16ri8 : Ii8<0xBA, MRM7r, (outs), (ins GR16:$src1, i16i8imm:$src2),
1241                     "btc{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>,
1242                     OpSize, TB;
1243 def BTC32ri8 : Ii8<0xBA, MRM7r, (outs), (ins GR32:$src1, i32i8imm:$src2),
1244                     "btc{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>, TB;
1245 def BTC64ri8 : RIi8<0xBA, MRM7r, (outs), (ins GR64:$src1, i64i8imm:$src2),
1246                     "btc{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>, TB;
1247 } // SchedRW
1248
1249 let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
1250 def BTC16mi8 : Ii8<0xBA, MRM7m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
1251                     "btc{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>,
1252                     OpSize, TB;
1253 def BTC32mi8 : Ii8<0xBA, MRM7m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
1254                     "btc{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>, TB;
1255 def BTC64mi8 : RIi8<0xBA, MRM7m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
1256                     "btc{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>, TB;
1257 }
1258
1259 let SchedRW = [WriteALU] in {
1260 def BTR16rr : I<0xB3, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),
1261                 "btr{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>,
1262                 OpSize, TB;
1263 def BTR32rr : I<0xB3, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),
1264                 "btr{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>, TB;
1265 def BTR64rr : RI<0xB3, MRMDestReg, (outs), (ins GR64:$src1, GR64:$src2),
1266                  "btr{q}\t{$src2, $src1|$src1, $src2}", []>, TB;
1267 } // SchedRW
1268
1269 let mayLoad = 1, mayStore = 1 in {
1270 def BTR16mr : I<0xB3, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
1271                 "btr{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>,
1272                 OpSize, TB;
1273 def BTR32mr : I<0xB3, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
1274                 "btr{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>, TB;
1275 def BTR64mr : RI<0xB3, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
1276                  "btr{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>, TB;
1277 }
1278
1279 let SchedRW = [WriteALU] in {
1280 def BTR16ri8 : Ii8<0xBA, MRM6r, (outs), (ins GR16:$src1, i16i8imm:$src2),
1281                     "btr{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>,
1282                     OpSize, TB;
1283 def BTR32ri8 : Ii8<0xBA, MRM6r, (outs), (ins GR32:$src1, i32i8imm:$src2),
1284                     "btr{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>, TB;
1285 def BTR64ri8 : RIi8<0xBA, MRM6r, (outs), (ins GR64:$src1, i64i8imm:$src2),
1286                     "btr{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>, TB;
1287 } // SchedRW
1288
1289 let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
1290 def BTR16mi8 : Ii8<0xBA, MRM6m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
1291                     "btr{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>,
1292                     OpSize, TB;
1293 def BTR32mi8 : Ii8<0xBA, MRM6m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
1294                     "btr{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>, TB;
1295 def BTR64mi8 : RIi8<0xBA, MRM6m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
1296                     "btr{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>, TB;
1297 }
1298
1299 let SchedRW = [WriteALU] in {
1300 def BTS16rr : I<0xAB, MRMDestReg, (outs), (ins GR16:$src1, GR16:$src2),
1301                 "bts{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>,
1302                 OpSize, TB;
1303 def BTS32rr : I<0xAB, MRMDestReg, (outs), (ins GR32:$src1, GR32:$src2),
1304                 "bts{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>, TB;
1305 def BTS64rr : RI<0xAB, MRMDestReg, (outs), (ins GR64:$src1, GR64:$src2),
1306                  "bts{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RR>, TB;
1307 } // SchedRW
1308
1309 let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
1310 def BTS16mr : I<0xAB, MRMDestMem, (outs), (ins i16mem:$src1, GR16:$src2),
1311                 "bts{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>,
1312                 OpSize, TB;
1313 def BTS32mr : I<0xAB, MRMDestMem, (outs), (ins i32mem:$src1, GR32:$src2),
1314                 "bts{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>, TB;
1315 def BTS64mr : RI<0xAB, MRMDestMem, (outs), (ins i64mem:$src1, GR64:$src2),
1316                  "bts{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MR>, TB;
1317 }
1318
1319 let SchedRW = [WriteALU] in {
1320 def BTS16ri8 : Ii8<0xBA, MRM5r, (outs), (ins GR16:$src1, i16i8imm:$src2),
1321                     "bts{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>,
1322                     OpSize, TB;
1323 def BTS32ri8 : Ii8<0xBA, MRM5r, (outs), (ins GR32:$src1, i32i8imm:$src2),
1324                     "bts{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>, TB;
1325 def BTS64ri8 : RIi8<0xBA, MRM5r, (outs), (ins GR64:$src1, i64i8imm:$src2),
1326                     "bts{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_RI>, TB;
1327 } // SchedRW
1328
1329 let mayLoad = 1, mayStore = 1, SchedRW = [WriteALULd, WriteRMW] in {
1330 def BTS16mi8 : Ii8<0xBA, MRM5m, (outs), (ins i16mem:$src1, i16i8imm:$src2),
1331                     "bts{w}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>,
1332                     OpSize, TB;
1333 def BTS32mi8 : Ii8<0xBA, MRM5m, (outs), (ins i32mem:$src1, i32i8imm:$src2),
1334                     "bts{l}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>, TB;
1335 def BTS64mi8 : RIi8<0xBA, MRM5m, (outs), (ins i64mem:$src1, i64i8imm:$src2),
1336                     "bts{q}\t{$src2, $src1|$src1, $src2}", [], IIC_BTX_MI>, TB;
1337 }
1338 } // hasSideEffects = 0
1339 } // Defs = [EFLAGS]
1340
1341
1342 //===----------------------------------------------------------------------===//
1343 // Atomic support
1344 //
1345
1346 // Atomic swap. These are just normal xchg instructions. But since a memory
1347 // operand is referenced, the atomicity is ensured.
1348 multiclass ATOMIC_SWAP<bits<8> opc8, bits<8> opc, string mnemonic, string frag,
1349                        InstrItinClass itin> {
1350   let Constraints = "$val = $dst" in {
1351     def NAME#8rm  : I<opc8, MRMSrcMem, (outs GR8:$dst),
1352                       (ins GR8:$val, i8mem:$ptr),
1353                       !strconcat(mnemonic, "{b}\t{$val, $ptr|$ptr, $val}"),
1354                       [(set
1355                          GR8:$dst,
1356                          (!cast<PatFrag>(frag # "_8") addr:$ptr, GR8:$val))],
1357                       itin>;
1358     def NAME#16rm : I<opc, MRMSrcMem, (outs GR16:$dst),
1359                       (ins GR16:$val, i16mem:$ptr),
1360                       !strconcat(mnemonic, "{w}\t{$val, $ptr|$ptr, $val}"),
1361                       [(set
1362                          GR16:$dst,
1363                          (!cast<PatFrag>(frag # "_16") addr:$ptr, GR16:$val))],
1364                       itin>, OpSize;
1365     def NAME#32rm : I<opc, MRMSrcMem, (outs GR32:$dst),
1366                       (ins GR32:$val, i32mem:$ptr),
1367                       !strconcat(mnemonic, "{l}\t{$val, $ptr|$ptr, $val}"),
1368                       [(set
1369                          GR32:$dst,
1370                          (!cast<PatFrag>(frag # "_32") addr:$ptr, GR32:$val))],
1371                       itin>;
1372     def NAME#64rm : RI<opc, MRMSrcMem, (outs GR64:$dst),
1373                        (ins GR64:$val, i64mem:$ptr),
1374                        !strconcat(mnemonic, "{q}\t{$val, $ptr|$ptr, $val}"),
1375                        [(set
1376                          GR64:$dst,
1377                          (!cast<PatFrag>(frag # "_64") addr:$ptr, GR64:$val))],
1378                        itin>;
1379   }
1380 }
1381
1382 defm XCHG    : ATOMIC_SWAP<0x86, 0x87, "xchg", "atomic_swap", IIC_XCHG_MEM>;
1383
1384 // Swap between registers.
1385 let Constraints = "$val = $dst" in {
1386 def XCHG8rr : I<0x86, MRMSrcReg, (outs GR8:$dst), (ins GR8:$val, GR8:$src),
1387                 "xchg{b}\t{$val, $src|$src, $val}", [], IIC_XCHG_REG>;
1388 def XCHG16rr : I<0x87, MRMSrcReg, (outs GR16:$dst), (ins GR16:$val, GR16:$src),
1389                  "xchg{w}\t{$val, $src|$src, $val}", [], IIC_XCHG_REG>, OpSize;
1390 def XCHG32rr : I<0x87, MRMSrcReg, (outs GR32:$dst), (ins GR32:$val, GR32:$src),
1391                  "xchg{l}\t{$val, $src|$src, $val}", [], IIC_XCHG_REG>;
1392 def XCHG64rr : RI<0x87, MRMSrcReg, (outs GR64:$dst), (ins GR64:$val,GR64:$src),
1393                   "xchg{q}\t{$val, $src|$src, $val}", [], IIC_XCHG_REG>;
1394 }
1395
1396 // Swap between EAX and other registers.
1397 def XCHG16ar : I<0x90, AddRegFrm, (outs), (ins GR16:$src),
1398                   "xchg{w}\t{$src, %ax|AX, $src}", [], IIC_XCHG_REG>, OpSize;
1399 def XCHG32ar : I<0x90, AddRegFrm, (outs), (ins GR32:$src),
1400                   "xchg{l}\t{$src, %eax|EAX, $src}", [], IIC_XCHG_REG>,
1401                   Requires<[In32BitMode]>;
1402 // Uses GR32_NOAX in 64-bit mode to prevent encoding using the 0x90 NOP encoding.
1403 // xchg %eax, %eax needs to clear upper 32-bits of RAX so is not a NOP.
1404 def XCHG32ar64 : I<0x90, AddRegFrm, (outs), (ins GR32_NOAX:$src),
1405                    "xchg{l}\t{$src, %eax|EAX, $src}", [], IIC_XCHG_REG>,
1406                    Requires<[In64BitMode]>;
1407 def XCHG64ar : RI<0x90, AddRegFrm, (outs), (ins GR64:$src),
1408                   "xchg{q}\t{$src, %rax|RAX, $src}", [], IIC_XCHG_REG>;
1409
1410
1411
1412 def XADD8rr : I<0xC0, MRMDestReg, (outs GR8:$dst), (ins GR8:$src),
1413                 "xadd{b}\t{$src, $dst|$dst, $src}", [], IIC_XADD_REG>, TB;
1414 def XADD16rr : I<0xC1, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
1415                  "xadd{w}\t{$src, $dst|$dst, $src}", [], IIC_XADD_REG>, TB,
1416                  OpSize;
1417 def XADD32rr  : I<0xC1, MRMDestReg, (outs GR32:$dst), (ins GR32:$src),
1418                  "xadd{l}\t{$src, $dst|$dst, $src}", [], IIC_XADD_REG>, TB;
1419 def XADD64rr  : RI<0xC1, MRMDestReg, (outs GR64:$dst), (ins GR64:$src),
1420                    "xadd{q}\t{$src, $dst|$dst, $src}", [], IIC_XADD_REG>, TB;
1421
1422 let mayLoad = 1, mayStore = 1 in {
1423 def XADD8rm   : I<0xC0, MRMDestMem, (outs), (ins i8mem:$dst, GR8:$src),
1424                  "xadd{b}\t{$src, $dst|$dst, $src}", [], IIC_XADD_MEM>, TB;
1425 def XADD16rm  : I<0xC1, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
1426                  "xadd{w}\t{$src, $dst|$dst, $src}", [], IIC_XADD_MEM>, TB,
1427                  OpSize;
1428 def XADD32rm  : I<0xC1, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
1429                  "xadd{l}\t{$src, $dst|$dst, $src}", [], IIC_XADD_MEM>, TB;
1430 def XADD64rm  : RI<0xC1, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
1431                    "xadd{q}\t{$src, $dst|$dst, $src}", [], IIC_XADD_MEM>, TB;
1432
1433 }
1434
1435 def CMPXCHG8rr : I<0xB0, MRMDestReg, (outs GR8:$dst), (ins GR8:$src),
1436                    "cmpxchg{b}\t{$src, $dst|$dst, $src}", [],
1437                    IIC_CMPXCHG_REG8>, TB;
1438 def CMPXCHG16rr : I<0xB1, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
1439                     "cmpxchg{w}\t{$src, $dst|$dst, $src}", [],
1440                     IIC_CMPXCHG_REG>, TB, OpSize;
1441 def CMPXCHG32rr  : I<0xB1, MRMDestReg, (outs GR32:$dst), (ins GR32:$src),
1442                      "cmpxchg{l}\t{$src, $dst|$dst, $src}", [],
1443                      IIC_CMPXCHG_REG>, TB;
1444 def CMPXCHG64rr  : RI<0xB1, MRMDestReg, (outs GR64:$dst), (ins GR64:$src),
1445                       "cmpxchg{q}\t{$src, $dst|$dst, $src}", [],
1446                       IIC_CMPXCHG_REG>, TB;
1447
1448 let mayLoad = 1, mayStore = 1 in {
1449 def CMPXCHG8rm   : I<0xB0, MRMDestMem, (outs), (ins i8mem:$dst, GR8:$src),
1450                      "cmpxchg{b}\t{$src, $dst|$dst, $src}", [],
1451                      IIC_CMPXCHG_MEM8>, TB;
1452 def CMPXCHG16rm  : I<0xB1, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
1453                      "cmpxchg{w}\t{$src, $dst|$dst, $src}", [],
1454                      IIC_CMPXCHG_MEM>, TB, OpSize;
1455 def CMPXCHG32rm  : I<0xB1, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
1456                      "cmpxchg{l}\t{$src, $dst|$dst, $src}", [],
1457                      IIC_CMPXCHG_MEM>, TB;
1458 def CMPXCHG64rm  : RI<0xB1, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
1459                       "cmpxchg{q}\t{$src, $dst|$dst, $src}", [],
1460                       IIC_CMPXCHG_MEM>, TB;
1461 }
1462
1463 let Defs = [EAX, EDX, EFLAGS], Uses = [EAX, EBX, ECX, EDX] in
1464 def CMPXCHG8B : I<0xC7, MRM1m, (outs), (ins i64mem:$dst),
1465                   "cmpxchg8b\t$dst", [], IIC_CMPXCHG_8B>, TB;
1466
1467 let Defs = [RAX, RDX, EFLAGS], Uses = [RAX, RBX, RCX, RDX] in
1468 def CMPXCHG16B : RI<0xC7, MRM1m, (outs), (ins i128mem:$dst),
1469                     "cmpxchg16b\t$dst", [], IIC_CMPXCHG_16B>,
1470                     TB, Requires<[HasCmpxchg16b]>;
1471
1472
1473
1474 // Lock instruction prefix
1475 def LOCK_PREFIX : I<0xF0, RawFrm, (outs),  (ins), "lock", []>;
1476
1477 // Rex64 instruction prefix
1478 def REX64_PREFIX : I<0x48, RawFrm, (outs),  (ins), "rex64", []>;
1479
1480 // Data16 instruction prefix
1481 def DATA16_PREFIX : I<0x66, RawFrm, (outs),  (ins), "data16", []>;
1482
1483 // Repeat string operation instruction prefixes
1484 // These uses the DF flag in the EFLAGS register to inc or dec ECX
1485 let Defs = [ECX], Uses = [ECX,EFLAGS] in {
1486 // Repeat (used with INS, OUTS, MOVS, LODS and STOS)
1487 def REP_PREFIX : I<0xF3, RawFrm, (outs),  (ins), "rep", []>;
1488 // Repeat while not equal (used with CMPS and SCAS)
1489 def REPNE_PREFIX : I<0xF2, RawFrm, (outs),  (ins), "repne", []>;
1490 }
1491
1492
1493 // String manipulation instructions
1494 def LODSB : I<0xAC, RawFrm, (outs), (ins), "lodsb", [], IIC_LODS>;
1495 def LODSW : I<0xAD, RawFrm, (outs), (ins), "lodsw", [], IIC_LODS>, OpSize;
1496 def LODSD : I<0xAD, RawFrm, (outs), (ins), "lods{l|d}", [], IIC_LODS>;
1497 def LODSQ : RI<0xAD, RawFrm, (outs), (ins), "lodsq", [], IIC_LODS>;
1498
1499 def OUTSB : I<0x6E, RawFrm, (outs), (ins), "outsb", [], IIC_OUTS>;
1500 def OUTSW : I<0x6F, RawFrm, (outs), (ins), "outsw", [], IIC_OUTS>, OpSize;
1501 def OUTSD : I<0x6F, RawFrm, (outs), (ins), "outs{l|d}", [], IIC_OUTS>;
1502
1503
1504 // Flag instructions
1505 def CLC : I<0xF8, RawFrm, (outs), (ins), "clc", [], IIC_CLC>;
1506 def STC : I<0xF9, RawFrm, (outs), (ins), "stc", [], IIC_STC>;
1507 def CLI : I<0xFA, RawFrm, (outs), (ins), "cli", [], IIC_CLI>;
1508 def STI : I<0xFB, RawFrm, (outs), (ins), "sti", [], IIC_STI>;
1509 def CLD : I<0xFC, RawFrm, (outs), (ins), "cld", [], IIC_CLD>;
1510 def STD : I<0xFD, RawFrm, (outs), (ins), "std", [], IIC_STD>;
1511 def CMC : I<0xF5, RawFrm, (outs), (ins), "cmc", [], IIC_CMC>;
1512
1513 def CLTS : I<0x06, RawFrm, (outs), (ins), "clts", [], IIC_CLTS>, TB;
1514
1515 // Table lookup instructions
1516 def XLAT : I<0xD7, RawFrm, (outs), (ins), "xlatb", [], IIC_XLAT>;
1517
1518 let SchedRW = [WriteMicrocoded] in {
1519 // ASCII Adjust After Addition
1520 // sets AL, AH and CF and AF of EFLAGS and uses AL and AF of EFLAGS
1521 def AAA : I<0x37, RawFrm, (outs), (ins), "aaa", [], IIC_AAA>,
1522             Requires<[In32BitMode]>;
1523
1524 // ASCII Adjust AX Before Division
1525 // sets AL, AH and EFLAGS and uses AL and AH
1526 def AAD8i8 : Ii8<0xD5, RawFrm, (outs), (ins i8imm:$src),
1527                  "aad\t$src", [], IIC_AAD>, Requires<[In32BitMode]>;
1528
1529 // ASCII Adjust AX After Multiply
1530 // sets AL, AH and EFLAGS and uses AL
1531 def AAM8i8 : Ii8<0xD4, RawFrm, (outs), (ins i8imm:$src),
1532                  "aam\t$src", [], IIC_AAM>, Requires<[In32BitMode]>;
1533
1534 // ASCII Adjust AL After Subtraction - sets
1535 // sets AL, AH and CF and AF of EFLAGS and uses AL and AF of EFLAGS
1536 def AAS : I<0x3F, RawFrm, (outs), (ins), "aas", [], IIC_AAS>,
1537             Requires<[In32BitMode]>;
1538
1539 // Decimal Adjust AL after Addition
1540 // sets AL, CF and AF of EFLAGS and uses AL, CF and AF of EFLAGS
1541 def DAA : I<0x27, RawFrm, (outs), (ins), "daa", [], IIC_DAA>,
1542             Requires<[In32BitMode]>;
1543
1544 // Decimal Adjust AL after Subtraction
1545 // sets AL, CF and AF of EFLAGS and uses AL, CF and AF of EFLAGS
1546 def DAS : I<0x2F, RawFrm, (outs), (ins), "das", [], IIC_DAS>,
1547             Requires<[In32BitMode]>;
1548 } // SchedRW
1549
1550 let SchedRW = [WriteSystem] in {
1551 // Check Array Index Against Bounds
1552 def BOUNDS16rm : I<0x62, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1553                    "bound\t{$src, $dst|$dst, $src}", [], IIC_BOUND>, OpSize,
1554                    Requires<[In32BitMode]>;
1555 def BOUNDS32rm : I<0x62, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1556                    "bound\t{$src, $dst|$dst, $src}", [], IIC_BOUND>,
1557                    Requires<[In32BitMode]>;
1558
1559 // Adjust RPL Field of Segment Selector
1560 def ARPL16rr : I<0x63, MRMDestReg, (outs GR16:$dst), (ins GR16:$src),
1561                  "arpl\t{$src, $dst|$dst, $src}", [], IIC_ARPL_REG>,
1562                  Requires<[In32BitMode]>;
1563 def ARPL16mr : I<0x63, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
1564                  "arpl\t{$src, $dst|$dst, $src}", [], IIC_ARPL_MEM>,
1565                  Requires<[In32BitMode]>;
1566 } // SchedRW
1567
1568 //===----------------------------------------------------------------------===//
1569 // MOVBE Instructions
1570 //
1571 let Predicates = [HasMOVBE] in {
1572   let SchedRW = [WriteALULd] in {
1573   def MOVBE16rm : I<0xF0, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1574                     "movbe{w}\t{$src, $dst|$dst, $src}",
1575                     [(set GR16:$dst, (bswap (loadi16 addr:$src)))], IIC_MOVBE>,
1576                     OpSize, T8;
1577   def MOVBE32rm : I<0xF0, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1578                     "movbe{l}\t{$src, $dst|$dst, $src}",
1579                     [(set GR32:$dst, (bswap (loadi32 addr:$src)))], IIC_MOVBE>,
1580                     T8;
1581   def MOVBE64rm : RI<0xF0, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
1582                      "movbe{q}\t{$src, $dst|$dst, $src}",
1583                      [(set GR64:$dst, (bswap (loadi64 addr:$src)))], IIC_MOVBE>,
1584                      T8;
1585   }
1586   let SchedRW = [WriteStore] in {
1587   def MOVBE16mr : I<0xF1, MRMDestMem, (outs), (ins i16mem:$dst, GR16:$src),
1588                     "movbe{w}\t{$src, $dst|$dst, $src}",
1589                     [(store (bswap GR16:$src), addr:$dst)], IIC_MOVBE>,
1590                     OpSize, T8;
1591   def MOVBE32mr : I<0xF1, MRMDestMem, (outs), (ins i32mem:$dst, GR32:$src),
1592                     "movbe{l}\t{$src, $dst|$dst, $src}",
1593                     [(store (bswap GR32:$src), addr:$dst)], IIC_MOVBE>,
1594                     T8;
1595   def MOVBE64mr : RI<0xF1, MRMDestMem, (outs), (ins i64mem:$dst, GR64:$src),
1596                      "movbe{q}\t{$src, $dst|$dst, $src}",
1597                      [(store (bswap GR64:$src), addr:$dst)], IIC_MOVBE>,
1598                      T8;
1599   }
1600 }
1601
1602 //===----------------------------------------------------------------------===//
1603 // RDRAND Instruction
1604 //
1605 let Predicates = [HasRDRAND], Defs = [EFLAGS] in {
1606   def RDRAND16r : I<0xC7, MRM6r, (outs GR16:$dst), (ins),
1607                     "rdrand{w}\t$dst",
1608                     [(set GR16:$dst, EFLAGS, (X86rdrand))]>, OpSize, TB;
1609   def RDRAND32r : I<0xC7, MRM6r, (outs GR32:$dst), (ins),
1610                     "rdrand{l}\t$dst",
1611                     [(set GR32:$dst, EFLAGS, (X86rdrand))]>, TB;
1612   def RDRAND64r : RI<0xC7, MRM6r, (outs GR64:$dst), (ins),
1613                      "rdrand{q}\t$dst",
1614                      [(set GR64:$dst, EFLAGS, (X86rdrand))]>, TB;
1615 }
1616
1617 //===----------------------------------------------------------------------===//
1618 // LZCNT Instruction
1619 //
1620 let Predicates = [HasLZCNT], Defs = [EFLAGS] in {
1621   def LZCNT16rr : I<0xBD, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
1622                     "lzcnt{w}\t{$src, $dst|$dst, $src}",
1623                     [(set GR16:$dst, (ctlz GR16:$src)), (implicit EFLAGS)]>, XS,
1624                     OpSize;
1625   def LZCNT16rm : I<0xBD, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1626                     "lzcnt{w}\t{$src, $dst|$dst, $src}",
1627                     [(set GR16:$dst, (ctlz (loadi16 addr:$src))),
1628                      (implicit EFLAGS)]>, XS, OpSize;
1629
1630   def LZCNT32rr : I<0xBD, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
1631                     "lzcnt{l}\t{$src, $dst|$dst, $src}",
1632                     [(set GR32:$dst, (ctlz GR32:$src)), (implicit EFLAGS)]>, XS;
1633   def LZCNT32rm : I<0xBD, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1634                     "lzcnt{l}\t{$src, $dst|$dst, $src}",
1635                     [(set GR32:$dst, (ctlz (loadi32 addr:$src))),
1636                      (implicit EFLAGS)]>, XS;
1637
1638   def LZCNT64rr : RI<0xBD, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
1639                      "lzcnt{q}\t{$src, $dst|$dst, $src}",
1640                      [(set GR64:$dst, (ctlz GR64:$src)), (implicit EFLAGS)]>,
1641                      XS;
1642   def LZCNT64rm : RI<0xBD, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
1643                      "lzcnt{q}\t{$src, $dst|$dst, $src}",
1644                      [(set GR64:$dst, (ctlz (loadi64 addr:$src))),
1645                       (implicit EFLAGS)]>, XS;
1646 }
1647
1648 //===----------------------------------------------------------------------===//
1649 // BMI Instructions
1650 //
1651 let Predicates = [HasBMI], Defs = [EFLAGS] in {
1652   def TZCNT16rr : I<0xBC, MRMSrcReg, (outs GR16:$dst), (ins GR16:$src),
1653                     "tzcnt{w}\t{$src, $dst|$dst, $src}",
1654                     [(set GR16:$dst, (cttz GR16:$src)), (implicit EFLAGS)]>, XS,
1655                     OpSize;
1656   def TZCNT16rm : I<0xBC, MRMSrcMem, (outs GR16:$dst), (ins i16mem:$src),
1657                     "tzcnt{w}\t{$src, $dst|$dst, $src}",
1658                     [(set GR16:$dst, (cttz (loadi16 addr:$src))),
1659                      (implicit EFLAGS)]>, XS, OpSize;
1660
1661   def TZCNT32rr : I<0xBC, MRMSrcReg, (outs GR32:$dst), (ins GR32:$src),
1662                     "tzcnt{l}\t{$src, $dst|$dst, $src}",
1663                     [(set GR32:$dst, (cttz GR32:$src)), (implicit EFLAGS)]>, XS;
1664   def TZCNT32rm : I<0xBC, MRMSrcMem, (outs GR32:$dst), (ins i32mem:$src),
1665                     "tzcnt{l}\t{$src, $dst|$dst, $src}",
1666                     [(set GR32:$dst, (cttz (loadi32 addr:$src))),
1667                      (implicit EFLAGS)]>, XS;
1668
1669   def TZCNT64rr : RI<0xBC, MRMSrcReg, (outs GR64:$dst), (ins GR64:$src),
1670                      "tzcnt{q}\t{$src, $dst|$dst, $src}",
1671                      [(set GR64:$dst, (cttz GR64:$src)), (implicit EFLAGS)]>,
1672                      XS;
1673   def TZCNT64rm : RI<0xBC, MRMSrcMem, (outs GR64:$dst), (ins i64mem:$src),
1674                      "tzcnt{q}\t{$src, $dst|$dst, $src}",
1675                      [(set GR64:$dst, (cttz (loadi64 addr:$src))),
1676                       (implicit EFLAGS)]>, XS;
1677 }
1678
1679 multiclass bmi_bls<string mnemonic, Format RegMRM, Format MemMRM,
1680                   RegisterClass RC, X86MemOperand x86memop, SDNode OpNode,
1681                   PatFrag ld_frag> {
1682   def rr : I<0xF3, RegMRM, (outs RC:$dst), (ins RC:$src),
1683              !strconcat(mnemonic, "\t{$src, $dst|$dst, $src}"),
1684              [(set RC:$dst, (OpNode RC:$src)), (implicit EFLAGS)]>, T8, VEX_4V;
1685   def rm : I<0xF3, MemMRM, (outs RC:$dst), (ins x86memop:$src),
1686              !strconcat(mnemonic, "\t{$src, $dst|$dst, $src}"),
1687              [(set RC:$dst, (OpNode (ld_frag addr:$src))), (implicit EFLAGS)]>,
1688              T8, VEX_4V;
1689 }
1690
1691 let Predicates = [HasBMI], Defs = [EFLAGS] in {
1692   defm BLSR32 : bmi_bls<"blsr{l}", MRM1r, MRM1m, GR32, i32mem,
1693                         X86blsr, loadi32>;
1694   defm BLSR64 : bmi_bls<"blsr{q}", MRM1r, MRM1m, GR64, i64mem,
1695                         X86blsr, loadi64>, VEX_W;
1696   defm BLSMSK32 : bmi_bls<"blsmsk{l}", MRM2r, MRM2m, GR32, i32mem,
1697                           X86blsmsk, loadi32>;
1698   defm BLSMSK64 : bmi_bls<"blsmsk{q}", MRM2r, MRM2m, GR64, i64mem,
1699                           X86blsmsk, loadi64>, VEX_W;
1700   defm BLSI32 : bmi_bls<"blsi{l}", MRM3r, MRM3m, GR32, i32mem,
1701                         X86blsi, loadi32>;
1702   defm BLSI64 : bmi_bls<"blsi{q}", MRM3r, MRM3m, GR64, i64mem,
1703                         X86blsi, loadi64>, VEX_W;
1704 }
1705
1706 multiclass bmi_bextr_bzhi<bits<8> opc, string mnemonic, RegisterClass RC,
1707                           X86MemOperand x86memop, Intrinsic Int,
1708                           PatFrag ld_frag> {
1709   def rr : I<opc, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
1710              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
1711              [(set RC:$dst, (Int RC:$src1, RC:$src2)), (implicit EFLAGS)]>,
1712              T8, VEX_4VOp3;
1713   def rm : I<opc, MRMSrcMem, (outs RC:$dst), (ins x86memop:$src1, RC:$src2),
1714              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
1715              [(set RC:$dst, (Int (ld_frag addr:$src1), RC:$src2)),
1716               (implicit EFLAGS)]>, T8, VEX_4VOp3;
1717 }
1718
1719 let Predicates = [HasBMI], Defs = [EFLAGS] in {
1720   defm BEXTR32 : bmi_bextr_bzhi<0xF7, "bextr{l}", GR32, i32mem,
1721                                 int_x86_bmi_bextr_32, loadi32>;
1722   defm BEXTR64 : bmi_bextr_bzhi<0xF7, "bextr{q}", GR64, i64mem,
1723                                 int_x86_bmi_bextr_64, loadi64>, VEX_W;
1724 }
1725
1726 let Predicates = [HasBMI2], Defs = [EFLAGS] in {
1727   defm BZHI32 : bmi_bextr_bzhi<0xF5, "bzhi{l}", GR32, i32mem,
1728                                int_x86_bmi_bzhi_32, loadi32>;
1729   defm BZHI64 : bmi_bextr_bzhi<0xF5, "bzhi{q}", GR64, i64mem,
1730                                int_x86_bmi_bzhi_64, loadi64>, VEX_W;
1731 }
1732
1733 multiclass bmi_pdep_pext<string mnemonic, RegisterClass RC,
1734                          X86MemOperand x86memop, Intrinsic Int,
1735                          PatFrag ld_frag> {
1736   def rr : I<0xF5, MRMSrcReg, (outs RC:$dst), (ins RC:$src1, RC:$src2),
1737              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
1738              [(set RC:$dst, (Int RC:$src1, RC:$src2))]>,
1739              VEX_4V;
1740   def rm : I<0xF5, MRMSrcMem, (outs RC:$dst), (ins RC:$src1, x86memop:$src2),
1741              !strconcat(mnemonic, "\t{$src2, $src1, $dst|$dst, $src1, $src2}"),
1742              [(set RC:$dst, (Int RC:$src1, (ld_frag addr:$src2)))]>, VEX_4V;
1743 }
1744
1745 let Predicates = [HasBMI2] in {
1746   defm PDEP32 : bmi_pdep_pext<"pdep{l}", GR32, i32mem,
1747                                int_x86_bmi_pdep_32, loadi32>, T8XD;
1748   defm PDEP64 : bmi_pdep_pext<"pdep{q}", GR64, i64mem,
1749                                int_x86_bmi_pdep_64, loadi64>, T8XD, VEX_W;
1750   defm PEXT32 : bmi_pdep_pext<"pext{l}", GR32, i32mem,
1751                                int_x86_bmi_pext_32, loadi32>, T8XS;
1752   defm PEXT64 : bmi_pdep_pext<"pext{q}", GR64, i64mem,
1753                                int_x86_bmi_pext_64, loadi64>, T8XS, VEX_W;
1754 }
1755
1756 //===----------------------------------------------------------------------===//
1757 // Subsystems.
1758 //===----------------------------------------------------------------------===//
1759
1760 include "X86InstrArithmetic.td"
1761 include "X86InstrCMovSetCC.td"
1762 include "X86InstrExtension.td"
1763 include "X86InstrControl.td"
1764 include "X86InstrShiftRotate.td"
1765
1766 // X87 Floating Point Stack.
1767 include "X86InstrFPStack.td"
1768
1769 // SIMD support (SSE, MMX and AVX)
1770 include "X86InstrFragmentsSIMD.td"
1771
1772 // FMA - Fused Multiply-Add support (requires FMA)
1773 include "X86InstrFMA.td"
1774
1775 // XOP
1776 include "X86InstrXOP.td"
1777
1778 // SSE, MMX and 3DNow! vector support.
1779 include "X86InstrSSE.td"
1780 include "X86InstrMMX.td"
1781 include "X86Instr3DNow.td"
1782
1783 include "X86InstrVMX.td"
1784 include "X86InstrSVM.td"
1785
1786 include "X86InstrTSX.td"
1787
1788 // System instructions.
1789 include "X86InstrSystem.td"
1790
1791 // Compiler Pseudo Instructions and Pat Patterns
1792 include "X86InstrCompiler.td"
1793
1794 //===----------------------------------------------------------------------===//
1795 // Assembler Mnemonic Aliases
1796 //===----------------------------------------------------------------------===//
1797
1798 def : MnemonicAlias<"call", "calll">, Requires<[In32BitMode]>;
1799 def : MnemonicAlias<"call", "callq">, Requires<[In64BitMode]>;
1800
1801 def : MnemonicAlias<"cbw",  "cbtw">;
1802 def : MnemonicAlias<"cwde", "cwtl">;
1803 def : MnemonicAlias<"cwd",  "cwtd">;
1804 def : MnemonicAlias<"cdq", "cltd">;
1805 def : MnemonicAlias<"cdqe", "cltq">;
1806 def : MnemonicAlias<"cqo", "cqto">;
1807
1808 // lret maps to lretl, it is not ambiguous with lretq.
1809 def : MnemonicAlias<"lret", "lretl">;
1810
1811 def : MnemonicAlias<"leavel", "leave">, Requires<[In32BitMode]>;
1812 def : MnemonicAlias<"leaveq", "leave">, Requires<[In64BitMode]>;
1813
1814 def : MnemonicAlias<"loopz", "loope">;
1815 def : MnemonicAlias<"loopnz", "loopne">;
1816
1817 def : MnemonicAlias<"pop", "popl">, Requires<[In32BitMode]>;
1818 def : MnemonicAlias<"pop", "popq">, Requires<[In64BitMode]>;
1819 def : MnemonicAlias<"popf", "popfl">, Requires<[In32BitMode]>;
1820 def : MnemonicAlias<"popf", "popfq">, Requires<[In64BitMode]>;
1821 def : MnemonicAlias<"popfd",  "popfl">;
1822
1823 // FIXME: This is wrong for "push reg".  "push %bx" should turn into pushw in
1824 // all modes.  However: "push (addr)" and "push $42" should default to
1825 // pushl/pushq depending on the current mode.  Similar for "pop %bx"
1826 def : MnemonicAlias<"push", "pushl">, Requires<[In32BitMode]>;
1827 def : MnemonicAlias<"push", "pushq">, Requires<[In64BitMode]>;
1828 def : MnemonicAlias<"pushf", "pushfl">, Requires<[In32BitMode]>;
1829 def : MnemonicAlias<"pushf", "pushfq">, Requires<[In64BitMode]>;
1830 def : MnemonicAlias<"pushfd", "pushfl">;
1831
1832 def : MnemonicAlias<"repe", "rep">;
1833 def : MnemonicAlias<"repz", "rep">;
1834 def : MnemonicAlias<"repnz", "repne">;
1835
1836 def : MnemonicAlias<"retl", "ret">, Requires<[In32BitMode]>;
1837 def : MnemonicAlias<"retq", "ret">, Requires<[In64BitMode]>;
1838
1839 def : MnemonicAlias<"salb", "shlb">;
1840 def : MnemonicAlias<"salw", "shlw">;
1841 def : MnemonicAlias<"sall", "shll">;
1842 def : MnemonicAlias<"salq", "shlq">;
1843
1844 def : MnemonicAlias<"smovb", "movsb">;
1845 def : MnemonicAlias<"smovw", "movsw">;
1846 def : MnemonicAlias<"smovl", "movsl">;
1847 def : MnemonicAlias<"smovq", "movsq">;
1848
1849 def : MnemonicAlias<"ud2a", "ud2">;
1850 def : MnemonicAlias<"verrw", "verr">;
1851
1852 // System instruction aliases.
1853 def : MnemonicAlias<"iret", "iretl">;
1854 def : MnemonicAlias<"sysret", "sysretl">;
1855 def : MnemonicAlias<"sysexit", "sysexitl">;
1856
1857 def : MnemonicAlias<"lgdtl", "lgdt">, Requires<[In32BitMode]>;
1858 def : MnemonicAlias<"lgdtq", "lgdt">, Requires<[In64BitMode]>;
1859 def : MnemonicAlias<"lidtl", "lidt">, Requires<[In32BitMode]>;
1860 def : MnemonicAlias<"lidtq", "lidt">, Requires<[In64BitMode]>;
1861 def : MnemonicAlias<"sgdtl", "sgdt">, Requires<[In32BitMode]>;
1862 def : MnemonicAlias<"sgdtq", "sgdt">, Requires<[In64BitMode]>;
1863 def : MnemonicAlias<"sidtl", "sidt">, Requires<[In32BitMode]>;
1864 def : MnemonicAlias<"sidtq", "sidt">, Requires<[In64BitMode]>;
1865
1866
1867 // Floating point stack aliases.
1868 def : MnemonicAlias<"fcmovz",   "fcmove">;
1869 def : MnemonicAlias<"fcmova",   "fcmovnbe">;
1870 def : MnemonicAlias<"fcmovnae", "fcmovb">;
1871 def : MnemonicAlias<"fcmovna",  "fcmovbe">;
1872 def : MnemonicAlias<"fcmovae",  "fcmovnb">;
1873 def : MnemonicAlias<"fcomip",   "fcompi">;
1874 def : MnemonicAlias<"fildq",    "fildll">;
1875 def : MnemonicAlias<"fistpq",   "fistpll">;
1876 def : MnemonicAlias<"fisttpq",  "fisttpll">;
1877 def : MnemonicAlias<"fldcww",   "fldcw">;
1878 def : MnemonicAlias<"fnstcww", "fnstcw">;
1879 def : MnemonicAlias<"fnstsww", "fnstsw">;
1880 def : MnemonicAlias<"fucomip",  "fucompi">;
1881 def : MnemonicAlias<"fwait",    "wait">;
1882
1883
1884 class CondCodeAlias<string Prefix,string Suffix, string OldCond, string NewCond>
1885   : MnemonicAlias<!strconcat(Prefix, OldCond, Suffix),
1886                   !strconcat(Prefix, NewCond, Suffix)>;
1887
1888 /// IntegerCondCodeMnemonicAlias - This multiclass defines a bunch of
1889 /// MnemonicAlias's that canonicalize the condition code in a mnemonic, for
1890 /// example "setz" -> "sete".
1891 multiclass IntegerCondCodeMnemonicAlias<string Prefix, string Suffix> {
1892   def C   : CondCodeAlias<Prefix, Suffix, "c",   "b">;   // setc   -> setb
1893   def Z   : CondCodeAlias<Prefix, Suffix, "z" ,  "e">;   // setz   -> sete
1894   def NA  : CondCodeAlias<Prefix, Suffix, "na",  "be">;  // setna  -> setbe
1895   def NB  : CondCodeAlias<Prefix, Suffix, "nb",  "ae">;  // setnb  -> setae
1896   def NC  : CondCodeAlias<Prefix, Suffix, "nc",  "ae">;  // setnc  -> setae
1897   def NG  : CondCodeAlias<Prefix, Suffix, "ng",  "le">;  // setng  -> setle
1898   def NL  : CondCodeAlias<Prefix, Suffix, "nl",  "ge">;  // setnl  -> setge
1899   def NZ  : CondCodeAlias<Prefix, Suffix, "nz",  "ne">;  // setnz  -> setne
1900   def PE  : CondCodeAlias<Prefix, Suffix, "pe",  "p">;   // setpe  -> setp
1901   def PO  : CondCodeAlias<Prefix, Suffix, "po",  "np">;  // setpo  -> setnp
1902
1903   def NAE : CondCodeAlias<Prefix, Suffix, "nae", "b">;   // setnae -> setb
1904   def NBE : CondCodeAlias<Prefix, Suffix, "nbe", "a">;   // setnbe -> seta
1905   def NGE : CondCodeAlias<Prefix, Suffix, "nge", "l">;   // setnge -> setl
1906   def NLE : CondCodeAlias<Prefix, Suffix, "nle", "g">;   // setnle -> setg
1907 }
1908
1909 // Aliases for set<CC>
1910 defm : IntegerCondCodeMnemonicAlias<"set", "">;
1911 // Aliases for j<CC>
1912 defm : IntegerCondCodeMnemonicAlias<"j", "">;
1913 // Aliases for cmov<CC>{w,l,q}
1914 defm : IntegerCondCodeMnemonicAlias<"cmov", "w">;
1915 defm : IntegerCondCodeMnemonicAlias<"cmov", "l">;
1916 defm : IntegerCondCodeMnemonicAlias<"cmov", "q">;
1917
1918
1919 //===----------------------------------------------------------------------===//
1920 // Assembler Instruction Aliases
1921 //===----------------------------------------------------------------------===//
1922
1923 // aad/aam default to base 10 if no operand is specified.
1924 def : InstAlias<"aad", (AAD8i8 10)>;
1925 def : InstAlias<"aam", (AAM8i8 10)>;
1926
1927 // Disambiguate the mem/imm form of bt-without-a-suffix as btl.
1928 def : InstAlias<"bt $imm, $mem", (BT32mi8 i32mem:$mem, i32i8imm:$imm)>;
1929
1930 // clr aliases.
1931 def : InstAlias<"clrb $reg", (XOR8rr  GR8 :$reg, GR8 :$reg)>;
1932 def : InstAlias<"clrw $reg", (XOR16rr GR16:$reg, GR16:$reg)>;
1933 def : InstAlias<"clrl $reg", (XOR32rr GR32:$reg, GR32:$reg)>;
1934 def : InstAlias<"clrq $reg", (XOR64rr GR64:$reg, GR64:$reg)>;
1935
1936 // div and idiv aliases for explicit A register.
1937 def : InstAlias<"divb $src, %al",  (DIV8r  GR8 :$src)>;
1938 def : InstAlias<"divw $src, %ax",  (DIV16r GR16:$src)>;
1939 def : InstAlias<"divl $src, %eax", (DIV32r GR32:$src)>;
1940 def : InstAlias<"divq $src, %rax", (DIV64r GR64:$src)>;
1941 def : InstAlias<"divb $src, %al",  (DIV8m  i8mem :$src)>;
1942 def : InstAlias<"divw $src, %ax",  (DIV16m i16mem:$src)>;
1943 def : InstAlias<"divl $src, %eax", (DIV32m i32mem:$src)>;
1944 def : InstAlias<"divq $src, %rax", (DIV64m i64mem:$src)>;
1945 def : InstAlias<"idivb $src, %al",  (IDIV8r  GR8 :$src)>;
1946 def : InstAlias<"idivw $src, %ax",  (IDIV16r GR16:$src)>;
1947 def : InstAlias<"idivl $src, %eax", (IDIV32r GR32:$src)>;
1948 def : InstAlias<"idivq $src, %rax", (IDIV64r GR64:$src)>;
1949 def : InstAlias<"idivb $src, %al",  (IDIV8m  i8mem :$src)>;
1950 def : InstAlias<"idivw $src, %ax",  (IDIV16m i16mem:$src)>;
1951 def : InstAlias<"idivl $src, %eax", (IDIV32m i32mem:$src)>;
1952 def : InstAlias<"idivq $src, %rax", (IDIV64m i64mem:$src)>;
1953
1954
1955
1956 // Various unary fpstack operations default to operating on on ST1.
1957 // For example, "fxch" -> "fxch %st(1)"
1958 def : InstAlias<"faddp",        (ADD_FPrST0  ST1), 0>;
1959 def : InstAlias<"fsubp",        (SUBR_FPrST0 ST1)>;
1960 def : InstAlias<"fsubrp",       (SUB_FPrST0  ST1)>;
1961 def : InstAlias<"fmulp",        (MUL_FPrST0  ST1)>;
1962 def : InstAlias<"fdivp",        (DIVR_FPrST0 ST1)>;
1963 def : InstAlias<"fdivrp",       (DIV_FPrST0  ST1)>;
1964 def : InstAlias<"fxch",         (XCH_F       ST1)>;
1965 def : InstAlias<"fcom",         (COM_FST0r   ST1)>;
1966 def : InstAlias<"fcomp",        (COMP_FST0r  ST1)>;
1967 def : InstAlias<"fcomi",        (COM_FIr     ST1)>;
1968 def : InstAlias<"fcompi",       (COM_FIPr    ST1)>;
1969 def : InstAlias<"fucom",        (UCOM_Fr     ST1)>;
1970 def : InstAlias<"fucomp",       (UCOM_FPr    ST1)>;
1971 def : InstAlias<"fucomi",       (UCOM_FIr    ST1)>;
1972 def : InstAlias<"fucompi",      (UCOM_FIPr   ST1)>;
1973
1974 // Handle fmul/fadd/fsub/fdiv instructions with explicitly written st(0) op.
1975 // For example, "fadd %st(4), %st(0)" -> "fadd %st(4)".  We also disambiguate
1976 // instructions like "fadd %st(0), %st(0)" as "fadd %st(0)" for consistency with
1977 // gas.
1978 multiclass FpUnaryAlias<string Mnemonic, Instruction Inst, bit EmitAlias = 1> {
1979  def : InstAlias<!strconcat(Mnemonic, " $op, %st(0)"),
1980                  (Inst RST:$op), EmitAlias>;
1981  def : InstAlias<!strconcat(Mnemonic, " %st(0), %st(0)"),
1982                  (Inst ST0), EmitAlias>;
1983 }
1984
1985 defm : FpUnaryAlias<"fadd",   ADD_FST0r>;
1986 defm : FpUnaryAlias<"faddp",  ADD_FPrST0, 0>;
1987 defm : FpUnaryAlias<"fsub",   SUB_FST0r>;
1988 defm : FpUnaryAlias<"fsubp",  SUBR_FPrST0>;
1989 defm : FpUnaryAlias<"fsubr",  SUBR_FST0r>;
1990 defm : FpUnaryAlias<"fsubrp", SUB_FPrST0>;
1991 defm : FpUnaryAlias<"fmul",   MUL_FST0r>;
1992 defm : FpUnaryAlias<"fmulp",  MUL_FPrST0>;
1993 defm : FpUnaryAlias<"fdiv",   DIV_FST0r>;
1994 defm : FpUnaryAlias<"fdivp",  DIVR_FPrST0>;
1995 defm : FpUnaryAlias<"fdivr",  DIVR_FST0r>;
1996 defm : FpUnaryAlias<"fdivrp", DIV_FPrST0>;
1997 defm : FpUnaryAlias<"fcomi",   COM_FIr, 0>;
1998 defm : FpUnaryAlias<"fucomi",  UCOM_FIr, 0>;
1999 defm : FpUnaryAlias<"fcompi",   COM_FIPr>;
2000 defm : FpUnaryAlias<"fucompi",  UCOM_FIPr>;
2001
2002
2003 // Handle "f{mulp,addp} st(0), $op" the same as "f{mulp,addp} $op", since they
2004 // commute.  We also allow fdiv[r]p/fsubrp even though they don't commute,
2005 // solely because gas supports it.
2006 def : InstAlias<"faddp %st(0), $op", (ADD_FPrST0 RST:$op), 0>;
2007 def : InstAlias<"fmulp %st(0), $op", (MUL_FPrST0 RST:$op)>;
2008 def : InstAlias<"fsubp %st(0), $op", (SUBR_FPrST0 RST:$op)>;
2009 def : InstAlias<"fsubrp %st(0), $op", (SUB_FPrST0 RST:$op)>;
2010 def : InstAlias<"fdivp %st(0), $op", (DIVR_FPrST0 RST:$op)>;
2011 def : InstAlias<"fdivrp %st(0), $op", (DIV_FPrST0 RST:$op)>;
2012
2013 // We accept "fnstsw %eax" even though it only writes %ax.
2014 def : InstAlias<"fnstsw %eax", (FNSTSW16r)>;
2015 def : InstAlias<"fnstsw %al" , (FNSTSW16r)>;
2016 def : InstAlias<"fnstsw"     , (FNSTSW16r)>;
2017
2018 // lcall and ljmp aliases.  This seems to be an odd mapping in 64-bit mode, but
2019 // this is compatible with what GAS does.
2020 def : InstAlias<"lcall $seg, $off", (FARCALL32i i32imm:$off, i16imm:$seg)>;
2021 def : InstAlias<"ljmp $seg, $off",  (FARJMP32i  i32imm:$off, i16imm:$seg)>;
2022 def : InstAlias<"lcall *$dst",      (FARCALL32m opaque48mem:$dst)>;
2023 def : InstAlias<"ljmp *$dst",       (FARJMP32m  opaque48mem:$dst)>;
2024
2025 // "imul <imm>, B" is an alias for "imul <imm>, B, B".
2026 def : InstAlias<"imulw $imm, $r", (IMUL16rri  GR16:$r, GR16:$r, i16imm:$imm)>;
2027 def : InstAlias<"imulw $imm, $r", (IMUL16rri8 GR16:$r, GR16:$r, i16i8imm:$imm)>;
2028 def : InstAlias<"imull $imm, $r", (IMUL32rri  GR32:$r, GR32:$r, i32imm:$imm)>;
2029 def : InstAlias<"imull $imm, $r", (IMUL32rri8 GR32:$r, GR32:$r, i32i8imm:$imm)>;
2030 def : InstAlias<"imulq $imm, $r",(IMUL64rri32 GR64:$r, GR64:$r,i64i32imm:$imm)>;
2031 def : InstAlias<"imulq $imm, $r", (IMUL64rri8 GR64:$r, GR64:$r, i64i8imm:$imm)>;
2032
2033 // inb %dx -> inb %al, %dx
2034 def : InstAlias<"inb %dx", (IN8rr)>;
2035 def : InstAlias<"inw %dx", (IN16rr)>;
2036 def : InstAlias<"inl %dx", (IN32rr)>;
2037 def : InstAlias<"inb $port", (IN8ri i8imm:$port)>;
2038 def : InstAlias<"inw $port", (IN16ri i8imm:$port)>;
2039 def : InstAlias<"inl $port", (IN32ri i8imm:$port)>;
2040
2041
2042 // jmp and call aliases for lcall and ljmp.  jmp $42,$5 -> ljmp
2043 def : InstAlias<"call $seg, $off",  (FARCALL32i i32imm:$off, i16imm:$seg)>;
2044 def : InstAlias<"jmp $seg, $off",   (FARJMP32i  i32imm:$off, i16imm:$seg)>;
2045 def : InstAlias<"callw $seg, $off", (FARCALL16i i16imm:$off, i16imm:$seg)>;
2046 def : InstAlias<"jmpw $seg, $off",  (FARJMP16i  i16imm:$off, i16imm:$seg)>;
2047 def : InstAlias<"calll $seg, $off", (FARCALL32i i32imm:$off, i16imm:$seg)>;
2048 def : InstAlias<"jmpl $seg, $off",  (FARJMP32i  i32imm:$off, i16imm:$seg)>;
2049
2050 // Force mov without a suffix with a segment and mem to prefer the 'l' form of
2051 // the move.  All segment/mem forms are equivalent, this has the shortest
2052 // encoding.
2053 def : InstAlias<"mov $mem, $seg", (MOV32sm SEGMENT_REG:$seg, i32mem:$mem)>;
2054 def : InstAlias<"mov $seg, $mem", (MOV32ms i32mem:$mem, SEGMENT_REG:$seg)>;
2055
2056 // Match 'movq <largeimm>, <reg>' as an alias for movabsq.
2057 def : InstAlias<"movq $imm, $reg", (MOV64ri GR64:$reg, i64imm:$imm)>;
2058
2059 // Match 'movq GR64, MMX' as an alias for movd.
2060 def : InstAlias<"movq $src, $dst",
2061                 (MMX_MOVD64to64rr VR64:$dst, GR64:$src), 0>;
2062 def : InstAlias<"movq $src, $dst",
2063                 (MMX_MOVD64from64rr GR64:$dst, VR64:$src), 0>;
2064
2065 // movsd with no operands (as opposed to the SSE scalar move of a double) is an
2066 // alias for movsl. (as in rep; movsd)
2067 def : InstAlias<"movsd", (MOVSD)>;
2068
2069 // movsx aliases
2070 def : InstAlias<"movsx $src, $dst", (MOVSX16rr8 GR16:$dst, GR8:$src), 0>;
2071 def : InstAlias<"movsx $src, $dst", (MOVSX16rm8 GR16:$dst, i8mem:$src), 0>;
2072 def : InstAlias<"movsx $src, $dst", (MOVSX32rr8 GR32:$dst, GR8:$src), 0>;
2073 def : InstAlias<"movsx $src, $dst", (MOVSX32rr16 GR32:$dst, GR16:$src), 0>;
2074 def : InstAlias<"movsx $src, $dst", (MOVSX64rr8 GR64:$dst, GR8:$src), 0>;
2075 def : InstAlias<"movsx $src, $dst", (MOVSX64rr16 GR64:$dst, GR16:$src), 0>;
2076 def : InstAlias<"movsx $src, $dst", (MOVSX64rr32 GR64:$dst, GR32:$src), 0>;
2077
2078 // movzx aliases
2079 def : InstAlias<"movzx $src, $dst", (MOVZX16rr8 GR16:$dst, GR8:$src), 0>;
2080 def : InstAlias<"movzx $src, $dst", (MOVZX16rm8 GR16:$dst, i8mem:$src), 0>;
2081 def : InstAlias<"movzx $src, $dst", (MOVZX32rr8 GR32:$dst, GR8:$src), 0>;
2082 def : InstAlias<"movzx $src, $dst", (MOVZX32rr16 GR32:$dst, GR16:$src), 0>;
2083 def : InstAlias<"movzx $src, $dst", (MOVZX64rr8_Q GR64:$dst, GR8:$src), 0>;
2084 def : InstAlias<"movzx $src, $dst", (MOVZX64rr16_Q GR64:$dst, GR16:$src), 0>;
2085 // Note: No GR32->GR64 movzx form.
2086
2087 // outb %dx -> outb %al, %dx
2088 def : InstAlias<"outb %dx", (OUT8rr)>;
2089 def : InstAlias<"outw %dx", (OUT16rr)>;
2090 def : InstAlias<"outl %dx", (OUT32rr)>;
2091 def : InstAlias<"outb $port", (OUT8ir i8imm:$port)>;
2092 def : InstAlias<"outw $port", (OUT16ir i8imm:$port)>;
2093 def : InstAlias<"outl $port", (OUT32ir i8imm:$port)>;
2094
2095 // 'sldt <mem>' can be encoded with either sldtw or sldtq with the same
2096 // effect (both store to a 16-bit mem).  Force to sldtw to avoid ambiguity
2097 // errors, since its encoding is the most compact.
2098 def : InstAlias<"sldt $mem", (SLDT16m i16mem:$mem)>;
2099
2100 // shld/shrd op,op -> shld op, op, CL
2101 def : InstAlias<"shldw $r2, $r1", (SHLD16rrCL GR16:$r1, GR16:$r2)>;
2102 def : InstAlias<"shldl $r2, $r1", (SHLD32rrCL GR32:$r1, GR32:$r2)>;
2103 def : InstAlias<"shldq $r2, $r1", (SHLD64rrCL GR64:$r1, GR64:$r2)>;
2104 def : InstAlias<"shrdw $r2, $r1", (SHRD16rrCL GR16:$r1, GR16:$r2)>;
2105 def : InstAlias<"shrdl $r2, $r1", (SHRD32rrCL GR32:$r1, GR32:$r2)>;
2106 def : InstAlias<"shrdq $r2, $r1", (SHRD64rrCL GR64:$r1, GR64:$r2)>;
2107
2108 def : InstAlias<"shldw $reg, $mem", (SHLD16mrCL i16mem:$mem, GR16:$reg)>;
2109 def : InstAlias<"shldl $reg, $mem", (SHLD32mrCL i32mem:$mem, GR32:$reg)>;
2110 def : InstAlias<"shldq $reg, $mem", (SHLD64mrCL i64mem:$mem, GR64:$reg)>;
2111 def : InstAlias<"shrdw $reg, $mem", (SHRD16mrCL i16mem:$mem, GR16:$reg)>;
2112 def : InstAlias<"shrdl $reg, $mem", (SHRD32mrCL i32mem:$mem, GR32:$reg)>;
2113 def : InstAlias<"shrdq $reg, $mem", (SHRD64mrCL i64mem:$mem, GR64:$reg)>;
2114
2115 /*  FIXME: This is disabled because the asm matcher is currently incapable of
2116  *  matching a fixed immediate like $1.
2117 // "shl X, $1" is an alias for "shl X".
2118 multiclass ShiftRotateByOneAlias<string Mnemonic, string Opc> {
2119  def : InstAlias<!strconcat(Mnemonic, "b $op, $$1"),
2120                  (!cast<Instruction>(!strconcat(Opc, "8r1")) GR8:$op)>;
2121  def : InstAlias<!strconcat(Mnemonic, "w $op, $$1"),
2122                  (!cast<Instruction>(!strconcat(Opc, "16r1")) GR16:$op)>;
2123  def : InstAlias<!strconcat(Mnemonic, "l $op, $$1"),
2124                  (!cast<Instruction>(!strconcat(Opc, "32r1")) GR32:$op)>;
2125  def : InstAlias<!strconcat(Mnemonic, "q $op, $$1"),
2126                  (!cast<Instruction>(!strconcat(Opc, "64r1")) GR64:$op)>;
2127  def : InstAlias<!strconcat(Mnemonic, "b $op, $$1"),
2128                  (!cast<Instruction>(!strconcat(Opc, "8m1")) i8mem:$op)>;
2129  def : InstAlias<!strconcat(Mnemonic, "w $op, $$1"),
2130                  (!cast<Instruction>(!strconcat(Opc, "16m1")) i16mem:$op)>;
2131  def : InstAlias<!strconcat(Mnemonic, "l $op, $$1"),
2132                  (!cast<Instruction>(!strconcat(Opc, "32m1")) i32mem:$op)>;
2133  def : InstAlias<!strconcat(Mnemonic, "q $op, $$1"),
2134                  (!cast<Instruction>(!strconcat(Opc, "64m1")) i64mem:$op)>;
2135 }
2136
2137 defm : ShiftRotateByOneAlias<"rcl", "RCL">;
2138 defm : ShiftRotateByOneAlias<"rcr", "RCR">;
2139 defm : ShiftRotateByOneAlias<"rol", "ROL">;
2140 defm : ShiftRotateByOneAlias<"ror", "ROR">;
2141 FIXME */
2142
2143 // test: We accept "testX <reg>, <mem>" and "testX <mem>, <reg>" as synonyms.
2144 def : InstAlias<"testb $val, $mem", (TEST8rm  GR8 :$val, i8mem :$mem)>;
2145 def : InstAlias<"testw $val, $mem", (TEST16rm GR16:$val, i16mem:$mem)>;
2146 def : InstAlias<"testl $val, $mem", (TEST32rm GR32:$val, i32mem:$mem)>;
2147 def : InstAlias<"testq $val, $mem", (TEST64rm GR64:$val, i64mem:$mem)>;
2148
2149 // xchg: We accept "xchgX <reg>, <mem>" and "xchgX <mem>, <reg>" as synonyms.
2150 def : InstAlias<"xchgb $mem, $val", (XCHG8rm  GR8 :$val, i8mem :$mem)>;
2151 def : InstAlias<"xchgw $mem, $val", (XCHG16rm GR16:$val, i16mem:$mem)>;
2152 def : InstAlias<"xchgl $mem, $val", (XCHG32rm GR32:$val, i32mem:$mem)>;
2153 def : InstAlias<"xchgq $mem, $val", (XCHG64rm GR64:$val, i64mem:$mem)>;
2154
2155 // xchg: We accept "xchgX <reg>, %eax" and "xchgX %eax, <reg>" as synonyms.
2156 def : InstAlias<"xchgw %ax, $src", (XCHG16ar GR16:$src)>;
2157 def : InstAlias<"xchgl %eax, $src", (XCHG32ar GR32:$src)>, Requires<[In32BitMode]>;
2158 def : InstAlias<"xchgl %eax, $src", (XCHG32ar64 GR32_NOAX:$src)>, Requires<[In64BitMode]>;
2159 def : InstAlias<"xchgq %rax, $src", (XCHG64ar GR64:$src)>;