Update CPU capabilities for AMD machines
[oota-llvm.git] / lib / Target / X86 / X86Subtarget.h
1 //=====---- X86Subtarget.h - Define Subtarget for the X86 -----*- C++ -*--====//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file declares the X86 specific subclass of TargetSubtarget.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #ifndef X86SUBTARGET_H
15 #define X86SUBTARGET_H
16
17 #include "llvm/Target/TargetSubtarget.h"
18 #include <string>
19
20 namespace llvm {
21 class Module;
22 class GlobalValue;
23 class TargetMachine;
24   
25 namespace PICStyles {
26 enum Style {
27   Stub, GOT, RIPRel, WinPIC, None
28 };
29 }
30
31 class X86Subtarget : public TargetSubtarget {
32 public:
33   enum AsmWriterFlavorTy {
34     // Note: This numbering has to match the GCC assembler dialects for inline
35     // asm alternatives to work right.
36     ATT = 0, Intel = 1, Unset
37   };
38 protected:
39   enum X86SSEEnum {
40     NoMMXSSE, MMX, SSE1, SSE2, SSE3, SSSE3, SSE41, SSE42
41   };
42
43   enum X863DNowEnum {
44     NoThreeDNow, ThreeDNow, ThreeDNowA
45   };
46
47   /// AsmFlavor - Which x86 asm dialect to use.
48   ///
49   AsmWriterFlavorTy AsmFlavor;
50
51   /// PICStyle - Which PIC style to use
52   ///
53   PICStyles::Style PICStyle;
54   
55   /// X86SSELevel - MMX, SSE1, SSE2, SSE3, SSSE3, SSE41, SSE42, or
56   /// none supported.
57   X86SSEEnum X86SSELevel;
58
59   /// X863DNowLevel - 3DNow or 3DNow Athlon, or none supported.
60   ///
61   X863DNowEnum X863DNowLevel;
62
63   /// HasX86_64 - True if the processor supports X86-64 instructions.
64   ///
65   bool HasX86_64;
66
67   /// IsBTMemSlow - True if BT (bit test) of memory instructions are slow.
68   bool IsBTMemSlow;
69   
70   /// HasSSE4A - True if the processor supports SSE4A instructions.
71   bool HasSSE4A;
72
73   /// DarwinVers - Nonzero if this is a darwin platform: the numeric
74   /// version of the platform, e.g. 8 = 10.4 (Tiger), 9 = 10.5 (Leopard), etc.
75   unsigned char DarwinVers; // Is any darwin-x86 platform.
76
77   /// isLinux - true if this is a "linux" platform.
78   bool IsLinux;
79
80   /// stackAlignment - The minimum alignment known to hold of the stack frame on
81   /// entry to the function and which must be maintained by every function.
82   unsigned stackAlignment;
83
84   /// Max. memset / memcpy size that is turned into rep/movs, rep/stos ops.
85   ///
86   unsigned MaxInlineSizeThreshold;
87
88 private:
89   /// Is64Bit - True if the processor supports 64-bit instructions and module
90   /// pointer size is 64 bit.
91   bool Is64Bit;
92
93 public:
94   enum {
95     isELF, isCygwin, isDarwin, isWindows, isMingw
96   } TargetType;
97
98   /// This constructor initializes the data members to match that
99   /// of the specified module.
100   ///
101   X86Subtarget(const Module &M, const std::string &FS, bool is64Bit);
102
103   /// getStackAlignment - Returns the minimum alignment known to hold of the
104   /// stack frame on entry to the function and which must be maintained by every
105   /// function for this subtarget.
106   unsigned getStackAlignment() const { return stackAlignment; }
107
108   /// getMaxInlineSizeThreshold - Returns the maximum memset / memcpy size
109   /// that still makes it profitable to inline the call.
110   unsigned getMaxInlineSizeThreshold() const { return MaxInlineSizeThreshold; }
111
112   /// ParseSubtargetFeatures - Parses features string setting specified
113   /// subtarget options.  Definition of function is auto generated by tblgen.
114   std::string ParseSubtargetFeatures(const std::string &FS,
115                                      const std::string &CPU);
116
117   /// AutoDetectSubtargetFeatures - Auto-detect CPU features using CPUID
118   /// instruction.
119   void AutoDetectSubtargetFeatures();
120
121   bool is64Bit() const { return Is64Bit; }
122
123   PICStyles::Style getPICStyle() const { return PICStyle; }
124   void setPICStyle(PICStyles::Style Style)  { PICStyle = Style; }
125
126   bool hasMMX() const { return X86SSELevel >= MMX; }
127   bool hasSSE1() const { return X86SSELevel >= SSE1; }
128   bool hasSSE2() const { return X86SSELevel >= SSE2; }
129   bool hasSSE3() const { return X86SSELevel >= SSE3; }
130   bool hasSSSE3() const { return X86SSELevel >= SSSE3; }
131   bool hasSSE41() const { return X86SSELevel >= SSE41; }
132   bool hasSSE42() const { return X86SSELevel >= SSE42; }
133   bool hasSSE4A() const { return HasSSE4A; }
134   bool has3DNow() const { return X863DNowLevel >= ThreeDNow; }
135   bool has3DNowA() const { return X863DNowLevel >= ThreeDNowA; }
136
137   bool isBTMemSlow() const { return IsBTMemSlow; }
138
139   unsigned getAsmFlavor() const {
140     return AsmFlavor != Unset ? unsigned(AsmFlavor) : 0;
141   }
142
143   bool isFlavorAtt() const { return AsmFlavor == ATT; }
144   bool isFlavorIntel() const { return AsmFlavor == Intel; }
145
146   bool isTargetDarwin() const { return TargetType == isDarwin; }
147   bool isTargetELF() const {
148     return TargetType == isELF;
149   }
150   bool isTargetWindows() const { return TargetType == isWindows; }
151   bool isTargetMingw() const { return TargetType == isMingw; }
152   bool isTargetCygMing() const { return (TargetType == isMingw ||
153                                          TargetType == isCygwin); }
154   bool isTargetCygwin() const { return TargetType == isCygwin; }
155   bool isTargetWin64() const {
156     return (Is64Bit && (TargetType == isMingw || TargetType == isWindows));
157   }
158
159   std::string getDataLayout() const {
160     const char *p;
161     if (is64Bit())
162       p = "e-p:64:64-s:64-f64:64:64-i64:64:64-f80:128:128";
163     else {
164       if (isTargetDarwin())
165         p = "e-p:32:32-f64:32:64-i64:32:64-f80:128:128";
166       else
167         p = "e-p:32:32-f64:32:64-i64:32:64-f80:32:32";
168     }
169     return std::string(p);
170   }
171
172   bool isPICStyleSet() const { return PICStyle != PICStyles::None; }
173   bool isPICStyleGOT() const { return PICStyle == PICStyles::GOT; }
174   bool isPICStyleStub() const { return PICStyle == PICStyles::Stub; }
175   bool isPICStyleRIPRel() const { return PICStyle == PICStyles::RIPRel; }
176   bool isPICStyleWinPIC() const { return PICStyle == PICStyles:: WinPIC; }
177   
178   /// getDarwinVers - Return the darwin version number, 8 = tiger, 9 = leopard.
179   unsigned getDarwinVers() const { return DarwinVers; }
180   
181   /// isLinux - Return true if the target is "Linux".
182   bool isLinux() const { return IsLinux; }
183
184   /// True if accessing the GV requires an extra load. For Windows, dllimported
185   /// symbols are indirect, loading the value at address GV rather then the
186   /// value of GV itself. This means that the GlobalAddress must be in the base
187   /// or index register of the address, not the GV offset field.
188   bool GVRequiresExtraLoad(const GlobalValue* GV, const TargetMachine& TM,
189                            bool isDirectCall) const;
190
191   /// True if accessing the GV requires a register.  This is a superset of the
192   /// cases where GVRequiresExtraLoad is true.  Some variations of PIC require
193   /// a register, but not an extra load.
194   bool GVRequiresRegister(const GlobalValue* GV, const TargetMachine& TM,
195                            bool isDirectCall) const;
196
197   /// IsLegalToCallImmediateAddr - Return true if the subtarget allows calls
198   /// to immediate address.
199   bool IsLegalToCallImmediateAddr(const TargetMachine &TM) const;
200
201   /// This function returns the name of a function which has an interface
202   /// like the non-standard bzero function, if such a function exists on
203   /// the current subtarget and it is considered prefereable over
204   /// memset with zero passed as the second argument. Otherwise it
205   /// returns null.
206   const char *getBZeroEntry() const;
207
208   /// getSpecialAddressLatency - For targets where it is beneficial to
209   /// backschedule instructions that compute addresses, return a value
210   /// indicating the number of scheduling cycles of backscheduling that
211   /// should be attempted.
212   unsigned getSpecialAddressLatency() const;
213 };
214
215 namespace X86 {
216   /// GetCpuIDAndInfo - Execute the specified cpuid and return the 4 values in
217   /// the specified arguments.  If we can't run cpuid on the host, return true.
218   bool GetCpuIDAndInfo(unsigned value, unsigned *rEAX, unsigned *rEBX,
219                        unsigned *rECX, unsigned *rEDX);
220 }
221
222 } // End llvm namespace
223
224 #endif