ARM cortex-a8 doesn't do vmla/vmls well. disable them by default for that cpu
[oota-llvm.git] / lib / Target / ARM / ARMSubtarget.cpp
1 //===-- ARMSubtarget.cpp - ARM Subtarget Information ------------*- C++ -*-===//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file implements the ARM specific subclass of TargetSubtarget.
11 //
12 //===----------------------------------------------------------------------===//
13
14 #include "ARMSubtarget.h"
15 #include "ARMGenSubtarget.inc"
16 #include "llvm/GlobalValue.h"
17 #include "llvm/Target/TargetOptions.h"
18 #include "llvm/Support/CommandLine.h"
19 #include "llvm/ADT/SmallVector.h"
20 using namespace llvm;
21
22 static cl::opt<bool>
23 ReserveR9("arm-reserve-r9", cl::Hidden,
24           cl::desc("Reserve R9, making it unavailable as GPR"));
25 static cl::opt<bool>
26 UseNEONFP("arm-use-neon-fp",
27           cl::desc("Use NEON for single-precision FP"),
28           cl::init(false), cl::Hidden);
29 static cl::opt<bool>
30 UseVMLxInstructions("arm-use-vmlx",
31                     cl::desc("Use VFP vmla and vmls instructions"),
32                     cl::init(true), cl::Hidden);
33
34 static cl::opt<bool>
35 UseMOVT("arm-use-movt",
36         cl::init(true), cl::Hidden);
37
38 ARMSubtarget::ARMSubtarget(const std::string &TT, const std::string &FS,
39                            bool isT)
40   : ARMArchVersion(V4)
41   , ARMFPUType(None)
42   , UseNEONForSinglePrecisionFP(UseNEONFP)
43   , UseVMLx(UseVMLxInstructions)
44   , IsThumb(isT)
45   , ThumbMode(Thumb1)
46   , PostRAScheduler(false)
47   , IsR9Reserved(ReserveR9)
48   , UseMovt(UseMOVT)
49   , HasFP16(false)
50   , stackAlignment(4)
51   , CPUString("generic")
52   , TargetType(isELF) // Default to ELF unless otherwise specified.
53   , TargetABI(ARM_ABI_APCS) {
54   // default to soft float ABI
55   if (FloatABIType == FloatABI::Default)
56     FloatABIType = FloatABI::Soft;
57
58   // Determine default and user specified characteristics
59
60   // Parse features string.
61   CPUString = ParseSubtargetFeatures(FS, CPUString);
62
63   // When no arch is specified either by CPU or by attributes, make the default
64   // ARMv4T.
65   if (CPUString == "generic" && (FS.empty() || FS == "generic"))
66     ARMArchVersion = V4T;
67
68   // Set the boolean corresponding to the current target triple, or the default
69   // if one cannot be determined, to true.
70   unsigned Len = TT.length();
71   unsigned Idx = 0;
72
73   if (Len >= 5 && TT.substr(0, 4) == "armv")
74     Idx = 4;
75   else if (Len >= 6 && TT.substr(0, 5) == "thumb") {
76     IsThumb = true;
77     if (Len >= 7 && TT[5] == 'v')
78       Idx = 6;
79   }
80   if (Idx) {
81     unsigned SubVer = TT[Idx];
82     if (SubVer >= '7' && SubVer <= '9') {
83       ARMArchVersion = V7A;
84     } else if (SubVer == '6') {
85       ARMArchVersion = V6;
86       if (Len >= Idx+3 && TT[Idx+1] == 't' && TT[Idx+2] == '2')
87         ARMArchVersion = V6T2;
88     } else if (SubVer == '5') {
89       ARMArchVersion = V5T;
90       if (Len >= Idx+3 && TT[Idx+1] == 't' && TT[Idx+2] == 'e')
91         ARMArchVersion = V5TE;
92     } else if (SubVer == '4') {
93       if (Len >= Idx+2 && TT[Idx+1] == 't')
94         ARMArchVersion = V4T;
95       else
96         ARMArchVersion = V4;
97     }
98   }
99
100   // Thumb2 implies at least V6T2.
101   if (ARMArchVersion >= V6T2)
102     ThumbMode = Thumb2;
103   else if (ThumbMode >= Thumb2)
104     ARMArchVersion = V6T2;
105
106   if (Len >= 10) {
107     if (TT.find("-darwin") != std::string::npos)
108       // arm-darwin
109       TargetType = isDarwin;
110   }
111
112   if (TT.find("eabi") != std::string::npos)
113     TargetABI = ARM_ABI_AAPCS;
114
115   if (isAAPCS_ABI())
116     stackAlignment = 8;
117
118   if (isTargetDarwin())
119     IsR9Reserved = ReserveR9 | (ARMArchVersion < V6);
120
121   if (!isThumb() || hasThumb2())
122     PostRAScheduler = true;
123
124   // Set CPU specific features.
125   if (CPUString == "cortex-a8") {
126     // On Cortex-a8, it's faster to perform some single-precision FP
127     // operations with NEON instructions.
128     if (UseNEONFP.getPosition() == 0)
129       UseNEONForSinglePrecisionFP = true;
130     // The VFP vlma and vlms instructions don't play nicely with others;
131     // disable them.
132     // FIXME: This may be true for other variants as well. Get benchmark
133     // numbers and add them if determined that's the case.
134     if (UseVMLxInstructions.getPosition() == 0)
135       UseVMLx = false;
136   }
137 }
138
139 /// GVIsIndirectSymbol - true if the GV will be accessed via an indirect symbol.
140 bool
141 ARMSubtarget::GVIsIndirectSymbol(GlobalValue *GV, Reloc::Model RelocM) const {
142   if (RelocM == Reloc::Static)
143     return false;
144
145   // Materializable GVs (in JIT lazy compilation mode) do not require an extra
146   // load from stub.
147   bool isDecl = GV->isDeclaration() && !GV->isMaterializable();
148
149   if (!isTargetDarwin()) {
150     // Extra load is needed for all externally visible.
151     if (GV->hasLocalLinkage() || GV->hasHiddenVisibility())
152       return false;
153     return true;
154   } else {
155     if (RelocM == Reloc::PIC_) {
156       // If this is a strong reference to a definition, it is definitely not
157       // through a stub.
158       if (!isDecl && !GV->isWeakForLinker())
159         return false;
160
161       // Unless we have a symbol with hidden visibility, we have to go through a
162       // normal $non_lazy_ptr stub because this symbol might be resolved late.
163       if (!GV->hasHiddenVisibility())  // Non-hidden $non_lazy_ptr reference.
164         return true;
165
166       // If symbol visibility is hidden, we have a stub for common symbol
167       // references and external declarations.
168       if (isDecl || GV->hasCommonLinkage())
169         // Hidden $non_lazy_ptr reference.
170         return true;
171
172       return false;
173     } else {
174       // If this is a strong reference to a definition, it is definitely not
175       // through a stub.
176       if (!isDecl && !GV->isWeakForLinker())
177         return false;
178     
179       // Unless we have a symbol with hidden visibility, we have to go through a
180       // normal $non_lazy_ptr stub because this symbol might be resolved late.
181       if (!GV->hasHiddenVisibility())  // Non-hidden $non_lazy_ptr reference.
182         return true;
183     }
184   }
185
186   return false;
187 }
188
189 bool ARMSubtarget::enablePostRAScheduler(
190            CodeGenOpt::Level OptLevel,
191            TargetSubtarget::AntiDepBreakMode& Mode,
192            RegClassVector& CriticalPathRCs) const {
193   Mode = TargetSubtarget::ANTIDEP_CRITICAL;
194   CriticalPathRCs.clear();
195   CriticalPathRCs.push_back(&ARM::GPRRegClass);
196   return PostRAScheduler && OptLevel >= CodeGenOpt::Default;
197 }