68d4a55fee41d13acb6eae2000faf3d1f89e248b
[oota-llvm.git] / lib / Target / AArch64 / AArch64CollectLOH.cpp
1 //===---------- AArch64CollectLOH.cpp - AArch64 collect LOH pass --*- C++ -*-=//
2 //
3 //                     The LLVM Compiler Infrastructure
4 //
5 // This file is distributed under the University of Illinois Open Source
6 // License. See LICENSE.TXT for details.
7 //
8 //===----------------------------------------------------------------------===//
9 //
10 // This file contains a pass that collect the Linker Optimization Hint (LOH).
11 // This pass should be run at the very end of the compilation flow, just before
12 // assembly printer.
13 // To be useful for the linker, the LOH must be printed into the assembly file.
14 //
15 // A LOH describes a sequence of instructions that may be optimized by the
16 // linker.
17 // This same sequence cannot be optimized by the compiler because some of
18 // the information will be known at link time.
19 // For instance, consider the following sequence:
20 //     L1: adrp xA, sym@PAGE
21 //     L2: add xB, xA, sym@PAGEOFF
22 //     L3: ldr xC, [xB, #imm]
23 // This sequence can be turned into:
24 // A literal load if sym@PAGE + sym@PAGEOFF + #imm - address(L3) is < 1MB:
25 //     L3: ldr xC, sym+#imm
26 // It may also be turned into either the following more efficient
27 // code sequences:
28 // - If sym@PAGEOFF + #imm fits the encoding space of L3.
29 //     L1: adrp xA, sym@PAGE
30 //     L3: ldr xC, [xB, sym@PAGEOFF + #imm]
31 // - If sym@PAGE + sym@PAGEOFF - address(L1) < 1MB:
32 //     L1: adr xA, sym
33 //     L3: ldr xC, [xB, #imm]
34 //
35 // To be valid a LOH must meet all the requirements needed by all the related
36 // possible linker transformations.
37 // For instance, using the running example, the constraints to emit
38 // ".loh AdrpAddLdr" are:
39 // - L1, L2, and L3 instructions are of the expected type, i.e.,
40 //   respectively ADRP, ADD (immediate), and LD.
41 // - The result of L1 is used only by L2.
42 // - The register argument (xA) used in the ADD instruction is defined
43 //   only by L1.
44 // - The result of L2 is used only by L3.
45 // - The base address (xB) in L3 is defined only L2.
46 // - The ADRP in L1 and the ADD in L2 must reference the same symbol using
47 //   @PAGE/@PAGEOFF with no additional constants
48 //
49 // Currently supported LOHs are:
50 // * So called non-ADRP-related:
51 //   - .loh AdrpAddLdr L1, L2, L3:
52 //     L1: adrp xA, sym@PAGE
53 //     L2: add xB, xA, sym@PAGEOFF
54 //     L3: ldr xC, [xB, #imm]
55 //   - .loh AdrpLdrGotLdr L1, L2, L3:
56 //     L1: adrp xA, sym@GOTPAGE
57 //     L2: ldr xB, [xA, sym@GOTPAGEOFF]
58 //     L3: ldr xC, [xB, #imm]
59 //   - .loh AdrpLdr L1, L3:
60 //     L1: adrp xA, sym@PAGE
61 //     L3: ldr xC, [xA, sym@PAGEOFF]
62 //   - .loh AdrpAddStr L1, L2, L3:
63 //     L1: adrp xA, sym@PAGE
64 //     L2: add xB, xA, sym@PAGEOFF
65 //     L3: str xC, [xB, #imm]
66 //   - .loh AdrpLdrGotStr L1, L2, L3:
67 //     L1: adrp xA, sym@GOTPAGE
68 //     L2: ldr xB, [xA, sym@GOTPAGEOFF]
69 //     L3: str xC, [xB, #imm]
70 //   - .loh AdrpAdd L1, L2:
71 //     L1: adrp xA, sym@PAGE
72 //     L2: add xB, xA, sym@PAGEOFF
73 //   For all these LOHs, L1, L2, L3 form a simple chain:
74 //   L1 result is used only by L2 and L2 result by L3.
75 //   L3 LOH-related argument is defined only by L2 and L2 LOH-related argument
76 //   by L1.
77 // All these LOHs aim at using more efficient load/store patterns by folding
78 // some instructions used to compute the address directly into the load/store.
79 //
80 // * So called ADRP-related:
81 //  - .loh AdrpAdrp L2, L1:
82 //    L2: ADRP xA, sym1@PAGE
83 //    L1: ADRP xA, sym2@PAGE
84 //    L2 dominates L1 and xA is not redifined between L2 and L1
85 // This LOH aims at getting rid of redundant ADRP instructions.
86 //
87 // The overall design for emitting the LOHs is:
88 // 1. AArch64CollectLOH (this pass) records the LOHs in the AArch64FunctionInfo.
89 // 2. AArch64AsmPrinter reads the LOHs from AArch64FunctionInfo and it:
90 //     1. Associates them a label.
91 //     2. Emits them in a MCStreamer (EmitLOHDirective).
92 //         - The MCMachOStreamer records them into the MCAssembler.
93 //         - The MCAsmStreamer prints them.
94 //         - Other MCStreamers ignore them.
95 //     3. Closes the MCStreamer:
96 //         - The MachObjectWriter gets them from the MCAssembler and writes
97 //           them in the object file.
98 //         - Other ObjectWriters ignore them.
99 //===----------------------------------------------------------------------===//
100
101 #include "AArch64.h"
102 #include "AArch64InstrInfo.h"
103 #include "AArch64MachineFunctionInfo.h"
104 #include "AArch64Subtarget.h"
105 #include "MCTargetDesc/AArch64AddressingModes.h"
106 #include "llvm/ADT/BitVector.h"
107 #include "llvm/ADT/DenseMap.h"
108 #include "llvm/ADT/MapVector.h"
109 #include "llvm/ADT/SetVector.h"
110 #include "llvm/ADT/SmallVector.h"
111 #include "llvm/ADT/Statistic.h"
112 #include "llvm/CodeGen/MachineBasicBlock.h"
113 #include "llvm/CodeGen/MachineDominators.h"
114 #include "llvm/CodeGen/MachineFunctionPass.h"
115 #include "llvm/CodeGen/MachineInstr.h"
116 #include "llvm/CodeGen/MachineInstrBuilder.h"
117 #include "llvm/Support/CommandLine.h"
118 #include "llvm/Support/Debug.h"
119 #include "llvm/Support/ErrorHandling.h"
120 #include "llvm/Support/raw_ostream.h"
121 #include "llvm/Target/TargetInstrInfo.h"
122 #include "llvm/Target/TargetMachine.h"
123 #include "llvm/Target/TargetRegisterInfo.h"
124 using namespace llvm;
125
126 #define DEBUG_TYPE "aarch64-collect-loh"
127
128 static cl::opt<bool>
129 PreCollectRegister("aarch64-collect-loh-pre-collect-register", cl::Hidden,
130                    cl::desc("Restrict analysis to registers invovled"
131                             " in LOHs"),
132                    cl::init(true));
133
134 static cl::opt<bool>
135 BasicBlockScopeOnly("aarch64-collect-loh-bb-only", cl::Hidden,
136                     cl::desc("Restrict analysis at basic block scope"),
137                     cl::init(true));
138
139 STATISTIC(NumADRPSimpleCandidate,
140           "Number of simplifiable ADRP dominate by another");
141 STATISTIC(NumADRPComplexCandidate2,
142           "Number of simplifiable ADRP reachable by 2 defs");
143 STATISTIC(NumADRPComplexCandidate3,
144           "Number of simplifiable ADRP reachable by 3 defs");
145 STATISTIC(NumADRPComplexCandidateOther,
146           "Number of simplifiable ADRP reachable by 4 or more defs");
147 STATISTIC(NumADDToSTRWithImm,
148           "Number of simplifiable STR with imm reachable by ADD");
149 STATISTIC(NumLDRToSTRWithImm,
150           "Number of simplifiable STR with imm reachable by LDR");
151 STATISTIC(NumADDToSTR, "Number of simplifiable STR reachable by ADD");
152 STATISTIC(NumLDRToSTR, "Number of simplifiable STR reachable by LDR");
153 STATISTIC(NumADDToLDRWithImm,
154           "Number of simplifiable LDR with imm reachable by ADD");
155 STATISTIC(NumLDRToLDRWithImm,
156           "Number of simplifiable LDR with imm reachable by LDR");
157 STATISTIC(NumADDToLDR, "Number of simplifiable LDR reachable by ADD");
158 STATISTIC(NumLDRToLDR, "Number of simplifiable LDR reachable by LDR");
159 STATISTIC(NumADRPToLDR, "Number of simplifiable LDR reachable by ADRP");
160 STATISTIC(NumCplxLvl1, "Number of complex case of level 1");
161 STATISTIC(NumTooCplxLvl1, "Number of too complex case of level 1");
162 STATISTIC(NumCplxLvl2, "Number of complex case of level 2");
163 STATISTIC(NumTooCplxLvl2, "Number of too complex case of level 2");
164 STATISTIC(NumADRSimpleCandidate, "Number of simplifiable ADRP + ADD");
165 STATISTIC(NumADRComplexCandidate, "Number of too complex ADRP + ADD");
166
167 namespace llvm {
168 void initializeAArch64CollectLOHPass(PassRegistry &);
169 }
170
171 #define AARCH64_COLLECT_LOH_NAME "AArch64 Collect Linker Optimization Hint (LOH)"
172
173 namespace {
174 struct AArch64CollectLOH : public MachineFunctionPass {
175   static char ID;
176   AArch64CollectLOH() : MachineFunctionPass(ID) {
177     initializeAArch64CollectLOHPass(*PassRegistry::getPassRegistry());
178   }
179
180   bool runOnMachineFunction(MachineFunction &MF) override;
181
182   const char *getPassName() const override {
183     return AARCH64_COLLECT_LOH_NAME;
184   }
185
186   void getAnalysisUsage(AnalysisUsage &AU) const override {
187     AU.setPreservesAll();
188     MachineFunctionPass::getAnalysisUsage(AU);
189     AU.addRequired<MachineDominatorTree>();
190   }
191
192 private:
193 };
194
195 /// A set of MachineInstruction.
196 typedef SetVector<const MachineInstr *> SetOfMachineInstr;
197 /// Map a basic block to a set of instructions per register.
198 /// This is used to represent the exposed uses of a basic block
199 /// per register.
200 typedef MapVector<const MachineBasicBlock *,
201                   std::unique_ptr<SetOfMachineInstr[]>>
202 BlockToSetOfInstrsPerColor;
203 /// Map a basic block to an instruction per register.
204 /// This is used to represent the live-out definitions of a basic block
205 /// per register.
206 typedef MapVector<const MachineBasicBlock *,
207                   std::unique_ptr<const MachineInstr *[]>>
208 BlockToInstrPerColor;
209 /// Map an instruction to a set of instructions. Used to represent the
210 /// mapping def to reachable uses or use to definitions.
211 typedef MapVector<const MachineInstr *, SetOfMachineInstr> InstrToInstrs;
212 /// Map a basic block to a BitVector.
213 /// This is used to record the kill registers per basic block.
214 typedef MapVector<const MachineBasicBlock *, BitVector> BlockToRegSet;
215
216 /// Map a register to a dense id.
217 typedef DenseMap<unsigned, unsigned> MapRegToId;
218 /// Map a dense id to a register. Used for debug purposes.
219 typedef SmallVector<unsigned, 32> MapIdToReg;
220 } // end anonymous namespace.
221
222 char AArch64CollectLOH::ID = 0;
223
224 INITIALIZE_PASS_BEGIN(AArch64CollectLOH, "aarch64-collect-loh",
225                       AARCH64_COLLECT_LOH_NAME, false, false)
226 INITIALIZE_PASS_DEPENDENCY(MachineDominatorTree)
227 INITIALIZE_PASS_END(AArch64CollectLOH, "aarch64-collect-loh",
228                     AARCH64_COLLECT_LOH_NAME, false, false)
229
230 /// Given a couple (MBB, reg) get the corresponding set of instruction from
231 /// the given "sets".
232 /// If this couple does not reference any set, an empty set is added to "sets"
233 /// for this couple and returned.
234 /// \param nbRegs is used internally allocate some memory. It must be consistent
235 /// with the way sets is used.
236 static SetOfMachineInstr &getSet(BlockToSetOfInstrsPerColor &sets,
237                                  const MachineBasicBlock &MBB, unsigned reg,
238                                  unsigned nbRegs) {
239   SetOfMachineInstr *result;
240   BlockToSetOfInstrsPerColor::iterator it = sets.find(&MBB);
241   if (it != sets.end())
242     result = it->second.get();
243   else
244     result = (sets[&MBB] = make_unique<SetOfMachineInstr[]>(nbRegs)).get();
245
246   return result[reg];
247 }
248
249 /// Given a couple (reg, MI) get the corresponding set of instructions from the
250 /// the given "sets".
251 /// This is used to get the uses record in sets of a definition identified by
252 /// MI and reg, i.e., MI defines reg.
253 /// If the couple does not reference anything, an empty set is added to
254 /// "sets[reg]".
255 /// \pre set[reg] is valid.
256 static SetOfMachineInstr &getUses(InstrToInstrs *sets, unsigned reg,
257                                   const MachineInstr &MI) {
258   return sets[reg][&MI];
259 }
260
261 /// Same as getUses but does not modify the input map: sets.
262 /// \return NULL if the couple (reg, MI) is not in sets.
263 static const SetOfMachineInstr *getUses(const InstrToInstrs *sets, unsigned reg,
264                                         const MachineInstr &MI) {
265   InstrToInstrs::const_iterator Res = sets[reg].find(&MI);
266   if (Res != sets[reg].end())
267     return &(Res->second);
268   return nullptr;
269 }
270
271 /// Initialize the reaching definition algorithm:
272 /// For each basic block BB in MF, record:
273 /// - its kill set.
274 /// - its reachable uses (uses that are exposed to BB's predecessors).
275 /// - its the generated definitions.
276 /// \param DummyOp if not NULL, specifies a Dummy Operation to be added to
277 /// the list of uses of exposed defintions.
278 /// \param ADRPMode specifies to only consider ADRP instructions for generated
279 /// definition. It also consider definitions of ADRP instructions as uses and
280 /// ignore other uses. The ADRPMode is used to collect the information for LHO
281 /// that involve ADRP operation only.
282 static void initReachingDef(const MachineFunction &MF,
283                             InstrToInstrs *ColorOpToReachedUses,
284                             BlockToInstrPerColor &Gen, BlockToRegSet &Kill,
285                             BlockToSetOfInstrsPerColor &ReachableUses,
286                             const MapRegToId &RegToId,
287                             const MachineInstr *DummyOp, bool ADRPMode) {
288   const TargetRegisterInfo *TRI = MF.getSubtarget().getRegisterInfo();
289   unsigned NbReg = RegToId.size();
290
291   for (const MachineBasicBlock &MBB : MF) {
292     auto &BBGen = Gen[&MBB];
293     BBGen = make_unique<const MachineInstr *[]>(NbReg);
294     std::fill(BBGen.get(), BBGen.get() + NbReg, nullptr);
295
296     BitVector &BBKillSet = Kill[&MBB];
297     BBKillSet.resize(NbReg);
298     for (const MachineInstr &MI : MBB) {
299       bool IsADRP = MI.getOpcode() == AArch64::ADRP;
300
301       // Process uses first.
302       if (IsADRP || !ADRPMode)
303         for (const MachineOperand &MO : MI.operands()) {
304           // Treat ADRP def as use, as the goal of the analysis is to find
305           // ADRP defs reached by other ADRP defs.
306           if (!MO.isReg() || (!ADRPMode && !MO.isUse()) ||
307               (ADRPMode && (!IsADRP || !MO.isDef())))
308             continue;
309           unsigned CurReg = MO.getReg();
310           MapRegToId::const_iterator ItCurRegId = RegToId.find(CurReg);
311           if (ItCurRegId == RegToId.end())
312             continue;
313           CurReg = ItCurRegId->second;
314
315           // if CurReg has not been defined, this use is reachable.
316           if (!BBGen[CurReg] && !BBKillSet.test(CurReg))
317             getSet(ReachableUses, MBB, CurReg, NbReg).insert(&MI);
318           // current basic block definition for this color, if any, is in Gen.
319           if (BBGen[CurReg])
320             getUses(ColorOpToReachedUses, CurReg, *BBGen[CurReg]).insert(&MI);
321         }
322
323       // Process clobbers.
324       for (const MachineOperand &MO : MI.operands()) {
325         if (!MO.isRegMask())
326           continue;
327         // Clobbers kill the related colors.
328         const uint32_t *PreservedRegs = MO.getRegMask();
329
330         // Set generated regs.
331         for (const auto &Entry : RegToId) {
332           unsigned Reg = Entry.second;
333           // Use the global register ID when querying APIs external to this
334           // pass.
335           if (MachineOperand::clobbersPhysReg(PreservedRegs, Entry.first)) {
336             // Do not register clobbered definition for no ADRP.
337             // This definition is not used anyway (otherwise register
338             // allocation is wrong).
339             BBGen[Reg] = ADRPMode ? &MI : nullptr;
340             BBKillSet.set(Reg);
341           }
342         }
343       }
344
345       // Process register defs.
346       for (const MachineOperand &MO : MI.operands()) {
347         if (!MO.isReg() || !MO.isDef())
348           continue;
349         unsigned CurReg = MO.getReg();
350         MapRegToId::const_iterator ItCurRegId = RegToId.find(CurReg);
351         if (ItCurRegId == RegToId.end())
352           continue;
353
354         for (MCRegAliasIterator AI(CurReg, TRI, true); AI.isValid(); ++AI) {
355           MapRegToId::const_iterator ItRegId = RegToId.find(*AI);
356           assert(ItRegId != RegToId.end() &&
357                  "Sub-register of an "
358                  "involved register, not recorded as involved!");
359           BBKillSet.set(ItRegId->second);
360           BBGen[ItRegId->second] = &MI;
361         }
362         BBGen[ItCurRegId->second] = &MI;
363       }
364     }
365
366     // If we restrict our analysis to basic block scope, conservatively add a
367     // dummy
368     // use for each generated value.
369     if (!ADRPMode && DummyOp && !MBB.succ_empty())
370       for (unsigned CurReg = 0; CurReg < NbReg; ++CurReg)
371         if (BBGen[CurReg])
372           getUses(ColorOpToReachedUses, CurReg, *BBGen[CurReg]).insert(DummyOp);
373   }
374 }
375
376 /// Reaching def core algorithm:
377 /// while an Out has changed
378 ///    for each bb
379 ///       for each color
380 ///           In[bb][color] = U Out[bb.predecessors][color]
381 ///           insert reachableUses[bb][color] in each in[bb][color]
382 ///                 op.reachedUses
383 ///
384 ///           Out[bb] = Gen[bb] U (In[bb] - Kill[bb])
385 static void reachingDefAlgorithm(const MachineFunction &MF,
386                                  InstrToInstrs *ColorOpToReachedUses,
387                                  BlockToSetOfInstrsPerColor &In,
388                                  BlockToSetOfInstrsPerColor &Out,
389                                  BlockToInstrPerColor &Gen, BlockToRegSet &Kill,
390                                  BlockToSetOfInstrsPerColor &ReachableUses,
391                                  unsigned NbReg) {
392   bool HasChanged;
393   do {
394     HasChanged = false;
395     for (const MachineBasicBlock &MBB : MF) {
396       unsigned CurReg;
397       for (CurReg = 0; CurReg < NbReg; ++CurReg) {
398         SetOfMachineInstr &BBInSet = getSet(In, MBB, CurReg, NbReg);
399         SetOfMachineInstr &BBReachableUses =
400             getSet(ReachableUses, MBB, CurReg, NbReg);
401         SetOfMachineInstr &BBOutSet = getSet(Out, MBB, CurReg, NbReg);
402         unsigned Size = BBOutSet.size();
403         //   In[bb][color] = U Out[bb.predecessors][color]
404         for (const MachineBasicBlock *PredMBB : MBB.predecessors()) {
405           SetOfMachineInstr &PredOutSet = getSet(Out, *PredMBB, CurReg, NbReg);
406           BBInSet.insert(PredOutSet.begin(), PredOutSet.end());
407         }
408         //   insert reachableUses[bb][color] in each in[bb][color] op.reachedses
409         for (const MachineInstr *MI : BBInSet) {
410           SetOfMachineInstr &OpReachedUses =
411               getUses(ColorOpToReachedUses, CurReg, *MI);
412           OpReachedUses.insert(BBReachableUses.begin(), BBReachableUses.end());
413         }
414         //           Out[bb] = Gen[bb] U (In[bb] - Kill[bb])
415         if (!Kill[&MBB].test(CurReg))
416           BBOutSet.insert(BBInSet.begin(), BBInSet.end());
417         if (Gen[&MBB][CurReg])
418           BBOutSet.insert(Gen[&MBB][CurReg]);
419         HasChanged |= BBOutSet.size() != Size;
420       }
421     }
422   } while (HasChanged);
423 }
424
425 /// Reaching definition algorithm.
426 /// \param MF function on which the algorithm will operate.
427 /// \param[out] ColorOpToReachedUses will contain the result of the reaching
428 /// def algorithm.
429 /// \param ADRPMode specify whether the reaching def algorithm should be tuned
430 /// for ADRP optimization. \see initReachingDef for more details.
431 /// \param DummyOp if not NULL, the algorithm will work at
432 /// basic block scope and will set for every exposed definition a use to
433 /// @p DummyOp.
434 /// \pre ColorOpToReachedUses is an array of at least number of registers of
435 /// InstrToInstrs.
436 static void reachingDef(const MachineFunction &MF,
437                         InstrToInstrs *ColorOpToReachedUses,
438                         const MapRegToId &RegToId, bool ADRPMode = false,
439                         const MachineInstr *DummyOp = nullptr) {
440   // structures:
441   // For each basic block.
442   // Out: a set per color of definitions that reach the
443   //      out boundary of this block.
444   // In: Same as Out but for in boundary.
445   // Gen: generated color in this block (one operation per color).
446   // Kill: register set of killed color in this block.
447   // ReachableUses: a set per color of uses (operation) reachable
448   //                for "In" definitions.
449   BlockToSetOfInstrsPerColor Out, In, ReachableUses;
450   BlockToInstrPerColor Gen;
451   BlockToRegSet Kill;
452
453   // Initialize Gen, kill and reachableUses.
454   initReachingDef(MF, ColorOpToReachedUses, Gen, Kill, ReachableUses, RegToId,
455                   DummyOp, ADRPMode);
456
457   // Algo.
458   if (!DummyOp)
459     reachingDefAlgorithm(MF, ColorOpToReachedUses, In, Out, Gen, Kill,
460                          ReachableUses, RegToId.size());
461 }
462
463 #ifndef NDEBUG
464 /// print the result of the reaching definition algorithm.
465 static void printReachingDef(const InstrToInstrs *ColorOpToReachedUses,
466                              unsigned NbReg, const TargetRegisterInfo *TRI,
467                              const MapIdToReg &IdToReg) {
468   unsigned CurReg;
469   for (CurReg = 0; CurReg < NbReg; ++CurReg) {
470     if (ColorOpToReachedUses[CurReg].empty())
471       continue;
472     DEBUG(dbgs() << "*** Reg " << PrintReg(IdToReg[CurReg], TRI) << " ***\n");
473
474     for (const auto &DefsIt : ColorOpToReachedUses[CurReg]) {
475       DEBUG(dbgs() << "Def:\n");
476       DEBUG(DefsIt.first->print(dbgs()));
477       DEBUG(dbgs() << "Reachable uses:\n");
478       for (const MachineInstr *MI : DefsIt.second) {
479         DEBUG(MI->print(dbgs()));
480       }
481     }
482   }
483 }
484 #endif // NDEBUG
485
486 /// Answer the following question: Can Def be one of the definition
487 /// involved in a part of a LOH?
488 static bool canDefBePartOfLOH(const MachineInstr *Def) {
489   unsigned Opc = Def->getOpcode();
490   // Accept ADRP, ADDLow and LOADGot.
491   switch (Opc) {
492   default:
493     return false;
494   case AArch64::ADRP:
495     return true;
496   case AArch64::ADDXri:
497     // Check immediate to see if the immediate is an address.
498     switch (Def->getOperand(2).getType()) {
499     default:
500       return false;
501     case MachineOperand::MO_GlobalAddress:
502     case MachineOperand::MO_JumpTableIndex:
503     case MachineOperand::MO_ConstantPoolIndex:
504     case MachineOperand::MO_BlockAddress:
505       return true;
506     }
507   case AArch64::LDRXui:
508     // Check immediate to see if the immediate is an address.
509     switch (Def->getOperand(2).getType()) {
510     default:
511       return false;
512     case MachineOperand::MO_GlobalAddress:
513       return true;
514     }
515   }
516   // Unreachable.
517   return false;
518 }
519
520 /// Check whether the given instruction can the end of a LOH chain involving a
521 /// store.
522 static bool isCandidateStore(const MachineInstr *Instr) {
523   switch (Instr->getOpcode()) {
524   default:
525     return false;
526   case AArch64::STRBBui:
527   case AArch64::STRHHui:
528   case AArch64::STRBui:
529   case AArch64::STRHui:
530   case AArch64::STRWui:
531   case AArch64::STRXui:
532   case AArch64::STRSui:
533   case AArch64::STRDui:
534   case AArch64::STRQui:
535     // In case we have str xA, [xA, #imm], this is two different uses
536     // of xA and we cannot fold, otherwise the xA stored may be wrong,
537     // even if #imm == 0.
538     if (Instr->getOperand(0).getReg() != Instr->getOperand(1).getReg())
539       return true;
540   }
541   return false;
542 }
543
544 /// Given the result of a reaching definition algorithm in ColorOpToReachedUses,
545 /// Build the Use to Defs information and filter out obvious non-LOH candidates.
546 /// In ADRPMode, non-LOH candidates are "uses" with non-ADRP definitions.
547 /// In non-ADRPMode, non-LOH candidates are "uses" with several definition,
548 /// i.e., no simple chain.
549 /// \param ADRPMode -- \see initReachingDef.
550 static void reachedUsesToDefs(InstrToInstrs &UseToReachingDefs,
551                               const InstrToInstrs *ColorOpToReachedUses,
552                               const MapRegToId &RegToId,
553                               bool ADRPMode = false) {
554
555   SetOfMachineInstr NotCandidate;
556   unsigned NbReg = RegToId.size();
557   MapRegToId::const_iterator EndIt = RegToId.end();
558   for (unsigned CurReg = 0; CurReg < NbReg; ++CurReg) {
559     // If this color is never defined, continue.
560     if (ColorOpToReachedUses[CurReg].empty())
561       continue;
562
563     for (const auto &DefsIt : ColorOpToReachedUses[CurReg]) {
564       for (const MachineInstr *MI : DefsIt.second) {
565         const MachineInstr *Def = DefsIt.first;
566         MapRegToId::const_iterator It;
567         // if all the reaching defs are not adrp, this use will not be
568         // simplifiable.
569         if ((ADRPMode && Def->getOpcode() != AArch64::ADRP) ||
570             (!ADRPMode && !canDefBePartOfLOH(Def)) ||
571             (!ADRPMode && isCandidateStore(MI) &&
572              // store are LOH candidate iff the end of the chain is used as
573              // base.
574              ((It = RegToId.find((MI)->getOperand(1).getReg())) == EndIt ||
575               It->second != CurReg))) {
576           NotCandidate.insert(MI);
577           continue;
578         }
579         // Do not consider self reaching as a simplifiable case for ADRP.
580         if (!ADRPMode || MI != DefsIt.first) {
581           UseToReachingDefs[MI].insert(DefsIt.first);
582           // If UsesIt has several reaching definitions, it is not
583           // candidate for simplificaton in non-ADRPMode.
584           if (!ADRPMode && UseToReachingDefs[MI].size() > 1)
585             NotCandidate.insert(MI);
586         }
587       }
588     }
589   }
590   for (const MachineInstr *Elem : NotCandidate) {
591     DEBUG(dbgs() << "Too many reaching defs: " << *Elem << "\n");
592     // It would have been better if we could just remove the entry
593     // from the map.  Because of that, we have to filter the garbage
594     // (second.empty) in the subsequence analysis.
595     UseToReachingDefs[Elem].clear();
596   }
597 }
598
599 /// Based on the use to defs information (in ADRPMode), compute the
600 /// opportunities of LOH ADRP-related.
601 static void computeADRP(const InstrToInstrs &UseToDefs,
602                         AArch64FunctionInfo &AArch64FI,
603                         const MachineDominatorTree *MDT) {
604   DEBUG(dbgs() << "*** Compute LOH for ADRP\n");
605   for (const auto &Entry : UseToDefs) {
606     unsigned Size = Entry.second.size();
607     if (Size == 0)
608       continue;
609     if (Size == 1) {
610       const MachineInstr *L2 = *Entry.second.begin();
611       const MachineInstr *L1 = Entry.first;
612       if (!MDT->dominates(L2, L1)) {
613         DEBUG(dbgs() << "Dominance check failed:\n" << *L2 << '\n' << *L1
614                      << '\n');
615         continue;
616       }
617       DEBUG(dbgs() << "Record AdrpAdrp:\n" << *L2 << '\n' << *L1 << '\n');
618       SmallVector<const MachineInstr *, 2> Args;
619       Args.push_back(L2);
620       Args.push_back(L1);
621       AArch64FI.addLOHDirective(MCLOH_AdrpAdrp, Args);
622       ++NumADRPSimpleCandidate;
623     }
624 #ifdef DEBUG
625     else if (Size == 2)
626       ++NumADRPComplexCandidate2;
627     else if (Size == 3)
628       ++NumADRPComplexCandidate3;
629     else
630       ++NumADRPComplexCandidateOther;
631 #endif
632     // if Size < 1, the use should have been removed from the candidates
633     assert(Size >= 1 && "No reaching defs for that use!");
634   }
635 }
636
637 /// Check whether the given instruction can be the end of a LOH chain
638 /// involving a load.
639 static bool isCandidateLoad(const MachineInstr *Instr) {
640   switch (Instr->getOpcode()) {
641   default:
642     return false;
643   case AArch64::LDRSBWui:
644   case AArch64::LDRSBXui:
645   case AArch64::LDRSHWui:
646   case AArch64::LDRSHXui:
647   case AArch64::LDRSWui:
648   case AArch64::LDRBui:
649   case AArch64::LDRHui:
650   case AArch64::LDRWui:
651   case AArch64::LDRXui:
652   case AArch64::LDRSui:
653   case AArch64::LDRDui:
654   case AArch64::LDRQui:
655     if (Instr->getOperand(2).getTargetFlags() & AArch64II::MO_GOT)
656       return false;
657     return true;
658   }
659   // Unreachable.
660   return false;
661 }
662
663 /// Check whether the given instruction can load a litteral.
664 static bool supportLoadFromLiteral(const MachineInstr *Instr) {
665   switch (Instr->getOpcode()) {
666   default:
667     return false;
668   case AArch64::LDRSWui:
669   case AArch64::LDRWui:
670   case AArch64::LDRXui:
671   case AArch64::LDRSui:
672   case AArch64::LDRDui:
673   case AArch64::LDRQui:
674     return true;
675   }
676   // Unreachable.
677   return false;
678 }
679
680 /// Check whether the given instruction is a LOH candidate.
681 /// \param UseToDefs is used to check that Instr is at the end of LOH supported
682 /// chain.
683 /// \pre UseToDefs contains only on def per use, i.e., obvious non candidate are
684 /// already been filtered out.
685 static bool isCandidate(const MachineInstr *Instr,
686                         const InstrToInstrs &UseToDefs,
687                         const MachineDominatorTree *MDT) {
688   if (!isCandidateLoad(Instr) && !isCandidateStore(Instr))
689     return false;
690
691   const MachineInstr *Def = *UseToDefs.find(Instr)->second.begin();
692   if (Def->getOpcode() != AArch64::ADRP) {
693     // At this point, Def is ADDXri or LDRXui of the right type of
694     // symbol, because we filtered out the uses that were not defined
695     // by these kind of instructions (+ ADRP).
696
697     // Check if this forms a simple chain: each intermediate node must
698     // dominates the next one.
699     if (!MDT->dominates(Def, Instr))
700       return false;
701     // Move one node up in the simple chain.
702     if (UseToDefs.find(Def) ==
703             UseToDefs.end()
704             // The map may contain garbage we have to ignore.
705         ||
706         UseToDefs.find(Def)->second.empty())
707       return false;
708     Instr = Def;
709     Def = *UseToDefs.find(Def)->second.begin();
710   }
711   // Check if we reached the top of the simple chain:
712   // - top is ADRP.
713   // - check the simple chain property: each intermediate node must
714   // dominates the next one.
715   if (Def->getOpcode() == AArch64::ADRP)
716     return MDT->dominates(Def, Instr);
717   return false;
718 }
719
720 static bool registerADRCandidate(const MachineInstr &Use,
721                                  const InstrToInstrs &UseToDefs,
722                                  const InstrToInstrs *DefsPerColorToUses,
723                                  AArch64FunctionInfo &AArch64FI,
724                                  SetOfMachineInstr *InvolvedInLOHs,
725                                  const MapRegToId &RegToId) {
726   // Look for opportunities to turn ADRP -> ADD or
727   // ADRP -> LDR GOTPAGEOFF into ADR.
728   // If ADRP has more than one use. Give up.
729   if (Use.getOpcode() != AArch64::ADDXri &&
730       (Use.getOpcode() != AArch64::LDRXui ||
731        !(Use.getOperand(2).getTargetFlags() & AArch64II::MO_GOT)))
732     return false;
733   InstrToInstrs::const_iterator It = UseToDefs.find(&Use);
734   // The map may contain garbage that we need to ignore.
735   if (It == UseToDefs.end() || It->second.empty())
736     return false;
737   const MachineInstr &Def = **It->second.begin();
738   if (Def.getOpcode() != AArch64::ADRP)
739     return false;
740   // Check the number of users of ADRP.
741   const SetOfMachineInstr *Users =
742       getUses(DefsPerColorToUses,
743               RegToId.find(Def.getOperand(0).getReg())->second, Def);
744   if (Users->size() > 1) {
745     ++NumADRComplexCandidate;
746     return false;
747   }
748   ++NumADRSimpleCandidate;
749   assert((!InvolvedInLOHs || InvolvedInLOHs->insert(&Def)) &&
750          "ADRP already involved in LOH.");
751   assert((!InvolvedInLOHs || InvolvedInLOHs->insert(&Use)) &&
752          "ADD already involved in LOH.");
753   DEBUG(dbgs() << "Record AdrpAdd\n" << Def << '\n' << Use << '\n');
754
755   SmallVector<const MachineInstr *, 2> Args;
756   Args.push_back(&Def);
757   Args.push_back(&Use);
758
759   AArch64FI.addLOHDirective(Use.getOpcode() == AArch64::ADDXri ? MCLOH_AdrpAdd
760                                                            : MCLOH_AdrpLdrGot,
761                           Args);
762   return true;
763 }
764
765 /// Based on the use to defs information (in non-ADRPMode), compute the
766 /// opportunities of LOH non-ADRP-related
767 static void computeOthers(const InstrToInstrs &UseToDefs,
768                           const InstrToInstrs *DefsPerColorToUses,
769                           AArch64FunctionInfo &AArch64FI, const MapRegToId &RegToId,
770                           const MachineDominatorTree *MDT) {
771   SetOfMachineInstr *InvolvedInLOHs = nullptr;
772 #ifdef DEBUG
773   SetOfMachineInstr InvolvedInLOHsStorage;
774   InvolvedInLOHs = &InvolvedInLOHsStorage;
775 #endif // DEBUG
776   DEBUG(dbgs() << "*** Compute LOH for Others\n");
777   // ADRP -> ADD/LDR -> LDR/STR pattern.
778   // Fall back to ADRP -> ADD pattern if we fail to catch the bigger pattern.
779
780   // FIXME: When the statistics are not important,
781   // This initial filtering loop can be merged into the next loop.
782   // Currently, we didn't do it to have the same code for both DEBUG and
783   // NDEBUG builds. Indeed, the iterator of the second loop would need
784   // to be changed.
785   SetOfMachineInstr PotentialCandidates;
786   SetOfMachineInstr PotentialADROpportunities;
787   for (auto &Use : UseToDefs) {
788     // If no definition is available, this is a non candidate.
789     if (Use.second.empty())
790       continue;
791     // Keep only instructions that are load or store and at the end of
792     // a ADRP -> ADD/LDR/Nothing chain.
793     // We already filtered out the no-chain cases.
794     if (!isCandidate(Use.first, UseToDefs, MDT)) {
795       PotentialADROpportunities.insert(Use.first);
796       continue;
797     }
798     PotentialCandidates.insert(Use.first);
799   }
800
801   // Make the following distinctions for statistics as the linker does
802   // know how to decode instructions:
803   // - ADD/LDR/Nothing make there different patterns.
804   // - LDR/STR make two different patterns.
805   // Hence, 6 - 1 base patterns.
806   // (because ADRP-> Nothing -> STR is not simplifiable)
807
808   // The linker is only able to have a simple semantic, i.e., if pattern A
809   // do B.
810   // However, we want to see the opportunity we may miss if we were able to
811   // catch more complex cases.
812
813   // PotentialCandidates are result of a chain ADRP -> ADD/LDR ->
814   // A potential candidate becomes a candidate, if its current immediate
815   // operand is zero and all nodes of the chain have respectively only one user
816 #ifdef DEBUG
817   SetOfMachineInstr DefsOfPotentialCandidates;
818 #endif
819   for (const MachineInstr *Candidate : PotentialCandidates) {
820     // Get the definition of the candidate i.e., ADD or LDR.
821     const MachineInstr *Def = *UseToDefs.find(Candidate)->second.begin();
822     // Record the elements of the chain.
823     const MachineInstr *L1 = Def;
824     const MachineInstr *L2 = nullptr;
825     unsigned ImmediateDefOpc = Def->getOpcode();
826     if (Def->getOpcode() != AArch64::ADRP) {
827       // Check the number of users of this node.
828       const SetOfMachineInstr *Users =
829           getUses(DefsPerColorToUses,
830                   RegToId.find(Def->getOperand(0).getReg())->second, *Def);
831       if (Users->size() > 1) {
832 #ifdef DEBUG
833         // if all the uses of this def are in potential candidate, this is
834         // a complex candidate of level 2.
835         bool IsLevel2 = true;
836         for (const MachineInstr *MI : *Users) {
837           if (!PotentialCandidates.count(MI)) {
838             ++NumTooCplxLvl2;
839             IsLevel2 = false;
840             break;
841           }
842         }
843         if (IsLevel2)
844           ++NumCplxLvl2;
845 #endif // DEBUG
846         PotentialADROpportunities.insert(Def);
847         continue;
848       }
849       L2 = Def;
850       Def = *UseToDefs.find(Def)->second.begin();
851       L1 = Def;
852     } // else the element in the middle of the chain is nothing, thus
853       // Def already contains the first element of the chain.
854
855     // Check the number of users of the first node in the chain, i.e., ADRP
856     const SetOfMachineInstr *Users =
857         getUses(DefsPerColorToUses,
858                 RegToId.find(Def->getOperand(0).getReg())->second, *Def);
859     if (Users->size() > 1) {
860 #ifdef DEBUG
861       // if all the uses of this def are in the defs of the potential candidate,
862       // this is a complex candidate of level 1
863       if (DefsOfPotentialCandidates.empty()) {
864         // lazy init
865         DefsOfPotentialCandidates = PotentialCandidates;
866         for (const MachineInstr *Candidate : PotentialCandidates) {
867           if (!UseToDefs.find(Candidate)->second.empty())
868             DefsOfPotentialCandidates.insert(
869                 *UseToDefs.find(Candidate)->second.begin());
870         }
871       }
872       bool Found = false;
873       for (auto &Use : *Users) {
874         if (!DefsOfPotentialCandidates.count(Use)) {
875           ++NumTooCplxLvl1;
876           Found = true;
877           break;
878         }
879       }
880       if (!Found)
881         ++NumCplxLvl1;
882 #endif // DEBUG
883       continue;
884     }
885
886     bool IsL2Add = (ImmediateDefOpc == AArch64::ADDXri);
887     // If the chain is three instructions long and ldr is the second element,
888     // then this ldr must load form GOT, otherwise this is not a correct chain.
889     if (L2 && !IsL2Add &&
890         !(L2->getOperand(2).getTargetFlags() & AArch64II::MO_GOT))
891       continue;
892     SmallVector<const MachineInstr *, 3> Args;
893     MCLOHType Kind;
894     if (isCandidateLoad(Candidate)) {
895       if (!L2) {
896         // At this point, the candidate LOH indicates that the ldr instruction
897         // may use a direct access to the symbol. There is not such encoding
898         // for loads of byte and half.
899         if (!supportLoadFromLiteral(Candidate))
900           continue;
901
902         DEBUG(dbgs() << "Record AdrpLdr:\n" << *L1 << '\n' << *Candidate
903                      << '\n');
904         Kind = MCLOH_AdrpLdr;
905         Args.push_back(L1);
906         Args.push_back(Candidate);
907         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(L1)) &&
908                "L1 already involved in LOH.");
909         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(Candidate)) &&
910                "Candidate already involved in LOH.");
911         ++NumADRPToLDR;
912       } else {
913         DEBUG(dbgs() << "Record Adrp" << (IsL2Add ? "Add" : "LdrGot")
914                      << "Ldr:\n" << *L1 << '\n' << *L2 << '\n' << *Candidate
915                      << '\n');
916
917         Kind = IsL2Add ? MCLOH_AdrpAddLdr : MCLOH_AdrpLdrGotLdr;
918         Args.push_back(L1);
919         Args.push_back(L2);
920         Args.push_back(Candidate);
921
922         PotentialADROpportunities.remove(L2);
923         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(L1)) &&
924                "L1 already involved in LOH.");
925         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(L2)) &&
926                "L2 already involved in LOH.");
927         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(Candidate)) &&
928                "Candidate already involved in LOH.");
929 #ifdef DEBUG
930         // get the immediate of the load
931         if (Candidate->getOperand(2).getImm() == 0)
932           if (ImmediateDefOpc == AArch64::ADDXri)
933             ++NumADDToLDR;
934           else
935             ++NumLDRToLDR;
936         else if (ImmediateDefOpc == AArch64::ADDXri)
937           ++NumADDToLDRWithImm;
938         else
939           ++NumLDRToLDRWithImm;
940 #endif // DEBUG
941       }
942     } else {
943       if (ImmediateDefOpc == AArch64::ADRP)
944         continue;
945       else {
946
947         DEBUG(dbgs() << "Record Adrp" << (IsL2Add ? "Add" : "LdrGot")
948                      << "Str:\n" << *L1 << '\n' << *L2 << '\n' << *Candidate
949                      << '\n');
950
951         Kind = IsL2Add ? MCLOH_AdrpAddStr : MCLOH_AdrpLdrGotStr;
952         Args.push_back(L1);
953         Args.push_back(L2);
954         Args.push_back(Candidate);
955
956         PotentialADROpportunities.remove(L2);
957         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(L1)) &&
958                "L1 already involved in LOH.");
959         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(L2)) &&
960                "L2 already involved in LOH.");
961         assert((!InvolvedInLOHs || InvolvedInLOHs->insert(Candidate)) &&
962                "Candidate already involved in LOH.");
963 #ifdef DEBUG
964         // get the immediate of the store
965         if (Candidate->getOperand(2).getImm() == 0)
966           if (ImmediateDefOpc == AArch64::ADDXri)
967             ++NumADDToSTR;
968           else
969             ++NumLDRToSTR;
970         else if (ImmediateDefOpc == AArch64::ADDXri)
971           ++NumADDToSTRWithImm;
972         else
973           ++NumLDRToSTRWithImm;
974 #endif // DEBUG
975       }
976     }
977     AArch64FI.addLOHDirective(Kind, Args);
978   }
979
980   // Now, we grabbed all the big patterns, check ADR opportunities.
981   for (const MachineInstr *Candidate : PotentialADROpportunities)
982     registerADRCandidate(*Candidate, UseToDefs, DefsPerColorToUses, AArch64FI,
983                          InvolvedInLOHs, RegToId);
984 }
985
986 /// Look for every register defined by potential LOHs candidates.
987 /// Map these registers with dense id in @p RegToId and vice-versa in
988 /// @p IdToReg. @p IdToReg is populated only in DEBUG mode.
989 static void collectInvolvedReg(const MachineFunction &MF, MapRegToId &RegToId,
990                                MapIdToReg &IdToReg,
991                                const TargetRegisterInfo *TRI) {
992   unsigned CurRegId = 0;
993   if (!PreCollectRegister) {
994     unsigned NbReg = TRI->getNumRegs();
995     for (; CurRegId < NbReg; ++CurRegId) {
996       RegToId[CurRegId] = CurRegId;
997       DEBUG(IdToReg.push_back(CurRegId));
998       DEBUG(assert(IdToReg[CurRegId] == CurRegId && "Reg index mismatches"));
999     }
1000     return;
1001   }
1002
1003   DEBUG(dbgs() << "** Collect Involved Register\n");
1004   for (const auto &MBB : MF) {
1005     for (const MachineInstr &MI : MBB) {
1006       if (!canDefBePartOfLOH(&MI) &&
1007           !isCandidateLoad(&MI) && !isCandidateStore(&MI))
1008         continue;
1009
1010       // Process defs
1011       for (MachineInstr::const_mop_iterator IO = MI.operands_begin(),
1012                                             IOEnd = MI.operands_end();
1013            IO != IOEnd; ++IO) {
1014         if (!IO->isReg() || !IO->isDef())
1015           continue;
1016         unsigned CurReg = IO->getReg();
1017         for (MCRegAliasIterator AI(CurReg, TRI, true); AI.isValid(); ++AI)
1018           if (RegToId.find(*AI) == RegToId.end()) {
1019             DEBUG(IdToReg.push_back(*AI);
1020                   assert(IdToReg[CurRegId] == *AI &&
1021                          "Reg index mismatches insertion index."));
1022             RegToId[*AI] = CurRegId++;
1023             DEBUG(dbgs() << "Register: " << PrintReg(*AI, TRI) << '\n');
1024           }
1025       }
1026     }
1027   }
1028 }
1029
1030 bool AArch64CollectLOH::runOnMachineFunction(MachineFunction &MF) {
1031   const TargetRegisterInfo *TRI = MF.getSubtarget().getRegisterInfo();
1032   const MachineDominatorTree *MDT = &getAnalysis<MachineDominatorTree>();
1033
1034   MapRegToId RegToId;
1035   MapIdToReg IdToReg;
1036   AArch64FunctionInfo *AArch64FI = MF.getInfo<AArch64FunctionInfo>();
1037   assert(AArch64FI && "No MachineFunctionInfo for this function!");
1038
1039   DEBUG(dbgs() << "Looking for LOH in " << MF.getName() << '\n');
1040
1041   collectInvolvedReg(MF, RegToId, IdToReg, TRI);
1042   if (RegToId.empty())
1043     return false;
1044
1045   MachineInstr *DummyOp = nullptr;
1046   if (BasicBlockScopeOnly) {
1047     const TargetInstrInfo *TII = MF.getSubtarget().getInstrInfo();
1048     // For local analysis, create a dummy operation to record uses that are not
1049     // local.
1050     DummyOp = MF.CreateMachineInstr(TII->get(AArch64::COPY), DebugLoc());
1051   }
1052
1053   unsigned NbReg = RegToId.size();
1054   bool Modified = false;
1055
1056   // Start with ADRP.
1057   InstrToInstrs *ColorOpToReachedUses = new InstrToInstrs[NbReg];
1058
1059   // Compute the reaching def in ADRP mode, meaning ADRP definitions
1060   // are first considered as uses.
1061   reachingDef(MF, ColorOpToReachedUses, RegToId, true, DummyOp);
1062   DEBUG(dbgs() << "ADRP reaching defs\n");
1063   DEBUG(printReachingDef(ColorOpToReachedUses, NbReg, TRI, IdToReg));
1064
1065   // Translate the definition to uses map into a use to definitions map to ease
1066   // statistic computation.
1067   InstrToInstrs ADRPToReachingDefs;
1068   reachedUsesToDefs(ADRPToReachingDefs, ColorOpToReachedUses, RegToId, true);
1069
1070   // Compute LOH for ADRP.
1071   computeADRP(ADRPToReachingDefs, *AArch64FI, MDT);
1072   delete[] ColorOpToReachedUses;
1073
1074   // Continue with general ADRP -> ADD/LDR -> LDR/STR pattern.
1075   ColorOpToReachedUses = new InstrToInstrs[NbReg];
1076
1077   // first perform a regular reaching def analysis.
1078   reachingDef(MF, ColorOpToReachedUses, RegToId, false, DummyOp);
1079   DEBUG(dbgs() << "All reaching defs\n");
1080   DEBUG(printReachingDef(ColorOpToReachedUses, NbReg, TRI, IdToReg));
1081
1082   // Turn that into a use to defs to ease statistic computation.
1083   InstrToInstrs UsesToReachingDefs;
1084   reachedUsesToDefs(UsesToReachingDefs, ColorOpToReachedUses, RegToId, false);
1085
1086   // Compute other than AdrpAdrp LOH.
1087   computeOthers(UsesToReachingDefs, ColorOpToReachedUses, *AArch64FI, RegToId,
1088                 MDT);
1089   delete[] ColorOpToReachedUses;
1090
1091   if (BasicBlockScopeOnly)
1092     MF.DeleteMachineInstr(DummyOp);
1093
1094   return Modified;
1095 }
1096
1097 /// createAArch64CollectLOHPass - returns an instance of the Statistic for
1098 /// linker optimization pass.
1099 FunctionPass *llvm::createAArch64CollectLOHPass() {
1100   return new AArch64CollectLOH();
1101 }