Update machine models. Specify buffer sizes for OOO processors.

author Andrew Trick <atrick@apple.com>

Sat, 15 Jun 2013 04:50:02 +0000 (04:50 +0000)

committer Andrew Trick <atrick@apple.com>

Sat, 15 Jun 2013 04:50:02 +0000 (04:50 +0000)
author Andrew Trick <atrick@apple.com>
Sat, 15 Jun 2013 04:50:02 +0000 (04:50 +0000)
committer Andrew Trick <atrick@apple.com>
Sat, 15 Jun 2013 04:50:02 +0000 (04:50 +0000)
diff --git a/lib/Target/ARM/ARMScheduleA9.td b/lib/Target/ARM/ARMScheduleA9.td

index ce49857692319af090a5e5c5477bdd730c474f26..74ee50bbc6a4a4b643a9920e213cddc9c1315c70 100644 (file)
--- a/lib/Target/ARM/ARMScheduleA9.td
+++ b/lib/Target/ARM/ARMScheduleA9.td
@@ -1883,7 +1883,7 @@ def CortexA9Itineraries : ProcessorItineraries<
  // Cortex-A9 machine model for scheduling and other instruction cost heuristics.
  def CortexA9Model : SchedMachineModel {
    let IssueWidth = 2; // 2 micro-ops are dispatched per cycle.
-  let MinLatency = 0; // Data dependencies are allowed within dispatch groups.
+  let MicroOpBufferSize = 56; // Based on available renamed registers.
    let LoadLatency = 2; // Optimistic load latency assuming bypass.
                         // This is overriden by OperandCycles if the
                         // Itineraries are queried instead.
@@ -1901,7 +1901,7 @@ def A9UnitALU : ProcResource<2>;
  def A9UnitMul : ProcResource<1> { let Super = A9UnitALU; }
  def A9UnitAGU : ProcResource<1>;
  def A9UnitLS  : ProcResource<1>;
-def A9UnitFP  : ProcResource<1>;
+def A9UnitFP  : ProcResource<1> { let BufferSize = 0; }
  def A9UnitB   : ProcResource<1>;
  
  //===----------------------------------------------------------------------===//
diff --git a/lib/Target/ARM/ARMScheduleSwift.td b/lib/Target/ARM/ARMScheduleSwift.td

index b5cf2518c00bc1dfa9ed8bec22b1a2d858ad261b..2a41616b40998911e1bd0d2c3ea8849e31443afd 100644 (file)
--- a/lib/Target/ARM/ARMScheduleSwift.td
+++ b/lib/Target/ARM/ARMScheduleSwift.td
@@ -1076,7 +1076,7 @@ def SwiftItineraries : ProcessorItineraries<
  // Swift machine model for scheduling and other instruction cost heuristics.
  def SwiftModel : SchedMachineModel {
    let IssueWidth = 3; // 3 micro-ops are dispatched per cycle.
-  let MinLatency = 0; // Data dependencies are allowed within dispatch groups.
+  let MicroOpBufferSize = 45; // Based on NEON renamed registers.
    let LoadLatency = 3;
    let MispredictPenalty = 14; // A branch direction mispredict.
  
diff --git a/lib/Target/X86/X86SchedHaswell.td b/lib/Target/X86/X86SchedHaswell.td

index 49e81a76317ca3fcf41845b38f3d44532c2bc9f5..f98d0cca67deaba3f551814829daf3a0703c8ad7 100644 (file)
--- a/lib/Target/X86/X86SchedHaswell.td
+++ b/lib/Target/X86/X86SchedHaswell.td
@@ -16,7 +16,7 @@ def HaswellModel : SchedMachineModel {
    // All x86 instructions are modeled as a single micro-op, and HW can decode 4
    // instructions per cycle.
    let IssueWidth = 4;
-  let MinLatency = 0; // 0 = Out-of-order execution.
+  let MicroOpBufferSize = 192; // Based on the reorder buffer.
    let LoadLatency = 4;
    let MispredictPenalty = 16;
  }
diff --git a/lib/Target/X86/X86SchedSandyBridge.td b/lib/Target/X86/X86SchedSandyBridge.td

index c5fa52173b788ec32e9b77285704933a6af93363..ecfd3db6489ca60a6d3c5f155ca61754be7de2ed 100644 (file)
--- a/lib/Target/X86/X86SchedSandyBridge.td
+++ b/lib/Target/X86/X86SchedSandyBridge.td
@@ -17,7 +17,7 @@ def SandyBridgeModel : SchedMachineModel {
    // instructions per cycle.
    // FIXME: Identify instructions that aren't a single fused micro-op.
    let IssueWidth = 4;
-  let MinLatency = 0; // 0 = Out-of-order execution.
+  let MicroOpBufferSize = 168; // Based on the reorder buffer.
    let LoadLatency = 4;
    let MispredictPenalty = 16;
  }
diff --git a/lib/Target/X86/X86Schedule.td b/lib/Target/X86/X86Schedule.td

index c32d12b184006a7d7c80a9deb1214874d4c9a49a..625a05cb8da67f8f6e5df9ffd7957853c05c7618 100644 (file)
--- a/lib/Target/X86/X86Schedule.td
+++ b/lib/Target/X86/X86Schedule.td
@@ -550,8 +550,9 @@ def IIC_NOP : InstrItinClass;
  // Resources beyond the decoder operate on micro-ops and are bufferred
  // so adjacent micro-ops don't directly compete.
  //
-// MinLatency=0 indicates that RAW dependencies can be decoded in the
-// same cycle.
+// MicroOpBufferSize > 1 indicates that RAW dependencies can be
+// decoded in the same cycle. The value 32 is a reasonably arbitrary
+// number of in-flight instructions.
  //
  // HighLatency=10 is optimistic. X86InstrInfo::isHighLatencyDef
  // indicates high latency opcodes. Alternatively, InstrItinData
@@ -562,7 +563,7 @@ def IIC_NOP : InstrItinClass;
  // The GenericModel contains no instruciton itineraries.
  def GenericModel : SchedMachineModel {
    let IssueWidth = 4;
-  let MinLatency = 0;
+  let MicroOpBufferSize = 32;
    let LoadLatency = 4;
    let HighLatency = 10;
  }
diff --git a/lib/Target/X86/X86ScheduleAtom.td b/lib/Target/X86/X86ScheduleAtom.td

index 494a690248d1e1b59a078329663bd1cd8096c1bc..14a1471d02703ff9f5002d3ed647a22d8687dafa 100644 (file)
--- a/lib/Target/X86/X86ScheduleAtom.td
+++ b/lib/Target/X86/X86ScheduleAtom.td
@@ -525,8 +525,7 @@ def AtomItineraries : ProcessorItineraries<
  // Atom machine model.
  def AtomModel : SchedMachineModel {
    let IssueWidth = 2;  // Allows 2 instructions per scheduling group.
-  let MinLatency = 1;  // InstrStage cycles overrides MinLatency.
-                       // OperandCycles may be used for expected latency.
+  let MicroOpBufferSize = 0; // In-order execution, always hide latency.
    let LoadLatency = 3; // Expected cycles, may be overriden by OperandCycles.
    let HighLatency = 30;// Expected, may be overriden by OperandCycles.
author	Andrew Trick <atrick@apple.com>
	Sat, 15 Jun 2013 04:50:02 +0000 (04:50 +0000)
committer	Andrew Trick <atrick@apple.com>
	Sat, 15 Jun 2013 04:50:02 +0000 (04:50 +0000)
lib/Target/ARM/ARMScheduleA9.td		patch \| blob \| history
lib/Target/ARM/ARMScheduleSwift.td		patch \| blob \| history
lib/Target/X86/X86SchedHaswell.td		patch \| blob \| history
lib/Target/X86/X86SchedSandyBridge.td		patch \| blob \| history
lib/Target/X86/X86Schedule.td		patch \| blob \| history
lib/Target/X86/X86ScheduleAtom.td		patch \| blob \| history