X86: Added FeatureVectorUAMem for all AVX architectures.

author Elena Demikhovsky <elena.demikhovsky@intel.com>

Tue, 16 Dec 2014 09:10:08 +0000 (09:10 +0000)

committer Elena Demikhovsky <elena.demikhovsky@intel.com>

Tue, 16 Dec 2014 09:10:08 +0000 (09:10 +0000)
author Elena Demikhovsky <elena.demikhovsky@intel.com>
Tue, 16 Dec 2014 09:10:08 +0000 (09:10 +0000)
committer Elena Demikhovsky <elena.demikhovsky@intel.com>
Tue, 16 Dec 2014 09:10:08 +0000 (09:10 +0000)
diff --git a/lib/Target/X86/X86.td b/lib/Target/X86/X86.td

index 0bb597b32079a94a9dbb661ee2ea84c2af6f6547..ab3319afe93f0a78fdb7686eafad1818fc2d264f 100644 (file)
--- a/lib/Target/X86/X86.td
+++ b/lib/Target/X86/X86.td
@@ -309,6 +309,7 @@ class SandyBridgeProc<string Name> : ProcessorModel<Name, SandyBridgeModel, [
                                         FeatureCMPXCHG16B,
                                         FeatureFastUAMem,
                                         FeatureSlowUAMem32,
+                                       FeatureVectorUAMem,
                                         FeaturePOPCNT,
                                         FeatureAES,
                                         FeaturePCLMUL
@@ -321,6 +322,7 @@ class IvyBridgeProc<string Name> : ProcessorModel<Name, SandyBridgeModel, [
                                       FeatureCMPXCHG16B,
                                       FeatureFastUAMem,
                                       FeatureSlowUAMem32,
+                                     FeatureVectorUAMem,
                                       FeaturePOPCNT,
                                       FeatureAES,
                                       FeaturePCLMUL,
@@ -335,6 +337,7 @@ class HaswellProc<string Name> : ProcessorModel<Name, HaswellModel, [
                                     FeatureAVX2,
                                     FeatureCMPXCHG16B,
                                     FeatureFastUAMem,
+                                   FeatureVectorUAMem,
                                     FeaturePOPCNT,
                                     FeatureAES,
                                     FeaturePCLMUL,
@@ -357,6 +360,7 @@ class BroadwellProc<string Name> : ProcessorModel<Name, HaswellModel, [
                                       FeatureAVX2,
                                       FeatureCMPXCHG16B,
                                       FeatureFastUAMem,
+                                     FeatureVectorUAMem,
                                       FeaturePOPCNT,
                                       FeatureAES,
                                       FeaturePCLMUL,
@@ -384,7 +388,7 @@ class KnightsLandingProc<string Name> : ProcessorModel<Name, HaswellModel,
                        FeatureAES, FeaturePCLMUL, FeatureRDRAND, FeatureF16C,
                        FeatureFSGSBase, FeatureMOVBE, FeatureLZCNT, FeatureBMI,
                        FeatureBMI2, FeatureFMA, FeatureRTM, FeatureHLE,
-                      FeatureSlowIncDec]>;
+                      FeatureSlowIncDec, FeatureVectorUAMem]>;
  def : KnightsLandingProc<"knl">;
  
  // FIXME: define SKX model
@@ -395,7 +399,7 @@ class SkylakeProc<string Name> : ProcessorModel<Name, HaswellModel,
                        FeatureAES, FeaturePCLMUL, FeatureRDRAND, FeatureF16C,
                        FeatureFSGSBase, FeatureMOVBE, FeatureLZCNT, FeatureBMI,
                        FeatureBMI2, FeatureFMA, FeatureRTM, FeatureHLE,
-                      FeatureSlowIncDec, FeatureSGX]>;
+                      FeatureSlowIncDec, FeatureSGX, FeatureVectorUAMem]>;
  def : SkylakeProc<"skylake">;
  def : SkylakeProc<"skx">; // Legacy alias.
  
diff --git a/lib/Target/X86/X86InstrFragmentsSIMD.td b/lib/Target/X86/X86InstrFragmentsSIMD.td

index 5f695c02cfcd6ab040e4d2321119547f7eed5be6..76e8fad78de37c939ac32ac8e507544406940e32 100644 (file)
--- a/lib/Target/X86/X86InstrFragmentsSIMD.td
+++ b/lib/Target/X86/X86InstrFragmentsSIMD.td
@@ -428,16 +428,6 @@ def memop : PatFrag<(ops node:$ptr), (load node:$ptr), [{
           || cast<LoadSDNode>(N)->getAlignment() >= 16;
  }]>;
  
-def memop4 : PatFrag<(ops node:$ptr), (load node:$ptr), [{
-  return    Subtarget->hasVectorUAMem()
-         || cast<LoadSDNode>(N)->getAlignment() >= 4;
-}]>;
-
-def memop8 : PatFrag<(ops node:$ptr), (load node:$ptr), [{
-  return    Subtarget->hasVectorUAMem()
-         || cast<LoadSDNode>(N)->getAlignment() >= 8;
-}]>;
-
  def memopfsf32 : PatFrag<(ops node:$ptr), (f32   (memop node:$ptr))>;
  def memopfsf64 : PatFrag<(ops node:$ptr), (f64   (memop node:$ptr))>;
  
@@ -454,10 +444,10 @@ def memopv4f64 : PatFrag<(ops node:$ptr), (v4f64 (memop node:$ptr))>;
  def memopv4i64 : PatFrag<(ops node:$ptr), (v4i64 (memop node:$ptr))>;
  
  // 512-bit memop pattern fragments
-def memopv16f32 : PatFrag<(ops node:$ptr), (v16f32 (memop4 node:$ptr))>;
-def memopv8f64  : PatFrag<(ops node:$ptr), (v8f64  (memop8 node:$ptr))>;
-def memopv16i32 : PatFrag<(ops node:$ptr), (v16i32 (memop4 node:$ptr))>;
-def memopv8i64  : PatFrag<(ops node:$ptr), (v8i64  (memop8 node:$ptr))>;
+def memopv16f32 : PatFrag<(ops node:$ptr), (v16f32 (memop node:$ptr))>;
+def memopv8f64  : PatFrag<(ops node:$ptr), (v8f64  (memop node:$ptr))>;
+def memopv16i32 : PatFrag<(ops node:$ptr), (v16i32 (memop node:$ptr))>;
+def memopv8i64  : PatFrag<(ops node:$ptr), (v8i64  (memop node:$ptr))>;
  
  // SSSE3 uses MMX registers for some instructions. They aren't aligned on a
  // 16-byte boundary.
author	Elena Demikhovsky <elena.demikhovsky@intel.com>
	Tue, 16 Dec 2014 09:10:08 +0000 (09:10 +0000)
committer	Elena Demikhovsky <elena.demikhovsky@intel.com>
	Tue, 16 Dec 2014 09:10:08 +0000 (09:10 +0000)
lib/Target/X86/X86.td		patch \| blob \| history
lib/Target/X86/X86InstrFragmentsSIMD.td		patch \| blob \| history