Implement Chris's suggestion of legalizing the various SSE and AVX
authorDuncan Sands <baldrick@free.fr>
Fri, 23 Sep 2011 16:10:22 +0000 (16:10 +0000)
committerDuncan Sands <baldrick@free.fr>
Fri, 23 Sep 2011 16:10:22 +0000 (16:10 +0000)
hadd/hsub intrinsics into the new fhadd/fhsub X86 node.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@140383 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/X86/X86ISelLowering.cpp
lib/Target/X86/X86InstrSSE.td

index afb37c86f31cba1e156e4dc9f5c0391bf9c27553..cab9161f5a331c326667f3c3fdd832f735bb3d73 100644 (file)
@@ -9221,6 +9221,19 @@ X86TargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const
                                 DAG.getConstant(X86CC, MVT::i8), Cond);
     return DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::i32, SetCC);
   }
+  // Arithmetic intrinsics.
+  case Intrinsic::x86_sse3_hadd_ps:
+  case Intrinsic::x86_sse3_hadd_pd:
+  case Intrinsic::x86_avx_hadd_ps_256:
+  case Intrinsic::x86_avx_hadd_pd_256:
+    return DAG.getNode(X86ISD::FHADD, dl, Op.getValueType(),
+                       Op.getOperand(1), Op.getOperand(2));
+  case Intrinsic::x86_sse3_hsub_ps:
+  case Intrinsic::x86_sse3_hsub_pd:
+  case Intrinsic::x86_avx_hsub_ps_256:
+  case Intrinsic::x86_avx_hsub_pd_256:
+    return DAG.getNode(X86ISD::FHSUB, dl, Op.getValueType(),
+                       Op.getOperand(1), Op.getOperand(2));
   // ptest and testp intrinsics. The intrinsic these come from are designed to
   // return an integer value, not just an instruction so lower it to the ptest
   // or testp pattern and a setcc for the result.
index 7bc7ab2d5a8345c082aad10ec2e4c2d352e8785a..075be73f1a9f8df97066fd68c8df02a168dfacc6 100644 (file)
@@ -4761,48 +4761,6 @@ let Predicates = [HasAVX] in {
                           X86fhsub, 0>, VEX_4V;
 }
 
-let Predicates = [HasAVX] in {
-  def : Pat<(int_x86_sse3_hadd_ps (v4f32 VR128:$src1), VR128:$src2),
-            (VHADDPSrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hadd_ps (v4f32 VR128:$src1), (memop addr:$src2)),
-            (VHADDPSrm VR128:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_sse3_hadd_pd (v2f64 VR128:$src1), VR128:$src2),
-            (VHADDPDrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hadd_pd (v2f64 VR128:$src1), (memop addr:$src2)),
-            (VHADDPDrm VR128:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_sse3_hsub_ps (v4f32 VR128:$src1), VR128:$src2),
-            (VHSUBPSrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hsub_ps (v4f32 VR128:$src1), (memop addr:$src2)),
-            (VHSUBPSrm VR128:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_sse3_hsub_pd (v2f64 VR128:$src1), VR128:$src2),
-            (VHSUBPDrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hsub_pd (v2f64 VR128:$src1), (memop addr:$src2)),
-            (VHSUBPDrm VR128:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_avx_hadd_ps_256 (v8f32 VR256:$src1), VR256:$src2),
-            (VHADDPSYrr VR256:$src1, VR256:$src2)>;
-  def : Pat<(int_x86_avx_hadd_ps_256 (v8f32 VR256:$src1), (memop addr:$src2)),
-            (VHADDPSYrm VR256:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_avx_hadd_pd_256 (v4f64 VR256:$src1), VR256:$src2),
-            (VHADDPDYrr VR256:$src1, VR256:$src2)>;
-  def : Pat<(int_x86_avx_hadd_pd_256 (v4f64 VR256:$src1), (memop addr:$src2)),
-            (VHADDPDYrm VR256:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_avx_hsub_ps_256 (v8f32 VR256:$src1), VR256:$src2),
-            (VHSUBPSYrr VR256:$src1, VR256:$src2)>;
-  def : Pat<(int_x86_avx_hsub_ps_256 (v8f32 VR256:$src1), (memop addr:$src2)),
-            (VHSUBPSYrm VR256:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_avx_hsub_pd_256 (v4f64 VR256:$src1), VR256:$src2),
-            (VHSUBPDYrr VR256:$src1, VR256:$src2)>;
-  def : Pat<(int_x86_avx_hsub_pd_256 (v4f64 VR256:$src1), (memop addr:$src2)),
-            (VHSUBPDYrm VR256:$src1, addr:$src2)>;
-}
-
 let Constraints = "$src1 = $dst" in {
   defm HADDPS : S3D_Int<0x7C, "haddps", v4f32, VR128, f128mem, X86fhadd>;
   defm HADDPD : S3_Int<0x7C, "haddpd", v2f64, VR128, f128mem, X86fhadd>;
@@ -4810,28 +4768,6 @@ let Constraints = "$src1 = $dst" in {
   defm HSUBPD : S3_Int<0x7D, "hsubpd", v2f64, VR128, f128mem, X86fhsub>;
 }
 
-let Predicates = [HasSSE3] in {
-  def : Pat<(int_x86_sse3_hadd_ps (v4f32 VR128:$src1), VR128:$src2),
-            (HADDPSrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hadd_ps (v4f32 VR128:$src1), (memop addr:$src2)),
-            (HADDPSrm VR128:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_sse3_hadd_pd (v2f64 VR128:$src1), VR128:$src2),
-            (HADDPDrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hadd_pd (v2f64 VR128:$src1), (memop addr:$src2)),
-            (HADDPDrm VR128:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_sse3_hsub_ps (v4f32 VR128:$src1), VR128:$src2),
-            (HSUBPSrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hsub_ps (v4f32 VR128:$src1), (memop addr:$src2)),
-            (HSUBPSrm VR128:$src1, addr:$src2)>;
-
-  def : Pat<(int_x86_sse3_hsub_pd (v2f64 VR128:$src1), VR128:$src2),
-            (HSUBPDrr VR128:$src1, VR128:$src2)>;
-  def : Pat<(int_x86_sse3_hsub_pd (v2f64 VR128:$src1), (memop addr:$src2)),
-            (HSUBPDrm VR128:$src1, addr:$src2)>;
-}
-
 //===---------------------------------------------------------------------===//
 // SSSE3 - Packed Absolute Instructions
 //===---------------------------------------------------------------------===//