test/CodeGen/X86/fma_patterns.ll

   1 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=core-avx2 -mattr=avx2,+fma -fp-contract=fast | FileCheck %s\r
   2 \r
   3 ; CHECK: test_x86_fmadd_ps\r
   4 ; CHECK: vfmadd213ps     %xmm2, %xmm0, %xmm1\r
   5 ; CHECK: ret\r
   6 define <4 x float> @test_x86_fmadd_ps(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2) {\r
   7   %x = fmul <4 x float> %a0, %a1\r
   8   %res = fadd <4 x float> %x, %a2\r
   9   ret <4 x float> %res\r
  10 }\r
  11 \r
  12 ; CHECK: test_x86_fmsub_ps\r
  13 ; CHECK: fmsub213ps     %xmm2, %xmm0, %xmm1\r
  14 ; CHECK: ret\r
  15 define <4 x float> @test_x86_fmsub_ps(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2) {\r
  16   %x = fmul <4 x float> %a0, %a1\r
  17   %res = fsub <4 x float> %x, %a2\r
  18   ret <4 x float> %res\r
  19 }\r
  20 \r
  21 ; CHECK: test_x86_fnmadd_ps\r
  22 ; CHECK: fnmadd213ps     %xmm2, %xmm0, %xmm1\r
  23 ; CHECK: ret\r
  24 define <4 x float> @test_x86_fnmadd_ps(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2) {\r
  25   %x = fmul <4 x float> %a0, %a1\r
  26   %res = fsub <4 x float> %a2, %x\r
  27   ret <4 x float> %res\r
  28 }\r
  29 \r
  30 ; CHECK: test_x86_fnmsub_ps\r
  31 ; CHECK: fnmsub213ps     %xmm2, %xmm0, %xmm1\r
  32 ; CHECK: ret\r
  33 define <4 x float> @test_x86_fnmsub_ps(<4 x float> %a0, <4 x float> %a1, <4 x float> %a2) {\r
  34   %x = fmul <4 x float> %a0, %a1\r
  35   %y = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %x\r
  36   %res = fsub <4 x float> %y, %a2\r
  37   ret <4 x float> %res\r
  38 }\r
  39 \r
  40 ; CHECK: test_x86_fmadd_ps_y\r
  41 ; CHECK: vfmadd213ps     %ymm2, %ymm0, %ymm1\r
  42 ; CHECK: ret\r
  43 define <8 x float> @test_x86_fmadd_ps_y(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2) {\r
  44   %x = fmul <8 x float> %a0, %a1\r
  45   %res = fadd <8 x float> %x, %a2\r
  46   ret <8 x float> %res\r
  47 }\r
  48 \r
  49 ; CHECK: test_x86_fmsub_ps_y\r
  50 ; CHECK: vfmsub213ps     %ymm2, %ymm0, %ymm1\r
  51 ; CHECK: ret\r
  52 define <8 x float> @test_x86_fmsub_ps_y(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2) {\r
  53   %x = fmul <8 x float> %a0, %a1\r
  54   %res = fsub <8 x float> %x, %a2\r
  55   ret <8 x float> %res\r
  56 }\r
  57 \r
  58 ; CHECK: test_x86_fnmadd_ps_y\r
  59 ; CHECK: vfnmadd213ps     %ymm2, %ymm0, %ymm1\r
  60 ; CHECK: ret\r
  61 define <8 x float> @test_x86_fnmadd_ps_y(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2) {\r
  62   %x = fmul <8 x float> %a0, %a1\r
  63   %res = fsub <8 x float> %a2, %x\r
  64   ret <8 x float> %res\r
  65 }\r
  66 \r
  67 ; CHECK: test_x86_fnmsub_ps_y\r
  68 ; CHECK: vfnmsub213ps     %ymm2, %ymm0, %ymm1\r
  69 ; CHECK: ret\r
  70 define <8 x float> @test_x86_fnmsub_ps_y(<8 x float> %a0, <8 x float> %a1, <8 x float> %a2) {\r
  71   %x = fmul <8 x float> %a0, %a1\r
  72   %y = fsub <8 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %x\r
  73   %res = fsub <8 x float> %y, %a2\r
  74   ret <8 x float> %res\r
  75 }\r
  76 \r
  77 ; CHECK: test_x86_fmadd_pd_y\r
  78 ; CHECK: vfmadd213pd     %ymm2, %ymm0, %ymm1\r
  79 ; CHECK: ret\r
  80 define <4 x double> @test_x86_fmadd_pd_y(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2) {\r
  81   %x = fmul <4 x double> %a0, %a1\r
  82   %res = fadd <4 x double> %x, %a2\r
  83   ret <4 x double> %res\r
  84 }\r
  85 \r
  86 ; CHECK: test_x86_fmsub_pd_y\r
  87 ; CHECK: vfmsub213pd     %ymm2, %ymm0, %ymm1\r
  88 ; CHECK: ret\r
  89 define <4 x double> @test_x86_fmsub_pd_y(<4 x double> %a0, <4 x double> %a1, <4 x double> %a2) {\r
  90   %x = fmul <4 x double> %a0, %a1\r
  91   %res = fsub <4 x double> %x, %a2\r
  92   ret <4 x double> %res\r
  93 }\r
  94 \r
  95 ; CHECK: test_x86_fmsub_pd\r
  96 ; CHECK: vfmsub213pd     %xmm2, %xmm0, %xmm1\r
  97 ; CHECK: ret\r
  98 define <2 x double> @test_x86_fmsub_pd(<2 x double> %a0, <2 x double> %a1, <2 x double> %a2) {\r
  99   %x = fmul <2 x double> %a0, %a1\r
 100   %res = fsub <2 x double> %x, %a2\r
 101   ret <2 x double> %res\r
 102 }\r
 103 \r
 104 ; CHECK: test_x86_fnmadd_ss\r
 105 ; CHECK: vfnmadd213ss    %xmm2, %xmm0, %xmm1\r
 106 ; CHECK: ret\r
 107 define float @test_x86_fnmadd_ss(float %a0, float %a1, float %a2) {\r
 108   %x = fmul float %a0, %a1\r
 109   %res = fsub float %a2, %x\r
 110   ret float %res\r
 111 }\r
 112 \r
 113 ; CHECK: test_x86_fnmadd_sd\r
 114 ; CHECK: vfnmadd213sd     %xmm2, %xmm0, %xmm1\r
 115 ; CHECK: ret\r
 116 define double @test_x86_fnmadd_sd(double %a0, double %a1, double %a2) {\r
 117   %x = fmul double %a0, %a1\r
 118   %res = fsub double %a2, %x\r
 119   ret double %res\r
 120 }\r
 121 \r
 122 ; CHECK: test_x86_fmsub_sd\r
 123 ; CHECK: vfmsub213sd     %xmm2, %xmm0, %xmm1\r
 124 ; CHECK: ret\r
 125 define double @test_x86_fmsub_sd(double %a0, double %a1, double %a2) {\r
 126   %x = fmul double %a0, %a1\r
 127   %res = fsub double %x, %a2\r
 128   ret double %res\r
 129 }\r
 130 \r
 131 ; CHECK: test_x86_fnmsub_ss\r
 132 ; CHECK: vfnmsub213ss     %xmm2, %xmm0, %xmm1\r
 133 ; CHECK: ret\r
 134 define float @test_x86_fnmsub_ss(float %a0, float %a1, float %a2) {\r
 135   %x = fsub float -0.000000e+00, %a0\r
 136   %y = fmul float %x, %a1\r
 137   %res = fsub float %y, %a2\r
 138   ret float %res\r
 139 }\r