test/CodeGen/X86/vector-idiv.ll

   1 ; RUN: llc -march=x86-64 -mcpu=corei7 < %s | FileCheck %s -check-prefix=SSE
   2 ; RUN: llc -march=x86-64 -mcpu=core-avx2 < %s | FileCheck %s -check-prefix=AVX
   3
   4 define <4 x i32> @test1(<4 x i32> %a) {
   5   %div = udiv <4 x i32> %a, <i32 7, i32 7, i32 7, i32 7>
   6   ret <4 x i32> %div
   7
   8 ; SSE-LABEL: test1:
   9 ; SSE: pmuludq
  10 ; SSE: pshufd   $57
  11 ; SSE: pmuludq
  12 ; SSE: shufps   $-35
  13 ; SSE: psubd
  14 ; SSE: psrld $1
  15 ; SSE: padd
  16 ; SSE: psrld $2
  17
  18 ; AVX-LABEL: test1:
  19 ; AVX: vpmuludq
  20 ; AVX: vpshufd  $57
  21 ; AVX: vpmuludq
  22 ; AVX: vshufps  $-35
  23 ; AVX: vpsubd
  24 ; AVX: vpsrld $1
  25 ; AVX: vpadd
  26 ; AVX: vpsrld $2
  27 }
  28
  29 define <8 x i32> @test2(<8 x i32> %a) {
  30   %div = udiv <8 x i32> %a, <i32 7, i32 7, i32 7, i32 7,i32 7, i32 7, i32 7, i32 7>
  31   ret <8 x i32> %div
  32
  33 ; AVX-LABEL: test2:
  34 ; AVX: vpermd
  35 ; AVX: vpmuludq
  36 ; AVX: vshufps  $-35
  37 ; AVX: vpmuludq
  38 ; AVX: vshufps  $-35
  39 ; AVX: vpsubd
  40 ; AVX: vpsrld $1
  41 ; AVX: vpadd
  42 ; AVX: vpsrld $2
  43 }
  44
  45 define <8 x i16> @test3(<8 x i16> %a) {
  46   %div = udiv <8 x i16> %a, <i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7>
  47   ret <8 x i16> %div
  48
  49 ; SSE-LABEL: test3:
  50 ; SSE: pmulhuw
  51 ; SSE: psubw
  52 ; SSE: psrlw $1
  53 ; SSE: paddw
  54 ; SSE: psrlw $2
  55
  56 ; AVX-LABEL: test3:
  57 ; AVX: vpmulhuw
  58 ; AVX: vpsubw
  59 ; AVX: vpsrlw $1
  60 ; AVX: vpaddw
  61 ; AVX: vpsrlw $2
  62 }
  63
  64 define <16 x i16> @test4(<16 x i16> %a) {
  65   %div = udiv <16 x i16> %a, <i16 7, i16 7, i16 7, i16 7,i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7,i16 7, i16 7, i16 7, i16 7>
  66   ret <16 x i16> %div
  67
  68 ; AVX-LABEL: test4:
  69 ; AVX: vpmulhuw
  70 ; AVX: vpsubw
  71 ; AVX: vpsrlw $1
  72 ; AVX: vpaddw
  73 ; AVX: vpsrlw $2
  74 ; AVX-NOT: vpmulhuw
  75 }
  76
  77 define <8 x i16> @test5(<8 x i16> %a) {
  78   %div = sdiv <8 x i16> %a, <i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7>
  79   ret <8 x i16> %div
  80
  81 ; SSE-LABEL: test5:
  82 ; SSE: pmulhw
  83 ; SSE: psrlw $15
  84 ; SSE: psraw $1
  85 ; SSE: paddw
  86
  87 ; AVX-LABEL: test5:
  88 ; AVX: vpmulhw
  89 ; AVX: vpsrlw $15
  90 ; AVX: vpsraw $1
  91 ; AVX: vpaddw
  92 }
  93
  94 define <16 x i16> @test6(<16 x i16> %a) {
  95   %div = sdiv <16 x i16> %a, <i16 7, i16 7, i16 7, i16 7,i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7, i16 7,i16 7, i16 7, i16 7, i16 7>
  96   ret <16 x i16> %div
  97
  98 ; AVX-LABEL: test6:
  99 ; AVX: vpmulhw
 100 ; AVX: vpsrlw $15
 101 ; AVX: vpsraw $1
 102 ; AVX: vpaddw
 103 ; AVX-NOT: vpmulhw
 104 }
 105
 106 define <16 x i8> @test7(<16 x i8> %a) {
 107   %div = sdiv <16 x i8> %a, <i8 7, i8 7, i8 7, i8 7,i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7, i8 7,i8 7, i8 7, i8 7, i8 7>
 108   ret <16 x i8> %div
 109 }
 110
 111 define <4 x i32> @test8(<4 x i32> %a) {
 112   %div = sdiv <4 x i32> %a, <i32 7, i32 7, i32 7, i32 7>
 113   ret <4 x i32> %div
 114
 115 ; SSE-LABEL: test8:
 116 ; SSE: pmuldq
 117 ; SSE: pshufd   $57
 118 ; SSE: pmuldq
 119 ; SSE: shufps   $-35
 120 ; SSE: pshufd   $-40
 121 ; SSE: padd
 122 ; SSE: psrld $31
 123 ; SSE: psrad $2
 124 ; SSE: padd
 125
 126 ; AVX-LABEL: test8:
 127 ; AVX: vpmuldq
 128 ; AVX: vpshufd  $57
 129 ; AVX: vpmuldq
 130 ; AVX: vshufps  $-35
 131 ; AVX: vpshufd  $-40
 132 ; AVX: vpadd
 133 ; AVX: vpsrld $31
 134 ; AVX: vpsrad $2
 135 ; AVX: vpadd
 136 }
 137
 138 define <8 x i32> @test9(<8 x i32> %a) {
 139   %div = sdiv <8 x i32> %a, <i32 7, i32 7, i32 7, i32 7,i32 7, i32 7, i32 7, i32 7>
 140   ret <8 x i32> %div
 141
 142 ; AVX-LABEL: test9:
 143 ; AVX: vpermd
 144 ; AVX: vpmuldq
 145 ; AVX: vshufps  $-35
 146 ; AVX: vpmuldq
 147 ; AVX: vshufps  $-35
 148 ; AVX: vpshufd  $-40
 149 ; AVX: vpadd
 150 ; AVX: vpsrld $31
 151 ; AVX: vpsrad $2
 152 ; AVX: vpadd
 153 }
 154
 155 define <8 x i32> @test10(<8 x i32> %a) {
 156   %rem = urem <8 x i32> %a, <i32 7, i32 7, i32 7, i32 7,i32 7, i32 7, i32 7, i32 7>
 157   ret <8 x i32> %rem
 158
 159 ; AVX-LABEL: test10:
 160 ; AVX: vpermd
 161 ; AVX: vpmuludq
 162 ; AVX: vshufps  $-35
 163 ; AVX: vpmuludq
 164 ; AVX: vshufps  $-35
 165 ; AVX: vpsubd
 166 ; AVX: vpsrld $1
 167 ; AVX: vpadd
 168 ; AVX: vpsrld $2
 169 ; AVX: vpmulld
 170 }
 171
 172 define <8 x i32> @test11(<8 x i32> %a) {
 173   %rem = srem <8 x i32> %a, <i32 7, i32 7, i32 7, i32 7,i32 7, i32 7, i32 7, i32 7>
 174   ret <8 x i32> %rem
 175
 176 ; AVX-LABEL: test11:
 177 ; AVX: vpermd
 178 ; AVX: vpmuldq
 179 ; AVX: vshufps  $-35
 180 ; AVX: vpmuldq
 181 ; AVX: vshufps  $-35
 182 ; AVX: vpshufd  $-40
 183 ; AVX: vpadd
 184 ; AVX: vpsrld $31
 185 ; AVX: vpsrad $2
 186 ; AVX: vpadd
 187 ; AVX: vpmulld
 188 }