test/CodeGen/X86/avx-splat.ll

   1 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mcpu=corei7-avx -mattr=+avx | FileCheck %s
   2
   3 ; FIXME: use avx versions for punpcklbw, punpckhbw and punpckhwd
   4
   5 ; CHECK: vextractf128 $0
   6 ; CHECK-NEXT: punpcklbw
   7 ; CHECK-NEXT: punpckhbw
   8 ; CHECK-NEXT: vinsertf128 $1
   9 ; CHECK-NEXT: vpermilps $85
  10 define <32 x i8> @funcA(<32 x i8> %a) nounwind uwtable readnone ssp {
  11 entry:
  12   %shuffle = shufflevector <32 x i8> %a, <32 x i8> undef, <32 x i32> <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>
  13   ret <32 x i8> %shuffle
  14 }
  15
  16 ; CHECK: vextractf128 $0
  17 ; CHECK-NEXT: punpckhwd
  18 ; CHECK-NEXT: vinsertf128 $1
  19 ; CHECK-NEXT: vpermilps $85
  20 define <16 x i16> @funcB(<16 x i16> %a) nounwind uwtable readnone ssp {
  21 entry:
  22   %shuffle = shufflevector <16 x i16> %a, <16 x i16> undef, <16 x i32> <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>
  23   ret <16 x i16> %shuffle
  24 }
  25
  26 ; CHECK: vmovd
  27 ; CHECK-NEXT: vinsertf128 $1
  28 ; CHECK-NEXT: vpermilps $0
  29 define <4 x i64> @funcC(i64 %q) nounwind uwtable readnone ssp {
  30 entry:
  31   %vecinit.i = insertelement <4 x i64> undef, i64 %q, i32 0
  32   %vecinit2.i = insertelement <4 x i64> %vecinit.i, i64 %q, i32 1
  33   %vecinit4.i = insertelement <4 x i64> %vecinit2.i, i64 %q, i32 2
  34   %vecinit6.i = insertelement <4 x i64> %vecinit4.i, i64 %q, i32 3
  35   ret <4 x i64> %vecinit6.i
  36 }
  37
  38 ; CHECK: vinsertf128 $1
  39 ; CHECK-NEXT: vpermilps $0
  40 define <4 x double> @funcD(double %q) nounwind uwtable readnone ssp {
  41 entry:
  42   %vecinit.i = insertelement <4 x double> undef, double %q, i32 0
  43   %vecinit2.i = insertelement <4 x double> %vecinit.i, double %q, i32 1
  44   %vecinit4.i = insertelement <4 x double> %vecinit2.i, double %q, i32 2
  45   %vecinit6.i = insertelement <4 x double> %vecinit4.i, double %q, i32 3
  46   ret <4 x double> %vecinit6.i
  47 }
  48
  49 ; Test this simple opt:
  50 ;   shuffle (scalar_to_vector (load (ptr + 4))), undef, <0, 0, 0, 0>
  51 ; To:
  52 ;   shuffle (vload ptr)), undef, <1, 1, 1, 1>
  53 ; CHECK: vmovaps
  54 ; CHECK-NEXT: vinsertf128  $1
  55 ; CHECK-NEXT: vpermilps $-1
  56 define <8 x float> @funcE() nounwind {
  57 allocas:
  58   %udx495 = alloca [18 x [18 x float]], align 32
  59   br label %for_test505.preheader
  60
  61 for_test505.preheader:                            ; preds = %for_test505.preheader, %allocas
  62   br i1 undef, label %for_exit499, label %for_test505.preheader
  63
  64 for_exit499:                                      ; preds = %for_test505.preheader
  65   br i1 undef, label %__load_and_broadcast_32.exit1249, label %load.i1247
  66
  67 load.i1247:                                       ; preds = %for_exit499
  68   %ptr1227 = getelementptr [18 x [18 x float]]* %udx495, i64 0, i64 1, i64 1
  69   %ptr.i1237 = bitcast float* %ptr1227 to i32*
  70   %val.i1238 = load i32* %ptr.i1237, align 4
  71   %ret6.i1245 = insertelement <8 x i32> undef, i32 %val.i1238, i32 6
  72   %ret7.i1246 = insertelement <8 x i32> %ret6.i1245, i32 %val.i1238, i32 7
  73   %phitmp = bitcast <8 x i32> %ret7.i1246 to <8 x float>
  74   br label %__load_and_broadcast_32.exit1249
  75
  76 __load_and_broadcast_32.exit1249:                 ; preds = %load.i1247, %for_exit499
  77   %load_broadcast12281250 = phi <8 x float> [ %phitmp, %load.i1247 ], [ undef, %for_exit499 ]
  78   ret <8 x float> %load_broadcast12281250
  79 }
  80
  81 ; CHECK: vinsertf128 $1
  82 ; CHECK-NEXT: vpermilps $0
  83 define <8 x float> @funcF(i32* %ptr) nounwind {
  84   %val = load i32* %ptr, align 4
  85   %ret6 = insertelement <8 x i32> undef, i32 %val, i32 6
  86   %ret7 = insertelement <8 x i32> %ret6, i32 %val, i32 7
  87   %tmp = bitcast <8 x i32> %ret7 to <8 x float>
  88   ret <8 x float> %tmp
  89 }
  90
  91 ; CHECK: vinsertf128  $1
  92 ; CHECK-NEXT: vpermilps  $0
  93 define <8 x float> @funcG(<8 x float> %a) nounwind uwtable readnone ssp {
  94 entry:
  95   %shuffle = shufflevector <8 x float> %a, <8 x float> undef, <8 x i32> <i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0, i32 0>
  96   ret <8 x float> %shuffle
  97 }
  98
  99 ; CHECK: vextractf128  $1
 100 ; CHECK-NEXT: vinsertf128  $1
 101 ; CHECK-NEXT: vpermilps  $85
 102 define <8 x float> @funcH(<8 x float> %a) nounwind uwtable readnone ssp {
 103 entry:
 104   %shuffle = shufflevector <8 x float> %a, <8 x float> undef, <8 x i32> <i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5, i32 5>
 105   ret <8 x float> %shuffle
 106 }
 107