[AVX512] Bring back vector-shuffle lowering support through broadcasts

[oota-llvm.git] / test / CodeGen / X86 / avx-arith.ll
diff --git a/test/CodeGen/X86/avx-arith.ll b/test/CodeGen/X86/avx-arith.ll

index 59988ca8b68d27071214491aaec34c565ae376d8..a9da1ec067ca3aacd13ab090f28434f833540583 100644 (file)
--- a/test/CodeGen/X86/avx-arith.ll
+++ b/test/CodeGen/X86/avx-arith.ll
@@ -240,15 +240,15 @@ define <16 x i16> @vpmullw(<16 x i16> %i, <16 x i16> %j) nounwind readnone {
  ; CHECK-NEXT: vpmuludq %xmm
  ; CHECK-NEXT: vpsllq $32, %xmm
  ; CHECK-NEXT: vpaddq %xmm
-; CHECK-NEXT: vpmuludq %xmm
  ; CHECK-NEXT: vpsrlq $32, %xmm
  ; CHECK-NEXT: vpmuludq %xmm
  ; CHECK-NEXT: vpsllq $32, %xmm
+; CHECK-NEXT: vpaddq %xmm
+; CHECK-NEXT: vpmuludq %xmm
  ; CHECK-NEXT: vpsrlq $32, %xmm
  ; CHECK-NEXT: vpmuludq %xmm
  ; CHECK-NEXT: vpsllq $32, %xmm
  ; CHECK-NEXT: vpaddq %xmm
-; CHECK-NEXT: vpaddq %xmm
  ; CHECK-NEXT: vpsrlq $32, %xmm
  ; CHECK-NEXT: vpmuludq %xmm
  ; CHECK-NEXT: vpsllq $32, %xmm
@@ -259,3 +259,13 @@ define <4 x i64> @mul-v4i64(<4 x i64> %i, <4 x i64> %j) nounwind readnone {
    ret <4 x i64> %x
  }
  
+declare <4 x float> @llvm.x86.sse.sqrt.ss(<4 x float>) nounwind readnone
+
+define <4 x float> @int_sqrt_ss() {
+; CHECK: int_sqrt_ss
+; CHECK: vsqrtss
+ %x0 = load float addrspace(1)* undef, align 8
+ %x1 = insertelement <4 x float> undef, float %x0, i32 0
+ %x2 = call <4 x float> @llvm.x86.sse.sqrt.ss(<4 x float> %x1) nounwind
+ ret <4 x float> %x2
+}