[ARM][NEON] Use address space in vld([1234]|[234]lane) and vst([1234]|[234]lane)...

[oota-llvm.git] / test / CodeGen / ARM / vmul.ll
diff --git a/test/CodeGen/ARM/vmul.ll b/test/CodeGen/ARM/vmul.ll

index c3e41cacde4c62567d07a7c84c775899bdc18449..0455190b4c9d849e2907b177d8fec144586d3a36 100644 (file)
--- a/test/CodeGen/ARM/vmul.ll
+++ b/test/CodeGen/ARM/vmul.ll
@@ -447,7 +447,7 @@ entry:
    %0 = trunc i32 %mul to i8
    %1 = insertelement <8 x i8> undef, i8 %0, i32 0
    %2 = shufflevector <8 x i8> %1, <8 x i8> undef, <8 x i32> zeroinitializer
-  %3 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8(i8* %src, i32 1)
+  %3 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8.p0i8(i8* %src, i32 1)
    %4 = bitcast <16 x i8> %3 to <2 x double>
    %5 = extractelement <2 x double> %4, i32 1
    %6 = bitcast double %5 to <8 x i8>
@@ -459,13 +459,13 @@ entry:
    %12 = add <8 x i16> %7, %11
    %13 = mul <8 x i16> %12, %8
    %14 = bitcast i16* %dst to i8*
-  tail call void @llvm.arm.neon.vst1.v8i16(i8* %14, <8 x i16> %13, i32 2)
+  tail call void @llvm.arm.neon.vst1.p0i8.v8i16(i8* %14, <8 x i16> %13, i32 2)
    ret void
  }
  
-declare <16 x i8> @llvm.arm.neon.vld1.v16i8(i8*, i32) nounwind readonly
+declare <16 x i8> @llvm.arm.neon.vld1.v16i8.p0i8(i8*, i32) nounwind readonly
  
-declare void @llvm.arm.neon.vst1.v8i16(i8*, <8 x i16>, i32) nounwind
+declare void @llvm.arm.neon.vst1.p0i8.v8i16(i8*, <8 x i16>, i32) nounwind
  
  ; Take advantage of the Cortex-A8 multiplier accumulator forward.
  
@@ -480,7 +480,7 @@ entry:
    %0 = trunc i32 %mul to i8
    %1 = insertelement <8 x i8> undef, i8 %0, i32 0
    %2 = shufflevector <8 x i8> %1, <8 x i8> undef, <8 x i32> zeroinitializer
-  %3 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8(i8* %src, i32 1)
+  %3 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8.p0i8(i8* %src, i32 1)
    %4 = bitcast <16 x i8> %3 to <2 x double>
    %5 = extractelement <2 x double> %4, i32 1
    %6 = bitcast double %5 to <8 x i8>
@@ -502,7 +502,7 @@ entry:
    %0 = trunc i32 %mul to i8
    %1 = insertelement <8 x i8> undef, i8 %0, i32 0
    %2 = shufflevector <8 x i8> %1, <8 x i8> undef, <8 x i32> zeroinitializer
-  %3 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8(i8* %src, i32 1)
+  %3 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8.p0i8(i8* %src, i32 1)
    %4 = bitcast <16 x i8> %3 to <2 x double>
    %5 = extractelement <2 x double> %4, i32 1
    %6 = bitcast double %5 to <8 x i8>
@@ -559,7 +559,7 @@ for.body33.lr.ph:                                 ; preds = %for.body
  
  for.body33:                                       ; preds = %for.body33, %for.body33.lr.ph
    %add45 = add i32 undef, undef
-  %vld155 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8(i8* undef, i32 1)
+  %vld155 = tail call <16 x i8> @llvm.arm.neon.vld1.v16i8.p0i8(i8* undef, i32 1)
    %0 = load i32*, i32** undef, align 4
    %shuffle.i250 = shufflevector <2 x i64> undef, <2 x i64> undef, <1 x i32> zeroinitializer
    %1 = bitcast <1 x i64> %shuffle.i250 to <8 x i8>