test/CodeGen/R600/fmax_legacy.ll

   1 ; RUN: llc -march=r600 -mcpu=SI < %s | FileCheck -check-prefix=SI -check-prefix=FUNC %s
   2 ; RUN: llc -march=r600 -mcpu=redwood < %s | FileCheck -check-prefix=EG -check-prefix=FUNC %s
   3
   4 declare i32 @llvm.r600.read.tidig.x() #1
   5
   6 ; FUNC-LABEL: @test_fmax_legacy_uge_f32
   7 ; SI: buffer_load_dword [[A:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
   8 ; SI: buffer_load_dword [[B:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:4
   9 ; SI: v_max_legacy_f32_e32 {{v[0-9]+}}, [[B]], [[A]]
  10 ; EG: MAX
  11 define void @test_fmax_legacy_uge_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
  12   %tid = call i32 @llvm.r600.read.tidig.x() #1
  13   %gep.0 = getelementptr float addrspace(1)* %in, i32 %tid
  14   %gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
  15
  16   %a = load float addrspace(1)* %gep.0, align 4
  17   %b = load float addrspace(1)* %gep.1, align 4
  18
  19   %cmp = fcmp uge float %a, %b
  20   %val = select i1 %cmp, float %a, float %b
  21   store float %val, float addrspace(1)* %out, align 4
  22   ret void
  23 }
  24
  25 ; FUNC-LABEL: @test_fmax_legacy_oge_f32
  26 ; SI: buffer_load_dword [[A:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
  27 ; SI: buffer_load_dword [[B:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:4
  28 ; SI: v_max_legacy_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
  29 ; EG: MAX
  30 define void @test_fmax_legacy_oge_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
  31   %tid = call i32 @llvm.r600.read.tidig.x() #1
  32   %gep.0 = getelementptr float addrspace(1)* %in, i32 %tid
  33   %gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
  34
  35   %a = load float addrspace(1)* %gep.0, align 4
  36   %b = load float addrspace(1)* %gep.1, align 4
  37
  38   %cmp = fcmp oge float %a, %b
  39   %val = select i1 %cmp, float %a, float %b
  40   store float %val, float addrspace(1)* %out, align 4
  41   ret void
  42 }
  43
  44 ; FUNC-LABEL: @test_fmax_legacy_ugt_f32
  45 ; SI: buffer_load_dword [[A:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
  46 ; SI: buffer_load_dword [[B:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:4
  47 ; SI: v_max_legacy_f32_e32 {{v[0-9]+}}, [[B]], [[A]]
  48 ; EG: MAX
  49 define void @test_fmax_legacy_ugt_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
  50   %tid = call i32 @llvm.r600.read.tidig.x() #1
  51   %gep.0 = getelementptr float addrspace(1)* %in, i32 %tid
  52   %gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
  53
  54   %a = load float addrspace(1)* %gep.0, align 4
  55   %b = load float addrspace(1)* %gep.1, align 4
  56
  57   %cmp = fcmp ugt float %a, %b
  58   %val = select i1 %cmp, float %a, float %b
  59   store float %val, float addrspace(1)* %out, align 4
  60   ret void
  61 }
  62
  63 ; FUNC-LABEL: @test_fmax_legacy_ogt_f32
  64 ; SI: buffer_load_dword [[A:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
  65 ; SI: buffer_load_dword [[B:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:4
  66 ; SI: v_max_legacy_f32_e32 {{v[0-9]+}}, [[A]], [[B]]
  67 ; EG: MAX
  68 define void @test_fmax_legacy_ogt_f32(float addrspace(1)* %out, float addrspace(1)* %in) #0 {
  69   %tid = call i32 @llvm.r600.read.tidig.x() #1
  70   %gep.0 = getelementptr float addrspace(1)* %in, i32 %tid
  71   %gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
  72
  73   %a = load float addrspace(1)* %gep.0, align 4
  74   %b = load float addrspace(1)* %gep.1, align 4
  75
  76   %cmp = fcmp ogt float %a, %b
  77   %val = select i1 %cmp, float %a, float %b
  78   store float %val, float addrspace(1)* %out, align 4
  79   ret void
  80 }
  81
  82
  83 ; FUNC-LABEL: @test_fmax_legacy_ogt_f32_multi_use
  84 ; SI: buffer_load_dword [[A:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
  85 ; SI: buffer_load_dword [[B:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:4
  86 ; SI-NOT: v_max_
  87 ; SI: v_cmp_gt_f32
  88 ; SI-NEXT: v_cndmask_b32
  89 ; SI-NOT: v_max_
  90
  91 ; EG: MAX
  92 define void @test_fmax_legacy_ogt_f32_multi_use(float addrspace(1)* %out0, i1 addrspace(1)* %out1, float addrspace(1)* %in) #0 {
  93   %tid = call i32 @llvm.r600.read.tidig.x() #1
  94   %gep.0 = getelementptr float addrspace(1)* %in, i32 %tid
  95   %gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
  96
  97   %a = load float addrspace(1)* %gep.0, align 4
  98   %b = load float addrspace(1)* %gep.1, align 4
  99
 100   %cmp = fcmp ogt float %a, %b
 101   %val = select i1 %cmp, float %a, float %b
 102   store float %val, float addrspace(1)* %out0, align 4
 103   store i1 %cmp, i1addrspace(1)* %out1
 104   ret void
 105 }
 106
 107 attributes #0 = { nounwind }
 108 attributes #1 = { nounwind readnone }