AMDGPU: Add pass to detect used kernel features
[oota-llvm.git] / test / CodeGen / AMDGPU / fadd64.ll
1 ; RUN: llc -march=amdgcn -mcpu=tahiti -verify-machineinstrs < %s | FileCheck %s
2 ; RUN: llc -march=amdgcn -mcpu=tonga -verify-machineinstrs < %s | FileCheck %s
3
4 ; CHECK-LABEL: {{^}}v_fadd_f64:
5 ; CHECK: v_add_f64 {{v[[0-9]+:[0-9]+]}}, {{v[[0-9]+:[0-9]+]}}, {{v[[0-9]+:[0-9]+]}}
6 define void @v_fadd_f64(double addrspace(1)* %out, double addrspace(1)* %in1,
7                         double addrspace(1)* %in2) {
8   %r0 = load double, double addrspace(1)* %in1
9   %r1 = load double, double addrspace(1)* %in2
10   %r2 = fadd double %r0, %r1
11   store double %r2, double addrspace(1)* %out
12   ret void
13 }
14
15 ; CHECK-LABEL: {{^}}s_fadd_f64:
16 ; CHECK: v_add_f64 {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}
17 define void @s_fadd_f64(double addrspace(1)* %out, double %r0, double %r1) {
18   %r2 = fadd double %r0, %r1
19   store double %r2, double addrspace(1)* %out
20   ret void
21 }
22
23 ; CHECK-LABEL: {{^}}v_fadd_v2f64:
24 ; CHECK: v_add_f64
25 ; CHECK: v_add_f64
26 ; CHECK: buffer_store_dwordx2
27 ; CHECK: buffer_store_dwordx2
28 define void @v_fadd_v2f64(<2 x double> addrspace(1)* %out, <2 x double> addrspace(1)* %in1,
29                           <2 x double> addrspace(1)* %in2) {
30   %r0 = load <2 x double>, <2 x double> addrspace(1)* %in1
31   %r1 = load <2 x double>, <2 x double> addrspace(1)* %in2
32   %r2 = fadd <2 x double> %r0, %r1
33   store <2 x double> %r2, <2 x double> addrspace(1)* %out
34   ret void
35 }
36
37 ; CHECK-LABEL: {{^}}s_fadd_v2f64:
38 ; CHECK: v_add_f64 {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}
39 ; CHECK: v_add_f64 {{v\[[0-9]+:[0-9]+\]}}, {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}
40 ; CHECK: buffer_store_dwordx2
41 ; CHECK: buffer_store_dwordx2
42 define void @s_fadd_v2f64(<2 x double> addrspace(1)* %out, <2 x double> %r0, <2 x double> %r1) {
43   %r2 = fadd <2 x double> %r0, %r1
44   store <2 x double> %r2, <2 x double> addrspace(1)* %out
45   ret void
46 }