PTX: Add intrinsic support for ntid, ctaid, and nctaid registers
authorJustin Holewinski <justin.holewinski@gmail.com>
Tue, 8 Mar 2011 14:10:18 +0000 (14:10 +0000)
committerJustin Holewinski <justin.holewinski@gmail.com>
Tue, 8 Mar 2011 14:10:18 +0000 (14:10 +0000)
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@127246 91177308-0d34-0410-b5e6-96231b3b80d8

include/llvm/IntrinsicsPTX.td
lib/Target/PTX/PTXIntrinsicInstrInfo.td
test/CodeGen/PTX/intrinsic.ll

index ec291e467ecf2f846984ab88288c45c1101768de..9e372301c7993eded7b5ed573a9aefa27cce34f0 100644 (file)
@@ -25,8 +25,14 @@ let TargetPrefix = "ptx" in {
   }
 }
 
-defm int_ptx_read_tid : PTXReadSpecialRegisterIntrinsic;
-defm int_ptx_read_tid : PTXReadSpecialSubRegisterIntrinsic;
+defm int_ptx_read_tid    : PTXReadSpecialRegisterIntrinsic;
+defm int_ptx_read_tid    : PTXReadSpecialSubRegisterIntrinsic;
+defm int_ptx_read_ntid   : PTXReadSpecialRegisterIntrinsic;
+defm int_ptx_read_ntid   : PTXReadSpecialSubRegisterIntrinsic;
+defm int_ptx_read_ctaid  : PTXReadSpecialRegisterIntrinsic;
+defm int_ptx_read_ctaid  : PTXReadSpecialSubRegisterIntrinsic;
+defm int_ptx_read_nctaid : PTXReadSpecialRegisterIntrinsic;
+defm int_ptx_read_nctaid : PTXReadSpecialSubRegisterIntrinsic;
 
 let TargetPrefix = "ptx" in
   def int_ptx_bar_sync : Intrinsic<[], [llvm_i32_ty], []>;
index 3f2737e077fcf33fded46e442f2da3456b205e15..a75c1086f7d27525ae65825748f99ea348e4026d 100644 (file)
@@ -24,10 +24,28 @@ class PTX_READ_SPECIAL_SUB_REGISTER<string regname, Intrinsic intop>
             [(set RRegu16:$d, (intop))]>;
 
 def PTX_READ_TID_R64 : PTX_READ_SPECIAL_REGISTER<"tid", int_ptx_read_tid_r64>;
-def PTX_READ_TID_X : PTX_READ_SPECIAL_SUB_REGISTER<"tid.x", int_ptx_read_tid_x>;
-def PTX_READ_TID_Y : PTX_READ_SPECIAL_SUB_REGISTER<"tid.y", int_ptx_read_tid_y>;
-def PTX_READ_TID_Z : PTX_READ_SPECIAL_SUB_REGISTER<"tid.z", int_ptx_read_tid_z>;
-def PTX_READ_TID_W : PTX_READ_SPECIAL_SUB_REGISTER<"tid.w", int_ptx_read_tid_w>;
+def PTX_READ_TID_X   : PTX_READ_SPECIAL_SUB_REGISTER<"tid.x", int_ptx_read_tid_x>;
+def PTX_READ_TID_Y   : PTX_READ_SPECIAL_SUB_REGISTER<"tid.y", int_ptx_read_tid_y>;
+def PTX_READ_TID_Z   : PTX_READ_SPECIAL_SUB_REGISTER<"tid.z", int_ptx_read_tid_z>;
+def PTX_READ_TID_W   : PTX_READ_SPECIAL_SUB_REGISTER<"tid.w", int_ptx_read_tid_w>;
+
+def PTX_READ_NTID_R64 : PTX_READ_SPECIAL_REGISTER<"ntid", int_ptx_read_ntid_r64>;
+def PTX_READ_NTID_X   : PTX_READ_SPECIAL_SUB_REGISTER<"ntid.x", int_ptx_read_ntid_x>;
+def PTX_READ_NTID_Y   : PTX_READ_SPECIAL_SUB_REGISTER<"ntid.y", int_ptx_read_ntid_y>;
+def PTX_READ_NTID_Z   : PTX_READ_SPECIAL_SUB_REGISTER<"ntid.z", int_ptx_read_ntid_z>;
+def PTX_READ_NTID_W   : PTX_READ_SPECIAL_SUB_REGISTER<"ntid.w", int_ptx_read_ntid_w>;
+
+def PTX_READ_CTAID_R64 : PTX_READ_SPECIAL_REGISTER<"ctaid", int_ptx_read_ctaid_r64>;
+def PTX_READ_CTAID_X   : PTX_READ_SPECIAL_SUB_REGISTER<"ctaid.x", int_ptx_read_ctaid_x>;
+def PTX_READ_CTAID_Y   : PTX_READ_SPECIAL_SUB_REGISTER<"ctaid.y", int_ptx_read_ctaid_y>;
+def PTX_READ_CTAID_Z   : PTX_READ_SPECIAL_SUB_REGISTER<"ctaid.z", int_ptx_read_ctaid_z>;
+def PTX_READ_CTAID_W   : PTX_READ_SPECIAL_SUB_REGISTER<"ctaid.w", int_ptx_read_ctaid_w>;
+
+def PTX_READ_NCTAID_R64 : PTX_READ_SPECIAL_REGISTER<"nctaid", int_ptx_read_nctaid_r64>;
+def PTX_READ_NCTAID_X   : PTX_READ_SPECIAL_SUB_REGISTER<"nctaid.x", int_ptx_read_nctaid_x>;
+def PTX_READ_NCTAID_Y   : PTX_READ_SPECIAL_SUB_REGISTER<"nctaid.y", int_ptx_read_nctaid_y>;
+def PTX_READ_NCTAID_Z   : PTX_READ_SPECIAL_SUB_REGISTER<"nctaid.z", int_ptx_read_nctaid_z>;
+def PTX_READ_NCTAID_W   : PTX_READ_SPECIAL_SUB_REGISTER<"nctaid.w", int_ptx_read_nctaid_w>;
 
 // PTX Parallel Synchronization and Communication Intrinsics
 
index 24c328b7736965b023eec1a5eee81cbabdd31bea..804d8b5f95ddaa37dd803138854ad1ea7d54a6a0 100644 (file)
@@ -28,6 +28,90 @@ define ptx_device i16 @tid_w() {
        ret i16 %x
 }
 
+define ptx_device i16 @ntid_x() {
+; CHECK: mov.u16 rh0, ntid.x;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ntid.x()
+       ret i16 %x
+}
+
+define ptx_device i16 @ntid_y() {
+; CHECK: mov.u16 rh0, ntid.y;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ntid.y()
+       ret i16 %x
+}
+
+define ptx_device i16 @ntid_z() {
+; CHECK: mov.u16 rh0, ntid.z;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ntid.z()
+       ret i16 %x
+}
+
+define ptx_device i16 @ntid_w() {
+; CHECK: mov.u16 rh0, ntid.w;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ntid.w()
+       ret i16 %x
+}
+
+define ptx_device i16 @ctaid_x() {
+; CHECK: mov.u16 rh0, ctaid.x;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ctaid.x()
+       ret i16 %x
+}
+
+define ptx_device i16 @ctaid_y() {
+; CHECK: mov.u16 rh0, ctaid.y;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ctaid.y()
+       ret i16 %x
+}
+
+define ptx_device i16 @ctaid_z() {
+; CHECK: mov.u16 rh0, ctaid.z;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ctaid.z()
+       ret i16 %x
+}
+
+define ptx_device i16 @ctaid_w() {
+; CHECK: mov.u16 rh0, ctaid.w;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.ctaid.w()
+       ret i16 %x
+}
+
+define ptx_device i16 @nctaid_x() {
+; CHECK: mov.u16 rh0, nctaid.x;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.nctaid.x()
+       ret i16 %x
+}
+
+define ptx_device i16 @nctaid_y() {
+; CHECK: mov.u16 rh0, nctaid.y;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.nctaid.y()
+       ret i16 %x
+}
+
+define ptx_device i16 @nctaid_z() {
+; CHECK: mov.u16 rh0, nctaid.z;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.nctaid.z()
+       ret i16 %x
+}
+
+define ptx_device i16 @nctaid_w() {
+; CHECK: mov.u16 rh0, nctaid.w;
+; CHECK-NEXT: ret;
+       %x = call i16 @llvm.ptx.read.nctaid.w()
+       ret i16 %x
+}
+
 define ptx_device void @bar_sync() {
 ; CHECK: bar.sync 0
 ; CHECK-NEXT: ret;
@@ -39,5 +123,17 @@ declare i16 @llvm.ptx.read.tid.x()
 declare i16 @llvm.ptx.read.tid.y()
 declare i16 @llvm.ptx.read.tid.z()
 declare i16 @llvm.ptx.read.tid.w()
+declare i16 @llvm.ptx.read.ntid.x()
+declare i16 @llvm.ptx.read.ntid.y()
+declare i16 @llvm.ptx.read.ntid.z()
+declare i16 @llvm.ptx.read.ntid.w()
+declare i16 @llvm.ptx.read.ctaid.x()
+declare i16 @llvm.ptx.read.ctaid.y()
+declare i16 @llvm.ptx.read.ctaid.z()
+declare i16 @llvm.ptx.read.ctaid.w()
+declare i16 @llvm.ptx.read.nctaid.x()
+declare i16 @llvm.ptx.read.nctaid.y()
+declare i16 @llvm.ptx.read.nctaid.z()
+declare i16 @llvm.ptx.read.nctaid.w()
 
 declare void @llvm.ptx.bar.sync(i32 %i)