如何使用SLURM获取GPU(GRES)分配报告

时间:2016-06-06 14:49:47

标签: linux gpu nvidia slurm

我读了我们可以使用的slurm docs(在设置会计后) window.openIAB = function(url, target, options) { var self = this; var ref = window.open(url, target, options); var handleChildEvents = function(ev) { if (ref != undefined) { // Closing the iab window if (ev.url.match('#close')) { ref.close(); ref = undefined; } // Opening card url with system browser if (ev.url.match('#openccard')) { var customerId = ev.url.split('#openccard-')[1]; self.ref2 = self.openIAB( 'https://www.test.com?customerID=' + customerId, '_system', 'location=yes' ); } } else { console.log('InAppBrowser has no reference'); } }; ref.addEventListener('loadstart', handleChildEvents); ref.addEventListener('loadstop', handleChildEvents); ref.addEventListener('loaderror', function(ev) { console.log('error while loading page'); ref.close(); ref = undefined; }); ref.addEventListener('exit', function(ev) { dialog.close(); }); return ref; }; 获取GRES请求的统计信息。我还使用gres.conf配置了我的GPU(有2个),但此命令始终为sacct --format="JobID,AllocCPUS,**ReqGRES**ReqGRES返回0。有任何想法吗? 提前致谢

2 个答案:

答案 0 :(得分:2)

我认为你不是root用户的原因有多种原因只是用户的作业登录,或者你必须添加选项-a,或者你的配置文件slurm.conf或者日志文件有问题。 slurm有必要检查

  

sacct -a -X --format = JobID,AllocCPUS,Reqgres

有效。

答案 1 :(得分:0)

我总是发现这些报告对sreport很有帮助。只需像在gres.conf slurm.conf中指定的那样指定TRES。

$sreport -tminper cluster utilization --tres="gres/gpu" start=2019-05-01T00:00:00
--------------------------------------------------------------------------------
Cluster Utilization 2019-05-01T00:00:00 - 2019-05-14T23:59:59
Usage reported in TRES Minutes/Percentage of Total
--------------------------------------------------------------------------------
  Cluster      TRES Name         Allocated              Down         PLND Down              Idle          Reserved           Reported 
--------- -------------- ----------------- ----------------- ----------------- ----------------- ----------------- ------------------ 
gpugrid+       gres/gpu   8186500(70.06%)     17889(0.96%)          0(0.00%)    1289051(22.97%)          0(0.00%)   9693440(100.00%) 

您还可以按用户,每个gre进行操作,例如:--tres =“ gres / gpu:v100”(配置slurm.conf)等。