节点资源抢占命令salloc

注意

集群的登录节点设置有资源限制,请勿在登录节点进行大量计算。

集群的计算节点默认不允许用户直接登录,对需要交互式处理的程序, 在登录到集群后,使用salloc命令分配节点,然后再ssh到分配的节点上进行处理:

image3

计算完成后,使用exit命令推出节点,注意需要exit两次, 第一次exit是从计算节点退出到登录节点,第二次exit是释放所申请的资源。

image4

该命令支持用户在提交作业前,抢占所需计算资源(此时开始计算所用机时)。

使用示例

salloc提交方式如下: 首先申请资源,执行如下命令:

 $ salloc -n 8 -p hw-32C768G --comment=group_name
  salloc: Granted job allocation 10780
  salloc: Waiting for resource configuration
  salloc: Nodes cpu1 are ready for job

 #Check the jobID 10780 and the nodes cpu1 by squeue command.
$squeue
          JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
          10780 hw-32C768 interact      leo  R       0:09      1 cpu1

更多选项,用户可以通过 scancel --help 命令来查看。