快速开始
1. 验证 daemon
如果你通过脚本安装,并且没有使用 --skip-systemd,daemon 应该已经启动。
先检查基础命令:
sinfo
squeue
sacct
首次运行时的典型结果:
sinfo会为每个已配置分区显示一行squeue为空sacct为空
2. 提交一个简单的批处理作业
sbatch --wrap 'echo hello from slotd'
典型输出:
Submitted batch job 1
3. 查看队列
squeue
作业运行时的典型输出:
JOBID | PARTITION | NAME | USER | ST | TIME | NODELIST(REASON)
1 | cpu | wrap | ... | R | 0:00 | localhost
4. 查看已完成作业
sacct
作业完成后的典型输出:
JobID | Partition | JobName | User | State | ExitCode
1 | cpu | wrap | ... | COMPLETED | 0:0
5. 查看详细作业信息
scontrol show job 1
这里会显示:
- 作业标识与所有者
- 作业状态与 reason
- 请求的资源
- 输出路径
- 工作目录
- 各类时间戳
6. 试一下交互执行
srun --label --unbuffered -- echo hello
典型输出:
0: hello