跳转至

TOOLS:LSF任务投递集群管理系统的使用

LSF系统类似于PBS/qsub系统。 投递任务命令: bsub -n 16 -o test.out -e test.err -q normal ./test.sh

参数说明: + -n 指定运行的cpu数量可以是16或者8,24格式自定义最少和最大。数量最好是8的倍数。 + -o 指定输出文件名 + -e 指定错误输出文件名 + -q 指定运行的节点 + ./test.sh 是真正需要运行的任务。先添加可执行权限,chmod 757 ./test.sh

查看有哪些节点

bqueues bqueues

可以看出,有fat和normal节点,一般小任务使用普通节点。normal

查看运行的任务

bjobs 参数 : + bjobs -u all 查看所有用户的任务 + bjobs -u zhangsan 查看zhangsan的任务 + bjobs -l 查看任务详细信息 + 以宽格式来显示作业运行状态: bjobs -w + 显示所有作业: bjobs -a + 显示正在运行的作业: bjobs -r + 显示等待运行(pending)的作业和等待的原因: bjobs -p 显示已经挂起(suspending)的作业和挂起的原因: bjobs -s + 显示JOBID这个作业的所有信息: bjobs -l JOBID

终止任务

bkill JOBID 删除指定的任务id bkill 1441

其他常用命令

bpeek 查看目前的任务的标注输出 bhist 查看任务历史 yppasswd 修改用户的密码

回到页面顶部