TOOLS:LSF任务投递集群管理系统的使用
LSF系统类似于PBS/qsub系统。
投递任务命令:
bsub -n 16 -o test.out -e test.err -q normal ./test.sh
参数说明:
+ -n 指定运行的cpu数量可以是16
或者8,24
格式自定义最少和最大。数量最好是8的倍数。
+ -o 指定输出文件名
+ -e 指定错误输出文件名
+ -q 指定运行的节点
+ ./test.sh 是真正需要运行的任务。先添加可执行权限,chmod 757 ./test.sh
查看有哪些节点
bqueues
可以看出,有fat和normal节点,一般小任务使用普通节点。normal
查看运行的任务
bjobs 参数 : + bjobs -u all 查看所有用户的任务 + bjobs -u zhangsan 查看zhangsan的任务 + bjobs -l 查看任务详细信息 + 以宽格式来显示作业运行状态: bjobs -w + 显示所有作业: bjobs -a + 显示正在运行的作业: bjobs -r + 显示等待运行(pending)的作业和等待的原因: bjobs -p 显示已经挂起(suspending)的作业和挂起的原因: bjobs -s + 显示JOBID这个作业的所有信息: bjobs -l JOBID
终止任务
bkill JOBID
删除指定的任务id
bkill 1441
其他常用命令
bpeek
查看目前的任务的标注输出
bhist
查看任务历史
yppasswd
修改用户的密码