本文共 866 字,大约阅读时间需要 2 分钟。
本文链接:
首先参考前一篇文章
假定“单机安装运行PBS (Torque)”中安装的机器作为master,下面来向cluster添加新的nodes。这里假定新加入nodes的机器名是host1和host2。
安装
1. 将master机器上生成的torque-package-*.sh文件复制到host1和host2上
2. 分别在host1和host2上运行下面命令执行安装
- $ sudo torque-package-mom-*.sh --install
- $ sudo torque-package-clients-*.sh --install
启动停止服务
1. 分别在host1和host2上运行下面命令启动mom服务
- $ sudo /url/local/sbin/pbs_mom
2. 在master机器上添加节点
- $ qmgr -c 'create node host1 np=5'
- $ qmgr -c 'create node host2 np=5'
添加完成后可以在master机器上使用qnodes命令查看,此时看到的新加入的两个节点state应该是offline。
3. 在master机器上重启服务使修改生效
- $ sudo /etc/init.d/pbs_server restart
再次在master机器上运行qnodes查看新加入节点状态,此时state变成了free,这说明新加入的节点已经生效可以使用了。
测试
1. 在master机器上写一个测试脚本/opt/test/sleep.sh, 内容如下
2. 提交作业 (可以多提交一些,来检查是不是作业被分发到新添加的机器上运行了,比如运行下面的命令15次)
- $ qsub /opt/test/sleep.sh
3. 检查作业
此时可以看到各个作业是在那个机器上运行的。 转载地址:http://diuli.baihongyu.com/