我目前正在使用ClusterVisionOS 3.1的群集上。这将是我第一次与集群的工作,所以我可能没有尝试过的“明显”。

我可以提交一个作业到集群与“的qsub”命令(此我被正常工作)

但提交多个作业时一次的问题开始。我可以写一个脚本发送一次全部,但后来所有的节点都与我的工作所占据,这里有更多的人希望提交自己的工作。

所以这里的交易:

32个节点(4个处理器/每时隙)

在最好的事情是告诉群集使用3个节点(12个处理器)和排队我对这些节点/处理器的所有作业,如果这甚至有可能。如果我可以让节点使用1个处理器为每个作业,那么这将是完美的。

有帮助吗?

解决方案

好了,我想我发现,没有解决这个问题。我个人的解决办法是写一个通过ssh连接到集群,然后才让脚本检查有多少工作在你的用户名已经在运行一个脚本。该脚本检查该数目不超过,让在同一时间说,20个职位。只要没有达到这个数字保持它提交作业。

也许它的丑陋的解决方案,但工作一个!

关于所述处理器的事,作业已经提交到不同的单一处理器,充分利用节点的全部范围。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top