Question

Je travaille actuellement sur un cluster en utilisant les ClusterVisionOS 3.1. Ce sera la première fois que vous travaillez avec un groupe, donc je n'ai probablement pas essayé le « évidente ».

Je peux soumettre un seul emploi au cluster avec la commande « qsub » (ce que je suis fonctionne correctement)

Mais le problème commence lorsque vous soumettez plusieurs emplois à la fois. Je pourrais écrire un script de les envoyer tous à la fois, mais tous les nœuds serais occupé avec mes emplois et il y a plus de gens ici qui veulent présenter leur travail.

Alors, voici l'affaire:

32 noeuds (4 processeurs / slots chacun)

La meilleure chose serait de dire le cluster à utiliser 3 noeuds (12 processeurs) et la file d'attente tous mes travaux sur ces noeuds / processeurs, si cela est encore possible. Si je pouvais laisser les noeuds utilisent 1 processeur pour chaque emploi, alors ce serait parfait.

Était-ce utile?

La solution

Ok, donc je suppose que j'ai découvert, il n'y a pas de solution à ce problème. Ma solution personnelle est d'écrire un script qui se connecte via ssh au cluster, puis laissez le script vérifier combien d'emplois sont déjà en cours d'exécution sous votre nom d'utilisateur. Le script vérifie si ce nombre ne dépasse pas, disons, 20 emplois en même temps. Tant que ce nombre est atteint, il ne garde la soumission des travaux.

Peut-être sa solution laid, mais un travail un!

A propos de la chose du processeur, les emplois ont déjà été soumis à différents processeurs simples, en utilisant pleinement l'étendue des noeuds.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top