Pregunta

Actualmente estoy trabajando en un clúster mediante las ClusterVisionOS 3.1. Esta será la primera vez que trabajo con un grupo, así que probablemente no han probado el "evidente".

Puedo presentar un solo trabajo con el grupo con el comando "qsub" (esto me funciona correctamente)

Pero el problema comienza cuando la presentación de varios trabajos a la vez. Podría escribir un guión de enviarlos todos a la vez, pero entonces todos los nodos sería ocupado con mis trabajos y hay más gente aquí con el deseo de presentar su trabajo.

Así que este es el trato:

32 nodos (4 procesadores / ranuras cada uno)

Lo mejor sería decirle que el clúster use 3 nodos (12 procesadores) y la cola de todos mis trabajos en estos nodos / procesadores, si esto es posible. Si pudiera dejar que los nodos utilizan un procesador de 1 para cada trabajo, entonces eso sería perfecto.

¿Fue útil?

Solución

Ok, así que supongo que descubrí, no hay una solución a este problema. Mi solución personal es escribir un script que se conecta a través de ssh para el clúster y luego dejar comprobar el guión cuántos puestos de trabajo ya están funcionando bajo su nombre de usuario. El script comprueba si ese número no sea superior, digamos, 20 puestos de trabajo al mismo tiempo. Mientras no se alcance este número se mantenga la presentación de trabajos.

Tal vez sea una solución feo, pero uno que funcione!

Sobre la cosa procesador, los puestos de trabajo ya estaban sometidos a distintos procesadores individuales, utilizando plenamente el alcance total de los nodos.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top