문제

현재 ClusterVisionOS 3.1을 사용하여 클러스터에서 작업하고 있습니다. 클러스터로 작업 한 것은 이번이 처음 일 것이므로 아마도 "명백한"것을 시도하지 않았을 것입니다.

"QSUB"명령으로 단일 작업을 클러스터에 제출할 수 있습니다 (제대로 작동했습니다).

그러나 한 번에 여러 작업을 제출할 때 문제가 시작됩니다. 나는 한 번에 그들을 보내는 대본을 쓸 수 있었지만, 모든 노드는 내 직업으로 점유 될 것이며 여기에 더 많은 사람들이 직장을 제출하고 싶어합니다.

그래서 여기에 거래가 있습니다.

32 개의 노드 (각 4 개의 프로세서/슬롯)

가장 좋은 점은 클러스터에게 3 개의 노드 (12 개 프로세서)를 사용하도록 지시하고 가능하다면 이러한 노드/프로세서에서 모든 작업을 대기하는 것입니다. 노드가 각 작업마다 1 개의 프로세서를 사용하도록 할 수 있다면 완벽합니다.

도움이 되었습니까?

해결책

좋아, 그래서 나는이 문제에 대한 해결책이 없다고 생각했다. 내 개인 솔루션은 SSH를 통해 클러스터에 연결하는 스크립트를 작성한 다음 스크립트가 사용자 이름으로 이미 실행중인 작업 수를 확인하도록합니다. 스크립트는 해당 숫자를 초과하지 않는지 확인합니다. 이 숫자에 도달하지 않는 한 작업을 계속 제출하십시오.

어쩌면 못생긴 솔루션이지만 작동하는 솔루션입니다!

프로세서에 대해, 작업은 이미 다른 단일 프로세서에 제출되었으며, 노드의 전체 범위를 완전히 활용했습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top