Есть ли у кого-нибудь опыт работы с кластерами, работающими на ClusterVisionOS?

StackOverflow https://stackoverflow.com/questions/2423804

Вопрос

В настоящее время я работаю над кластером, используя ClusterVisionOS 3.1.Это будет мой первый раз, когда я работаю с кластером, так что я, вероятно, не пробовал "очевидное".

Я могу отправить одно задание в кластер с помощью команды "qsub" (это у меня получилось правильно).

Но проблема начинается при отправке нескольких заданий одновременно.Я мог бы написать скрипт, отправляющий их все сразу, но тогда все узлы были бы заняты моими заданиями, а здесь больше людей, желающих отправить свою работу.

Итак, вот в чем дело:

32 узла (по 4 процессора / слота в каждом)

Лучше всего было бы указать кластеру использовать 3 узла (12 процессоров) и поставить в очередь все мои задания на этих узлах / процессорах, если это вообще возможно.Если бы я мог позволить узлам использовать по 1 процессору для каждого задания, то это было бы идеально.

Это было полезно?

Решение

Хорошо, итак, я предполагаю, что я выяснил, что решения этой проблемы нет.Мое личное решение - написать скрипт, который подключается через ssh к кластеру, а затем просто позволить скрипту проверить, сколько заданий уже запущено под вашим именем пользователя.Скрипт проверяет, не превышает ли это число, скажем, 20 заданий одновременно.До тех пор, пока это число не будет достигнуто, он продолжает отправлять задания.

Может быть, это уродливое решение, но работающее!

Что касается процессора, то задания уже были отправлены на разные отдельные процессоры, полностью используя весь объем узлов.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top