Pergunta

Estou tentando descobrir se devemos experimentar o motor Condor ou Sun Grid no trabalho (ou possivelmente outra coisa).

Muitas vezes temos muitas estações de trabalho Winxp não utilizadas. A esperança é que pudéssemos usar o Wake-on-LAN, executar todos os nossos trabalhos e depois desligar automaticamente. Nós estaríamos executando principalmente simulações MATLAB, Java ou Python para explorações de Monte-Carlo ou parâmetros.

Com meu conhecimento limitado de Condor, parece que usar um universo da VM pode ser uma maneira conveniente de cuidar de instantâneos sem precisar modificar o código existente.

O SGE ou algo mais é melhor do que Condor para esse tipo de trabalho?

Foi útil?

Solução

Eu começaria com Condor. Ele tem um bom suporte para o Windows, e as versões mais recentes têm suporte interno para enviar Wake-on-LAN de uma maneira muito configurável quando os empregos podem ser executados em determinadas máquinas. Também pode desligar as máquinas com base em políticas definidas pelo usuário.

Outras dicas

SGE não verdade Windows de suporte. Vem com Todos os tipos de advertências e bits ausentes nas janelas.

Estou executando pools do Condor há muitos anos e é uma excelente configuração HTPC para roubo de ciclo e hardware sempre on-line, nas máquinas Linux e Windows. A recente adição de seu Daemon Rooster Permite colocar máquinas para dormir entre os ciclos de emprego e acordá -los quando um novo trabalho aparecer na piscina. Eles também têm uma comunidade de apoio ativa e muito útil. O check -ingting é o único recurso Condor não disponível no Windows. Tudo o resto está lá. Com a adição do universo da VM, o check -inging está ficando cada vez menos útil. Realmente: para usar o check -se com sucesso, você precisa vincular toda a pilha de código. Portanto, se você estiver executando trabalhos do MATLAB, mesmo no Linux, o check -se não será possível.

Se você tiver perguntas específicas sobre como fazer o Condor funcionar no Windows, ficaria feliz em respondê -las, compartilhe minhas experiências com ele. Eu corro Condor em 4 piscinas em todo o mundo, com um total de cerca de 1500 máquinas dedicadas em todas as piscinas e cerca de 1000 máquinas de mesa adicionais disponíveis, pois os usuários cuidam de doá -los.

Após a aquisição do Oracle do SGE (Sun Grid Engine), existe o projeto Open Grid Scheduler que ainda oferece motor de grade de código aberto.

http://gridscheduler.sourceforge.net/

Para hardware dedicado, eu iria com o mecanismo de grade.

Para ciclos de relógio de eliminação em máquinas que podem estar em uso, eu iria com o Condor.

Para o hardware ao qual você tem acesso dedicado por períodos fixos, como durante a noite e nos fins de semana, eu provavelmente ainda iria com Condor, mas seria capaz de me convencer a usar o mecanismo de grade.

Eu tive que escolher entre Condor e SGE para um projeto de cliente recentemente. Eu estava favorecendo a SGE (porque estava mais familiarizado com esse ambiente), mas Condor venceu finalmente porque:

  • A infraestrutura do cliente é orientada para o Windows e a solução SGE requer uma máquina UNIX ou Linux para o gerenciador central, + instalação de serviços MS para Unix nos hosts de computação
  • O processo de suporte e instalação do Condor no Windows foi muito mais simples.

No entanto, você não pode usar os recursos mais interessantes do Condor no Windows: Ponto de verificação não está disponível, nem o iOS específico do Condor. Não estou usando o universo da VM, então não posso comentar sobre esse aspecto.

Eu só tentei Condor, e foi uma dor tentar configurar. Se você precisar de todos os ciclos do relógio, pode utilizar totalmente, vá com Condor.

Estou prestes a experimentar o SGE e vou lhe dizer como vai. No entanto, na minha empresa, as pessoas tiveram experiência na criação de SGE, então provavelmente vou dizer que a SGE é mais fácil.

O SGE não existe ... é OGE e é muito caro. Vá com Condor.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top