Pregunta

Estoy tratando de averiguar si debemos probar el cóndor o el motor de la cuadrícula solar en el trabajo (o posiblemente algo más).

A menudo tenemos muchas estaciones de trabajo WinXP no utilizadas. La esperanza es que podamos usar Wake-On-Lan, ejecutar todos nuestros trabajos y luego apagar automáticamente. Principalmente estaríamos ejecutando simulaciones Matlab, Java o Python para exploraciones de Monte-Carlo o parámetros.

Con mi conocimiento limitado de Condor, parece que usar el universo VM podría ser una forma conveniente de cuidar las instantáneas sin tener que modificar el código existente.

¿Es SGE o algo más mejor que Cóndor para este tipo de trabajo?

¿Fue útil?

Solución

Comenzaría con Condor. Tiene un buen soporte para Windows, y las versiones más nuevas tienen soporte incorporado para enviar Wake-On-Lan de una manera muy configurable cuando los trabajos pueden ejecutarse en ciertas máquinas. También puede apagar las máquinas según las políticas definidas por el usuario.

Otros consejos

SGE no De Verdad Soporte de ventanas. Viene con Todo tipo de advertencias y bits faltantes en Windows.

He estado ejecutando Pools de CONDOR durante muchos años y es una excelente configuración de HTPC tanto para robo de ciclo como para hardware dedicado, siempre encendido, en máquinas Linux y Windows. La reciente incorporación de su Daemón del gallo Le permite poner las máquinas para dormir entre los ciclos de trabajo y despertarlas cuando aparezca un nuevo trabajo en la piscina. También tienen una comunidad de apoyo activa y muy útil. CheckPointing es la única función de CONDOR que no está disponible en Windows. Todo lo demás está ahí. Con la adición del universo VM, el punto de control se está volviendo cada vez menos útil. Realmente: para usar el punto de control de Checking con éxito, debe poder volver a relacionar toda su pila de código. Entonces, si está ejecutando trabajos de Matlab, incluso en Linux, el punto de vista no será posible.

Si tiene preguntas específicas sobre cómo hacer que Cóndor se ejecute en Windows, estaría encantado de responderlas, comparta mis experiencias con él. Corrto a Cóndor en 4 piscinas alrededor del mundo con un total de aproximadamente 1500 máquinas dedicadas en todas las piscinas y unas 1000 máquinas de escritorio adicionales que están disponibles como usuarios cuentan que las cuidan donar.

Después de la adquisición de Oracle de SGE (Sun Grid Engine), existe el proyecto de programador de cuadrícula abierta que aún ofrece motor de cuadrícula de código abierto.

http://gridscheduler.sourceforge.net/

Para hardware dedicado iría con motor de cuadrícula.

Para la eliminación de ciclos de reloj en máquinas que pueden estar en uso, iría con Cóndor.

Para el hardware al que tiene acceso dedicado por períodos fijos, como durante la noche y los fines de semana, probablemente todavía iría con Cóndor pero podría persuadirme para usar el motor Grid.

He tenido que elegir entre Cóndor y SGE para un proyecto de cliente recientemente. Estaba favoreciendo a SGE (porque estaba más familiarizado con ese entorno), pero Condor ganó finalmente porque:

  • La infraestructura del cliente está orientada a Windows, y la solución SGE requiere una máquina UNIX o Linux para el administrador central, + instalación de servicios de MS para UNIX en los hosts de cálculo
  • El proceso de soporte e instalación de Cóndor en Windows fue mucho más simple.

Sin embargo, no puede usar las características más interesantes de Condor en Windows: el punto de control no está disponible, ni el Cóndor específico de iOS. No estoy usando el universo VM, por lo que no puedo comentar sobre ese aspecto.

Solo probé Cóndor, y fue un dolor intentar establecer. Si necesita todos los ciclos de reloj que puede utilizar completamente, vaya con Cóndor.

Estoy a punto de probar SGE, y te diré cómo va. Sin embargo, en mi empresa, la gente ha tenido experiencia en la creación de SGE, por lo que probablemente diré que SGE es más fácil.

SGE no existe ... es OGE, y es muy costoso. Ve con Cóndor.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top