Лучше построить или купить платформу вычислительной сетки?
Вопрос
Я собираюсь сделать некоторую довольно интенсивную процессорную обработку грубой силы для сопоставления строк. Я запустил свой прототип в многопоточной среде и сравнил производительность с реализацией с использованием Gridgain с несколькими узлами (также многопоточными).
Производительность, которую я наблюдал, заключалась в том, что моя реализация Gridgain работала медленнее моей многопоточной реализации. Возможно, в том, что в моей реализации Gridgain был недостаток, но это был только прототип, и я подумал, что результаты были показательными. Итак, мой вопрос в следующем:
Каковы преимущества необходимости учиться, а затем создать реализацию для конкретной платформы сетки (Hadoop, Gridgain или EC2, если принять участие - другие предложения приветствуются), когда можно было бы довольно легко собрать легкую вычислительную платформу с гораздо более мелкой Кривая обучения? ... т.е. что мы получаем бесплатно с этими платформами облака/сетки, которые стоит иметь/сложно реализовать?
(Обратите внимание, у меня нет необходимости в сетке данных)
Ваше здоровье,
-Джеймс
(PS рад сделать это сообщество вики, если необходимо)
Решение
Чтобы решить это, вы можете использовать сшивание .Также см. Что такое «функция сшивания»? .