Вопрос

Моя компания вложила значительные средства в стек MS BI (службы отчетов SQL Server, службы анализа и службы интеграции), но я хочу взглянуть на то, на что похожа, казалось бы, самая обсуждаемая альтернатива Pentaho с открытым исходным кодом.

Я установил версию и запустил ее совершенно безболезненно.Так что это хорошо.Но на самом деле у меня нет времени начать использовать его для реальной работы, чтобы получить полное представление о пакете.

Есть ли у кого-нибудь из вас представление о том, каковы плюсы и минусы Pentaho против MS BI, или какие-либо ссылки на подобные сравнения?

Очень признателен!

Это было полезно?

Решение

Я просмотрел несколько стеков Bi, находясь на пути к отказу от бизнес-объектов.Многие из моих комментариев являются предпочтениями.Оба набора инструментов превосходны.В некоторых случаях я предпочитаю мороженое брауни с шоколадной помадкой обычному шоколаду.

С Pentaho работают действительно умные ребята, но Microsoft идет по хорошо финансируемому и хорошо спланированному пути.Имейте в виду, что MS по-прежнему остается аутсайдером на рынке баз данных.Оракул здесь король.Чтобы быть конкурентоспособной, MS раздавала много полезностей при покупке базы данных и была вынуждена пару раз изобретать свою платформу заново.Я знаю, что речь идет не о базе данных, но битва за базы данных привела к тому, что MS пришлось многое отдать, чтобы повысить ценность своего стека.

1.) Платформа
SQL server не работает в Unix или Linux, поэтому они автоматически исключаются с этого рынка.Сейчас Windows стоит примерно столько же, сколько некоторые версии Unix.Windows довольно дешевая и сейчас работает очень плохо.Это доставляет мне примерно столько же хлопот, сколько и Linux.

2.) OLAP
Службы Analysis Services были заново созданы в 2005 году (в настоящее время это 2008 год) по сравнению с версией 2000 года.Это на порядок могущественнее, чем в 2000 году.Пентахо (Мондрайн) уже не так быстр, когда ты становишься большим.Он также имеет несколько функций.Это довольно хорошо, но инструментов становится все меньше.Оба поддерживают Excel как платформу, которая является существенной.Версия MS более надежна.

3.) ETL
MS - DTS был заменен на SSIS.Опять же, скорость, мощь и способности увеличиваются на порядок.Он контролирует любое перемещение данных или управление программой.Если он не может этого сделать, вы можете написать скрипт в Powershell.наравне с Informatica в выпуске 2008 года.Pentaho - Намного лучше, чем было раньше.Не так быстро, как мне бы хотелось, но я могу делать практически все, что хочу.

4.) приборная панель
Pentaho улучшил это.Это как бы неудобно и недружелюбно для разработки, но на самом деле нет реального эквивалента для MS .

5.) отчеты
MS reports действительно мощная программа, но не такая уж сложная в использовании.Сейчас мне это нравится, но сначала я ненавидел это, пока не познакомился с этим немного лучше.Я использовал crystal reports, а MS report builder намного мощнее.В MS легко делать сложные вещи, но немного сложнее делать простые.Пентахо немного неуклюж.Мне это совсем не понравилось, но тебе могло бы понравиться.Я нахожу это чересчур сложным.Я хотел бы, чтобы это было больше похоже на Crystal report builder или MS report builder, но это похоже на jasper.Я нахожу, что это должно быть трудно.Это может быть вашим предпочтением.

6.) ad hoc
МС - это был настоящий победитель для меня.Я протестировал это на своих пользователях, и они сразу же влюбились в MS user report builder.Разница заключалась в том, что он был не только прост в использовании, но и продуктивен.Pentaho - хорошая, но довольно старая школа.Он использует более типичную модель, основанную на мастере, и обладает мощными инструментами, но я ненавижу это.Это отличный инструмент таким, какой он есть, но мы отошли от этого стиля, и никто не хочет возвращаться.Та же проблема, что и у меня с LogiXML.Интерфейс работал хорошо для того, чем он был, но на самом деле не сильно изменился по сравнению с тем, чем мы пользовались 12 лет.http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Есть несколько опытных людей, которые могут заставить Pentaho действительно хорошо работать, я просто обнаружил, что MS Suite более производителен.

Другие советы

Предупреждение - существует множество сайтов, перечисляющих многочисленные недостатки, баги и неприятности, связанные с SSIS.Не уверен, почему служба SSIS заняла первое место с этим сообщением, но прежде чем ставить на него свой проект, посмотрите, что говорят люди в блогосфере.По моему опыту, это примерно 20: 1 разглагольствований о том, как ужасно работать с SSIS - я тоже могу согласиться, в настоящее время ищу любую альтернативу.

Отличная информация здесь?Я не пробовал Pentaho, но планирую его проверить.Я опытный консультант MS BI, пользуюсь ею с 1998 года.SSIS очень быстра и мощна, но критика справедлива.Я обнаружил следующие проблемы с SSIS:

(1) Это сложно отлаживать, вы получаете загадочные ошибки, которые могут не дать вам никакого намека на то, в чем и где на самом деле заключается проблема.

(2) Согласно предыдущему комментарию, это самая дерьмовая среда разработки из когда-либо существовавших!Я понятия не имею, о чем они думают.

(a) Создайте таблицу со 100 или более столбцами и поместите в нее объединение слиянием.Теперь вернитесь и попробуйте внести обновление в объединение слиянием (например, вставить новый столбец).Это может занять несколько минут даже на самой быстрой машине после того, как вы нажмете "ОК" в окне объединения слиянием, чтобы сохранить внесенные изменения.У меня есть огромный поток данных с большим количеством широких записей и множеством объединений слиянием.Добавление одного столбца в поток данных занимает более половины дня.Я обновляю объединение слиянием, а затем должен пойти сделать что-то еще и проверить еще раз через 5-10 минут, чтобы убедиться, что это сделано.Ответ Microsoft на это заключается в том, чтобы разбить ваш пакет на несколько пакетов, поместить данные в таблицу или двоичный файл между ними.Что ж, если вы собираетесь использовать диск между всеми шагами, вы вполне можете сделать все это в SQL!Одна из основных целей инструмента ETL - хранить все это в памяти и избегать дискового ввода-вывода.

(b) Дизайнер иногда полностью выходит из строя, теряя всю вашу работу с момента последнего сохранения (из-за этого я сейчас использую ctrl-S во сне)

(c) Мне пришлось придумать способ взлома и сгенерировать XML-пакет SSIS в Excel для широких записей.У меня есть клиент в сфере здравоохранения, где более 600 записей в столбцах являются обычным делом.Если вы попытаетесь определить формат файла с 600 столбцами в SSIS, вам придется вводить каждый отдельный столбец по одному за раз!!!Даже MS access позволяет вырезать и вставлять макет из электронной таблицы в макет файла, но не SSIS.Поэтому мне пришлось сгенерировать XML-файл из макета и вставить XML-код в нужное место пакета.Некрасивый способ сделать это, но это сэкономило целые дни работы и множество ошибок.

(d) Аналогично (c), если вам нужно обрезать все ваши столбцы, и у вас их, скажем, более 600, угадайте, что?В производном компоненте столбца вы должны ввести trim(column1) более 600 раз!Теперь я выполняю все простые преобразования, подобные этому, в SQL-запросе, чтобы получить данные, поскольку их можно легко сгенерировать из листа Excel.

(e) Есть много необычных вещей, компонентов, которые становятся невидимыми, иногда вы открываете упаковку, и все компоненты полностью переставляются бессвязно.

(f) Функция FTP, возможно, одна из самых распространенных вещей, которые вам нужны в ETL, слаба и поддерживает только простой ванильный FTP, который никто не использует.В наши дни все используют SFTP, FTPS, https и т.д...Таким образом, почти каждая реализация требует использования стороннего приложения для передачи файлов с использованием командной строки, которое должен вызывать пакет.

(g) Попытка CYA, аналогичная нелепой системе безопасности в Windows Vista, Microsoft чрезвычайно усложнила фактическое продвижение пакета SSIS из одной среды в другую.По умолчанию используется эта дурацкая функция безопасности "шифрование конфиденциальной информации с помощью ключа пользователя", что означает, что она должна запускаться под той же учетной записью в среде, в которую вы ее перемещаете, что и среда, в которой вы ее разработали, что редко бывает.Есть лучшие способы настройки, но он всегда пытается вернуться к этой совершенно бесполезной защите безопасности.

(h) Наконец, большинство этих проблем теперь находятся в 3-й версии, что ясно указывает на то, что Microsoft не планирует их исправлять.

(i) Отладка далеко не так проста, как на других языках.

SSIS по-прежнему имеет множество преимуществ, но не без некоторой серьезной боли.

Я начал пользоваться MS Reporting Services много лет назад, и мне это просто нравится.Я не пробовал решение для создания отчетов Penaho, поэтому не могу его комментировать.Я также не пробовал ни Analysis Services, ни альтернативу Pentaho.

Недавно мне понадобилось решение ETL, и, будучи знакомым с MSSQL и MSRS, казалось очевидным, что я рассмотрю и, вероятно, выберу MS Integration Service.Но для меня MSIS была ужасной.В основном потому, что это не было интуитивно понятным.Потратив пару дней на изучение инструмента, я решил поискать альтернативу и наткнулся на Pentaho Data Integration, ранее известную как Kettle.Я запустил его в течение нескольких минут и сразу же произвел свою первую трансформацию.Это просто работает.

По общему признанию, мои потребности довольно просты, но производительность была отличной, и сообщество кажется очень полезным.

Я использовал SSIS и Pentaho Kettle, и я бы настоятельно рекомендовал использовать Pentaho Kettle для вашего инструмента ETL вместо SSIS.

Мои причины:-поток SSIS осуществляется от задачи к задаче.Kettle заставляет вас задуматься о строках данных, проходящих через систему.Подход Кеттла кажется мне гораздо более интуитивным.-SSIS плохо документирована.Такое случается.Но, похоже, там много щелчков по закоулкам и настроек переменных.Очень сложный.В Pentaho есть форум сообщества, который весьма полезен.-Я доверяю Pentaho в интеграции с несколькими типами баз данных, включая SQL Server.Вы также можете использовать JDBC, что очень приятно.Кроме того, я использовал его для перехода между SQL Server и Oracle с одной стороны и Vertica с другой.Для этого на Vertica доступен массовый загрузчик.Это очень мило.-Я обнаружил, что, условно говоря, заставить пакет SSIS запускаться на сервере очень, очень сложно.Это просто не стоило моего времени.-Я обнаружил, что Pentaho довольно легко отправляет предупреждение или сообщение об ошибке человеку или списку людей.-Pentaho позволяет выполнять задачи на JavaScript для вещей, требующих некоторой логики.Просто и легко выполнимо с помощью языка, с которым большинство из нас знакомы.

Я не могу предложить никаких входных данных в стеке MS BI, но в самом последнем Баркамп Орландо, ребята из Pentaho были там и рассказали о своих продуктах, и это была чрезвычайно впечатляющая демонстрация.

Тот факт, что это проект с открытым исходным кодом, который вы можете расширять самостоятельно, а также платный пакет для действительно хорошего сервиса, оставляет вам множество вариантов.Они продемонстрировали какую-то оплачиваемую работу, которую выполнили для клиента, и определенно произвели впечатление на публику.

У меня также была возможность немного пообщаться с разработчиком, работающим над хранилищем данных для Pentaho, и он был чрезвычайно проницателен, открыт для предложений и без проблем отвечал на любые вопросы.

Итак, что касается компании, Pentaho действительно произвела на меня впечатление как своей работой, так и тем, насколько дружелюбными и доступными были все их разработчики.

хочу добавить еще пару моментов

  • Хотя у всех Pentaho tools есть оконная версия, настройка в Windows является обременительной.Pentaho (особенно запуск и остановка сервера, которые отделены от инструмента графического интерфейса пользователя) обычно используется в Linux, а не в Windows shop, и от Windows к Linux идет крутая кривая обучения.
  • любой инструмент имеет кривую обучения, когда вы переходите к нему.когда вы привыкнете всегда нажимать "ОК" и обновлять метаданные при возникновении проблем, служба SSIS окажется не такой уж плохой.Пентахо тоже может быть слоеным.

Вопросы, связанные с инструментами, необходимо рассматривать с точки зрения более широких культурных вопросов - какие магазины используют инструменты с открытым исходным кодом?по своему опыту я обнаружил, что, хотя магазины Microsoft кажутся более жесткими, если у вас возникли проблемы со строкой подключения в магазине Microsoft, вы можете получить помощь..в магазинах Pentaho и Linux это больше DYI.

Кстати, следите за продавцами Pentaho, которые делают демо-версии - все, что они показывают, заставить работать намного сложнее, чем кажется!:)

Если вы ищете надежную и недорогую альтернативу big boys, в LogiXML есть панель мониторинга и специальные отчеты на платформе .NET.Мы используем их с конца 2006 года, когда Pentaho только начинался, но я давно к нему не заглядывал.

Недавно я попробовал pentaho BI с открытым исходным кодом.Мне это показалось чрезвычайно неуклюжим.Это было не очень интуитивно понятно, и время разработки заняло намного больше времени.

Это сильно отличается от решений Oracle или ms BI.Возможно, корпоративная версия лучше.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top