Pergunta

Nossa empresa está investido fortemente na MS BI Stack (SQL Server Reporting Services, -Análise Serviços e -Integração Serviços), mas eu quero ter um olhar para o que o aparentemente mais falado alternativa open-source Pentaho é como.

Eu instalei uma versão, e eu tenho que levantar e correr quase sem dor. Então, isso é bom. Mas eu realmente não tenho o tempo para começar a usá-lo para o trabalho real para obter uma compreensão completa do pacote.

Algum de vocês tem alguma insights sobre quais são os prós e contras de Pentaho vs MS BI, ou quaisquer links para tais comparações?

Muito apreciada!

Foi útil?

Solução

Eu revi várias pilhas bi, enquanto em um caminho para sair da Business Objects. Muitos dos meus comentários são preferência. Ambos os conjuntos de ferramentas são excelentes. Algumas coisas são como eu preferem o chocolate creme fudge brownie de gelo sobre o chocolate simples.

Pentaho tem alguns caras realmente inteligentes trabalhando com eles, mas a Microsoft tem sido em um caminho bem financiados e bem planejado. Manter em MS mente ainda são os underdogs no mercado de banco de dados. Oracle é rei aqui. Para ser MS competitivos tem sido dando um monte de guloseimas quando você compra o banco de dados e foram obrigados a reinventar sua plataforma de um par de vezes. Eu sei que isto não é sobre o banco de dados, mas a batalha DB tem causa MS para dar um monte, a fim de agregar valor à sua stack.

1.) Plataforma
servidor SQL não é executado em Unix ou Linux para que eles são automaticamente excluídos deste mercado. Windows é aproximadamente o mesmo preço como algumas versões ou Unix agora. Windows é muito barato e funciona faily bem agora. Dá-me sobre tantos problemas quanto Linux.

2.) OLAP
serviços de análise foi reinventada em 2005 (atual é 2008) sobre a versão de 2000. É uma ordem de magnatude mais potente em relação a 2000. O pentaho (Mondrian) não é tão rápido uma vez que você ficar grande. Ele também tem algumas características. É muito bom, mas há menos na forma de ferramentas. Ambos suporte Excel como a plataforma que é esscential. A versão MS é mais robusto.

3.) ETL
MS - DTS foi substituído com SSIS. Mais uma vez, a fim de aumento magnatude em velocidade, a potência ea capacidade. Ele controla toda e qualquer movimentação de dados ou controle do programa. Se não puder fazê-lo, você pode escrever um script em PowerShell. A par com Informatica no lançamento em 2008. Pentaho - Muito melhor do que é utilizado para ser. Não tão rápido como eu gostaria, mas eu posso fazer quase tudo que eu quero fazer.

4.) Dashboard
Pentaho melhorou este. É uma espécie de desconfortável e hostil para desenvolver, mas não há realmente uma verdadeira equiv para MS.

5.) Relata
relatórios de MS é realmente poderoso, mas não tão difícil de usar. Eu gosto dele, mas agora odiava no início, até que cheguei a conhecê-lo um pouco melhor. Eu tinha sido usando Crystal Reports e o relatório construtor MS é muito mais poderoso. É fácil de fazer coisas difíceis no MS, mas um pouco mais difícil de fazer as coisas mais fáceis. Pentaho é um pouco desajeitado. Eu não gosto nada disso, mas você pode. Eu achei que fosse excessivamente complexa. Eu queria que fosse tanto mais como o construtor de relatório de cristal ou o construtor de relatório MS, mas é de jaspe como. Eu acho é que ser duro. Isso pode ser uma preferência.

6.) Ad hoc
MS - este foi o verdadeiro vencedor para mim. Eu testei com meus usuários uma que imediatamente no amor com o construtor relatório de um utilizador MS. O que fez a diferença foi como ele não era apenas fácil de usar, mas também produtiva. Pentaho - é bom, mas bastante antiga escola. Ele usa o modelo baseado assistente mais típico e tem ferramentas poderosas, mas eu odeio isso. É uma excelente ferramenta para o que é, mas se mudaram a partir deste estilo e ninguém quer voltar. Mesmo problema que tive com logiXML. A interface funcionou bem para o que era, mas não é realmente muito de uma mudança a partir do que foi utilizado 12 anos. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of + interactivo + Relatórios

Existem algumas pessoas experientes lá fora, que podem fazer Pentaho realmente correr bem, eu só encontrei a suite MS para ser mais produtivo.

Outras dicas

Aviso - existem inúmeros sites lá fora, listando as inúmeras deficiências, erros, e aborrecimentos com SSIS. Não sei por que SSIS saiu por cima com o post - mas antes de apostar o seu projecto sobre ele, olhar para o que as pessoas têm a dizer na blogosfera. Da minha experiência a cerca de 20:. 1 ranting sobre como SSIS horrível é trabalhar com - Posso concordar, bem como, actualmente à procura de qualquer alternativa

Great informações aqui? Eu não tentei Pentaho mas e planejamento no check-out. Eu sou um consultor MS BI temperado, usando-o desde 1998. SSIS é muito rápido e muito poderoso, mas as críticas são local. Eu encontrei as seguintes questões com SSIS:

(1) É difícil de depuração, você recebe erros enigmáticas que podem não lhe dar qualquer dica sobre o que e onde o problema realmente é.

(2) por um comentário anterior, é o ambiente shittiest desenvolvimento sempre! Eu não tenho idéia o que eles estão pensando.

(a) Criar uma tabela com 100 ou mais colunas e colocar uma junção por mesclagem nele. Agora voltar e tentar fazer uma atualização para o junção de mesclagem (como puxar uma nova coluna through). Pode demorar vários minutos, mesmo na máquina mais rápida após clicar em OK na junção de mesclagem para salvar as alterações. Eu tenho um enorme fluxo de dados com muitos registros de largura e muitos merge joins. Adicionando uma coluna para o fluxo de dados leva mais de metade de um dia. Eu atualizar uma junção por mesclagem e depois ter de ir fazer outra coisa e volte 5-10 minutos mais tarde para ver se ele é feito. a resposta da Microsoft para isso é para quebrar o seu pacote em vários pacotes, colocar os dados em uma tabela ou binário entre eles. Bem, se você estiver indo para disco entre todas as etapas, talvez foi muito bem fazer a coisa toda em SQL! Um dos principais propósitos de uma ferramenta ETL é tudo isso na memória e disco evitar I / O.

(b) O designer outright cai às vezes, perdendo todo o seu trabalho desde o último save (I fazer ctrl-S no meu sono agora por causa disso)

(c) eu tinha que descobrir um hack e gerar XML pacote do SSIS no Excel para registros de largura. Eu tenho um cliente Healthcare, onde mais de 600 registros de coluna são comuns. Se você tentar definir um formato de arquivo com 600 colunas em SSIS, você tem que digitar cada coluna única em um de cada vez !!! Mesmo acesso MS permite cortar e colar um layout de uma planilha em um layout de arquivo, mas não SSIS. Então eu tive que gerar o XML do layout e cole o código XML para o lugar certo no pacote. forma feia para fazê-lo, mas ele salvou dias inteiros de trabalho e um monte de erros.

(d) Semelhante a (c), se você precisa cortar todas as suas colunas e você tem dizer 600 + deles, adivinhem? No componente de coluna derivada, você tem que tipo de guarnição (column1) de 600 vezes! Eu agora fazer todas as transformações simples como esta na consulta SQL para obter os dados, uma vez que pode facilmente ser gerada a partir de uma folha de Excel.

(e) Há muitas coisas peculiares, componentes que transformam invisível, às vezes você abrir o pacote e todos os componentes são completamente re-arranjadas de forma incoerente.

(f) O recurso FTP, possivelmente, uma das coisas mais comuns que você precisa em ETL, é fraco e só suporta FTP plain vanilla que ninguém usa. Todos estes dias usa SFTP, FTPS, https, etc ... Assim, quase toda implementação requer o uso de uma terceira linha do partido elogiar impulsionado aplicativo de transferência de arquivos do pacote tem que chamar.

(g) Tentando CYA, similar à segurança ridículo no Windows Vista, a Microsoft tornou extremamente difícil de realmente promover um pacote SSIS a partir de um ambiente para outro. O padrão é essa coisa estúpida de "criptografia de informações sensíveis com chave de usuário" de segurança que significa que deve ser executado sob a mesma conta no ambiente que você está movendo-a para que o ambiente que você desenvolveu, algo que raramente é o caso. Há maneiras melhores para configurar, mas ele sempre tenta reverter para esta proteção de segurança completamente inútil.

(h) Por último a maioria destes problemas estão agora lá 3ª versão, indicando claramente Microsoft não tem um plano para corrigi-los.

(i) A depuração não é tão fácil como outras línguas.

SSIS ainda tem muitos benefícios, mas não sem um pouco de dor grave.

Eu comecei usando o MS Reporting Services há muitos anos e adoro isso. Eu não tentei solução de relatórios de Penaho então eu não posso comentar sobre isso. Também não tenho tentado qualquer alternativa de Pentaho Analysis Services ou.

Recentemente eu precisava de uma solução ETL e estar familiarizado com MSSQL e MSRS parecia óbvio que eu iria rever e provavelmente escolher Integration Service MS. Mas para mim, MSIS foi horrível. Principalmente porque não era intuitivo. Depois de passar um par de dias tentando aprender a ferramenta eu decidi procurar uma alternativa e me deparei com Pentaho Data Integration, anteriormente conhecido como Kettle. Eu tive-lo em funcionamento em poucos minutos e imediatamente criou a primeira transformação. Ele simplesmente funciona.

É certo que minhas necessidades são bastante simples, mas o desempenho tem sido grande ea comunidade parece muito útil.

Eu tenho usado SSIS e Pentaho Kettle, e eu recomendo utilizando Pentaho Kettle para a sua ferramenta de ETL em vez de SSIS.

As minhas razões: -O fluxo de SSIS é uma tarefa para outra. Chaleira faz você pensar sobre linhas de dados que fluem através do sistema. A abordagem da chaleira parece muito mais intuitivo para mim. -SSIS é mal documentada. Isto acontece. Mas parece haver um monte de clicar nook-and-recanto e configuração de variáveis. Muito complexo. Pentaho tem um fórum da comunidade que é bastante útil. confiança -I Pentaho para integrar com vários tipos de bancos de dados, incluindo SQL Server. Você também pode usar JDBC que é bom. Além disso, eu usei-o para ir entre o SQL Server e Oracle de um lado e Vertica por outro. Tem um carregador em massa disponível para ele no Vertica. Isso é bastante agradável. -Eu achei muito, muito duro relativamente falando para obter um pacote SSIS para executar em um servidor. Ele só não foi pena o meu tempo. -Eu achei muito fácil para Pentaho para enviar um aviso ou mensagem de erro a uma pessoa ou lista de pessoas. -Pentaho permite tarefas a ser feito em JavaScript para coisas que precisam alguma lógica. Simples e facilmente feito com uma língua a maioria de nós já se deparou.

Eu não posso oferecer qualquer entrada no MS BI Pilha mas no mais recente Barcamp Orlando , o pessoal da Pentaho estavam lá e falou sobre seus produtos e foi uma demonstração extremamente impressionante.

O fato de que é um projeto Open Source que você pode estender-se, bem como um pacote pago para realmente bons folhas de serviços-lo com um monte de opções. Eles demonstraram algum trabalho remunerado que eles fizeram para um cliente e eles definitivamente wow continuação da multidão.

Eu também tive a oportunidade de conversar um pouco com um trabalho programador nos dados de armazenagem lado das coisas para Pentaho e ele foi extremamente afiada e era muito aberto a sugestões e não tinha problemas respondendo a todas as perguntas.

Assim, tanto quanto uma empresa vai, Pentaho realmente me impressionou tanto com seu trabalho e como todos amigável e acessível de seus desenvolvedores foram.

um par de pontos para adicionar

  • Embora não haja uma versão janela de todas as ferramentas Pentaho a configuração no Windows é onerosa. Pentaho (especialmente no início do servidor e parada, que é separado da ferramenta GUI) é normalmente usado em Linux, não vitrines, e não há curva de aprendizagem vai do Windows para o Linux.
  • qualquer ferramenta tem uma curva de aprendizagem quando você mudar para ele. quando você se acostumar com clicando sempre OK e refrescante metadados quando você tem problemas, SSIS não é tão ruim. Pentaho pode ser esquisito também.

perguntas de ferramentas precisam ser abordadas em termos de maiores questões culturais - que tipo de lojas usam ferramentas de código aberto? na minha experiência eu descobri que althsough lojas da Microsoft parece mais rígida, quando você tiver problemas com uma seqüência de conexão em um Microsoft loja você pode obter ajuda .. em Pentaho e Linux lojas sua mais DYI.

BTW, atente para Pentaho caras de vendas fazendo demos - todas as coisas que eles mostram são muito mais difíceis de se trabalhar do que parece! :)

Se você está procurando uma alternativa de custo robusto, de baixo para os meninos grandes LogiXML tem dashboards e relatórios ad hoc em uma plataforma .NET. Estivemos usá-los desde o final de 2006, quando Pentaho estava apenas começando, mas eu não olhei para ele em algum tempo.

Eu tentei recentemente pentaho open source BI. Eu achei que fosse extremamente desajeitado. Não era muito intuitivo e tempo de desenvolvimento levou muito mais tempo.

É muito diferente de qualquer Oracle ou MS soluções de BI. Talvez a edição Enterprise é melhor.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top