Domanda

La mia azienda è fortemente investita nello stack MS BI (SQL Server Reporting Services, -Analysis Services e -Integration Services), ma voglio dare un'occhiata a come è Pentaho, l'alternativa open source apparentemente più discussa.

Ho installato una versione e l'ho installata e funzionante abbastanza indolore. Quindi va bene. Ma non ho davvero il tempo di iniziare a usarlo per il lavoro effettivo per comprendere a fondo il pacchetto.

Qualcuno di voi ha avuto qualche idea su quali siano i pro e i contro di Pentaho vs MS BI o qualsiasi link a tali confronti?

Molto apprezzato!

È stato utile?

Soluzione

Ho esaminato più stack Bi durante un percorso per uscire da Business Objects. Molti dei miei commenti sono di preferenza. Entrambi i set di strumenti sono eccellenti. Alcune cose sono come preferisco il gelato brownie al cioccolato fondente rispetto al cioccolato fondente.

Pentaho ha alcuni ragazzi davvero intelligenti che lavorano con loro, ma Microsoft ha intrapreso un percorso ben finanziato e ben pianificato. Tieni presente che gli Stati membri sono ancora gli sfavoriti nel mercato dei database. Oracle è il re qui. Per essere competitivi, MS ha dato molti premi quando si acquista il database e sono stati costretti a reinventare la propria piattaforma un paio di volte. So che non si tratta del database, ma la battaglia del DB ha fatto sì che MS desse molto per aggiungere valore al loro stack.

1.) Piattaforma
Il server SQL non funziona su Unix o Linux, quindi vengono automaticamente esclusi da questo mercato. Windows ha circa lo stesso prezzo di alcune versioni o Unix ora. Windows è piuttosto economico e funziona bene ora. Mi dà più problemi di Linux.

2.) OLAP
I servizi di analisi sono stati reinventati nel 2005 (l'attuale è il 2008) rispetto alla versione 2000. È un ordine di magnatude più potente rispetto al 2000. Il pentaho (Mondrian) non è così veloce una volta diventato grande. Ha anche alcune funzionalità. È abbastanza buono ma ci sono meno strumenti. Entrambi supportano Excel come piattaforma essenziale. La versione MS è più robusta.

3.) ETL
MS - DTS è stato sostituito con SSIS. Ancora una volta, l'ordine di magnatude aumenta di velocità, potenza e abilità. Controlla qualsiasi spostamento di dati o controllo del programma. In caso contrario, puoi scrivere uno script in Powershell. Alla pari con Informatica nella versione 2008. Pentaho: molto meglio di prima. Non veloce come vorrei, ma posso fare praticamente tutto quello che voglio fare.

4.) dashboard
Pentaho ha migliorato questo. È un po 'scomodo e ostile da sviluppare, ma in realtà non esiste un vero equivalente per la SM.

5.) rapporti
I rapporti sulla SM sono davvero potenti ma non così difficili da usare. Mi piace ora, ma all'inizio l'ho odiato, fino a quando non ho avuto modo di conoscerlo un po 'meglio. Avevo usato i report Crystal e il generatore di report MS è molto più potente. È facile fare cose difficili nella SM, ma un po 'più difficile fare cose facili. Pentaho è un po 'goffo. Non mi è piaciuto per niente ma potresti. L'ho trovato eccessivamente complesso. Vorrei che fosse più simile al generatore di report Crystal o al generatore di report MS, ma è come un diaspro. Trovo che sia difficile. Questa potrebbe essere una preferenza.

6.)
ad hoc MS - questo è stato il vero vincitore per me. L'ho provato con i miei utenti e si sono innamorati all'istante del generatore di report degli utenti MS. Ciò che ha fatto la differenza è stato il modo in cui non era solo facile da usare, ma anche produttivo. Pentaho - è buona ma piuttosto vecchia scuola. Utilizza il più tipico modello basato su procedura guidata e ha strumenti potenti ma lo odio. È uno strumento eccellente per quello che è, ma siamo passati da questo stile e nessuno vuole tornare indietro. Lo stesso problema che ho avuto con logiXML. L'interfaccia ha funzionato bene per quello che era, ma non è molto un cambiamento rispetto a quello che abbiamo usato 12 anni. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of + + Interactive reporting

Ci sono alcune persone con esperienza là fuori che possono far funzionare davvero Pentaho, ho appena trovato la suite MS più produttiva.

Altri suggerimenti

Avviso: ci sono numerosi siti là fuori che elencano le numerose carenze, bug e fastidi con SSIS. Non sono sicuro del perché SSIS sia arrivato al primo posto con il post, ma prima di scommettere sul tuo progetto, guarda cosa hanno da dire le persone nella blogosfera. Dalla mia esperienza è circa 20: 1 su quanto orribile SSIS debba lavorare - posso anche concordare, attualmente alla ricerca di qualsiasi alternativa.

Grandi informazioni qui? Non ho provato Pentaho ma ho intenzione di provarlo. Sono un esperto consulente MS BI, lo uso dal 1998. SSIS è molto veloce e molto potente, ma le critiche sono esatte. Ho riscontrato i seguenti problemi con SSIS:

(1) È difficile eseguire il debug, si ottengono errori criptici che potrebbero non darti alcun suggerimento su cosa e dove si trova realmente il problema.

(2) Per un precedente commento, è l'ambiente di sviluppo più schifoso di sempre! Non ho idea di cosa stiano pensando.

(a) Crea una tabella con 100 o più colonne e mettici sopra un join. Ora torna indietro e prova a fare un aggiornamento al join unione (come passare una nuova colonna). Possono essere necessari diversi minuti, anche sulla macchina più veloce dopo aver fatto clic su OK sull'unione di unione per salvare le modifiche. Ho un enorme flusso di dati con molti record ampi e molti join di unione. L'aggiunta di una colonna al flusso di dati richiede più di mezza giornata. Aggiornamento un join di merge e poi devo andare a fare qualcos'altro e ricontrollare 5-10 minuti dopo per vedere se è fatto. La risposta di Microsoft a questo è di suddividere il pacchetto in più pacchetti, posizionare i dati in una tabella o binari tra di essi. Bene, se hai intenzione di eseguire il disco tra tutti i passaggi, potresti fare tutto in SQL! Uno degli scopi principali di uno strumento ETL è di tutto ciò in memoria ed evitare l'I / O del disco.

(b) Talvolta il designer si arresta in modo anomalo, perdendo tutto il lavoro dall'ultimo salvataggio (ora faccio ctrl-S nel sonno a causa di ciò)

(c) Ho dovuto capire un hack e generare XML del pacchetto SSIS in Excel per record ampi. Ho un cliente Healthcare in cui oltre 600 record di colonne sono all'ordine del giorno. Se provi a definire un formato di file con 600 colonne in SSIS, devi digitare ogni singola colonna in una alla volta !!! Anche l'accesso MS ti consente di tagliare e incollare un layout da un foglio di calcolo in un layout di file, ma non SSIS. Quindi ho dovuto generare l'XML dal layout e incollare il codice XML nel posto giusto nel pacchetto. Brutto modo di farlo, ma ha risparmiato interi giorni di lavoro e molti errori.

(d) Simile a (c), se hai bisogno di tagliare tutte le tue colonne e ne dici 600+, indovina un po '? Nel componente della colonna derivata, devi digitare trim (colonna1) 600+ volte! Ora faccio tutte le trasformazioni semplici come questa nella query SQL per ottenere i dati, dal momento che possono essere facilmente generati da un foglio Excel.

(e) Ci sono molte cose bizzarre, componenti che diventano invisibili, a volte apri il pacchetto e tutti i componenti sono completamente riorganizzati in modo incoerente.

(f) La funzione FTP, forse una delle cose più comuni di cui hai bisogno in ETL, è debole e supporta solo FTP vaniglia semplici che nessuno usa. Oggi tutti usano SFTP, FTPS, https, ecc ... Quindi quasi tutte le implementazioni richiedono l'utilizzo di un'app di trasferimento file basata su linea commend di terze parti che il pacchetto deve chiamare.

(g) Provando a CYA, simile alla ridicola sicurezza di Windows Vista, Microsoft ha reso estremamente difficile promuovere effettivamente un pacchetto SSIS da un ambiente all'altro. L'impostazione predefinita è questa stupida cosa di "crittografare informazioni sensibili con la chiave utente" sicurezza, il che significa che deve essere eseguito con lo stesso account nell'ambiente in cui lo si sta spostando come l'ambiente in cui è stato sviluppato, cosa che accade raramente. Esistono modi migliori per configurare, ma cerca sempre di ripristinare questa protezione della sicurezza completamente inutile.

(h) Infine, la maggior parte di questi problemi sono ora nella terza versione, il che indica chiaramente che Microsoft non ha in programma di risolverli.

(i) Il debug non è facile come le altre lingue.

SSIS ha ancora molti vantaggi, ma non senza alcun dolore serio.

Ho iniziato a utilizzare MS Reporting Services molti anni fa e lo adoro. Non ho provato la soluzione di segnalazione di Penaho, quindi non posso commentarla. Né ho provato né Analysis Services né l'alternativa di Pentaho.

Di recente avevo bisogno di una soluzione ETL e conoscendo MSSQL e MSRS mi sembrava ovvio che avrei recensito e probabilmente avrei scelto MS Integration Service. Ma per me, MSIS è stato terribile. Principalmente perché non era intuitivo. Dopo aver trascorso un paio di giorni a cercare di imparare lo strumento, ho deciso di cercare un'alternativa e mi sono imbattuto in Pentaho Data Integration, precedentemente noto come Kettle. L'ho messo in funzione in pochi minuti e ho immediatamente creato la mia prima trasformazione. Funziona e basta.

Devo ammettere che le mie esigenze sono abbastanza semplici, ma le prestazioni sono state eccezionali e la community sembra molto utile.

Ho usato SSIS e Pentaho Kettle e consiglio vivamente di usare Pentaho Kettle per il tuo strumento ETL anziché SSIS.

I miei motivi: -il flusso di SSIS è compito per compito. Kettle ti fa pensare alle file di dati che fluiscono attraverso il sistema. L'approccio di Kettle mi sembra molto più intuitivo. -SSIS è scarsamente documentato. Questo succede. Ma sembra che ci siano molti clic e impostazioni delle variabili. Molto complesso. Pentaho ha un forum della comunità che è abbastanza utile. -Fido che Pentaho si integri con più tipi di database, incluso SQL Server. Puoi anche usare JDBC che è carino. Inoltre, l'ho usato per andare tra SQL Server e Oracle da un lato e Vertica dall'altro. Ha un caricatore di massa disponibile per questo su Vertica. È abbastanza carino. -Ho trovato molto, molto difficile relativamente parlando per far funzionare un pacchetto SSIS su un server. Non ne valeva la pena. -Ho trovato abbastanza facile per Pentaho inviare un messaggio di avviso o di errore a una persona o un elenco di persone. -Pentaho consente di eseguire attività in JavaScript per cose che richiedono una certa logica. Semplice e facile da usare con una lingua che la maggior parte di noi ha riscontrato.

Non posso offrire alcun input sullo stack di MS BI ma al più recente Barcamp Orlando , la gente di Pentaho era lì e ha parlato dei loro prodotti ed è stata una demo estremamente impressionante.

Il fatto che sia un progetto Open Source che puoi estendere te stesso e un pacchetto a pagamento per un servizio davvero buono ti lascia molte opzioni. Hanno dimostrato un lavoro retribuito fatto per un cliente e hanno sicuramente stupito la folla.

Ho anche avuto la possibilità di chattare un po 'con uno sviluppatore che lavora sul lato del data warehousing per Pentaho ed è stato estremamente attento ed aperto ai suggerimenti e non ha avuto problemi a rispondere a qualsiasi domanda.

Per quanto riguarda un'azienda, Pentaho mi ha davvero impressionato sia per il loro lavoro sia per quanto fossero amichevoli e disponibili tutti i loro sviluppatori.

un paio di punti da aggiungere

  • Anche se esiste una versione per finestra di tutti gli strumenti Pentaho, l'installazione in Windows è onerosa. Pentaho (in particolare l'avvio e l'arresto del server, che è separato dallo strumento GUI) è in genere utilizzato in Linux, non in Windows Shop, e c'è una curva di apprendimento ripida che va da Windows a Linux.
  • qualsiasi strumento ha una curva di apprendimento quando ci si sposta su di essa. quando ti abitui a fare sempre clic su OK e ad aggiornare i metadati in caso di problemi, SSIS non è poi così male. Anche il pentaho può essere traballante.

Le domande relative agli strumenti devono essere affrontate in termini di maggiori domande culturali: che tipo di negozi utilizzano strumenti open source? nella mia esperienza ho scoperto che anche i negozi Microsoft sembrano più rigidi, quando hai problemi con una stringa di connessione in un negozio Microsoft puoi ottenere aiuto .. nei negozi Pentaho e Linux è più DYI.

A proposito, fai attenzione ai venditori Pentaho che fanno dimostrazioni - tutte le cose che mostrano sono molto più difficili da lavorare di quanto sembri! :)

Se stai cercando una valida alternativa a basso costo ai grandi ragazzi LogiXML ha dashboard e report ad hoc su una piattaforma .NET. Li usiamo dalla fine del 2006 quando Pentaho era appena agli inizi, ma non ci guardo da un po '.

Di recente ho provato la BI open source pentaho. L'ho trovato estremamente goffo. Non è stato molto intuitivo e il tempo di sviluppo ha richiesto molto più tempo.

È abbastanza diverso dalle soluzioni Oracle o ms BI. Forse l'edizione enterprise è migliore.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top