BIモジュールの戦略の選択
-
29-09-2019 - |
質問
私が働いている会社は、パブリッシング、eコマース、オンライン印刷などのさまざまなアドオンを備えたコンテンツ管理システム(CMS)を生産しています。現在、「レポートモジュール」を追加する過程にあり、どの戦略が必要なかを調査する必要があります。フォローしてください。 「レポートモジュール」は、そうでなければ知られています ビジネス・インテリジェンス, 、またはbi。
このモジュールは、アイテムのダウンロードを追跡し、検索を実行し、さまざまなレポートを作成できるはずです。実際、私たちが必要と思うものを何でもプッシュし、それから報告書を出すことができるかもしれないので、どのような種類のデータが解約されているかはそれほど重要ではありません。
大まかに言えば、2つのオプションがあります。
オプション1 Apache solrに基づいてソリューションを作成することです(具体的には、 https://issues.apache.org/jira/browse/solr-236)。このアプローチの長所:
- 無料 /オープンソース /良質
- 私たちは他の場所でsolr/Luceneを使用しているので、ドメインを非常によく知っています
- 着信データ(XML形式)を取得できるようにインデックス付けされているものに対する完全な柔軟性、XSLTを通してプッシュしてsolrに送ってください
- 検索結果を表示する方法の完全な柔軟性。上記のステップと同様に、カスタムXSLT検索テンプレートを使用して、必要だと思われるあらゆる形式で結果を表示することができます
- フロントエンド開発者はXSLTに熟練しているため、このメカニズムを別の顧客に適合させることは比較的簡単なはずです
- Solrは、私たちにとって絶対に必要なリアルタイム /フルテキスト /ファセット検索を提供しています。クイックプロトタイプ(SOLR、1Mレコードに基づく)は、55msで検索結果を提供することができました。私たちの推定最大記録は約10億行です(これは典型的なBIアプリにはそれほど多くはありません)。さらに悪いことに、Solrcloudなどを常に見ることができます。
- Solrを使用して非常によく似たことをしている企業があります(たとえば、Honeycomb Lexiconなど)
このアプローチの短所:
- SOLR-236は安定しているかもしれないし、そうでないかもしれないが、公式リリースの一部としてリリースされるのはいつ/かどうかはまだ明らかではない
- いくつかのバイ固有の機能を機能させるために、書く必要があるものがいくつかあるでしょう。これはホイールを再発明するように聞こえます
- 最大の問題は、将来的に必要なものがわからないことです(BIソフトウェアとの統合、Excelへのエクスポートなど)
オプション2 無料または商用のBIソフトウェアと統合することです。これまで私は見ました ワビット そして、見てみましょう qlikview, 、おそらく他の人。このアプローチの長所:
- ホイールを再発明する必要はありません、ソフトウェアは(できれば)試行され、テストされます
- 私たちが専門とする問題の解決に費やすことができる時間を節約するでしょう
短所:
- 私たちはJavaショップであり、ソリューションはクロスプラットフォームであるため、市場にある多くのオプションを排除する必要があります。
- BIソフトウェアがどれほど柔軟であるかはわかりません。柔軟なインデックス作成、リアルタイム /フルテキスト検索、完全にカスタマイズ可能な結果などを実行できるかどうかを確認するために、いくつかのBIの提供を行うには時間がかかります。
- オープンソースのBIオファーは十分に成熟していないのに対し、商用BI(SAP、その他)は運命をコストすると言われましたが、ライセンスは数万ポンド/ドルから始まります。私は商業的な選択自体に反対していませんが、それは簡単に大きくなる可能性のある全体的な価格になります
- スキーマレスデータで作業するためにBIがどれだけうまく作られているかわからない
私は間違いなく、市場で最も適切な統合オプションを見つけるのに最適な候補者ではありません(主にBIエリアに知識がないため)が、決定を迅速に行う必要があります。
誰かが同様の状況にあり、どのルートを取るべきか、またはさらに良いルートについてアドバイスすることができますか?ここでの最大の問題は、私が知らないことがわからないということです;)
解決
私は両方で遊ぶのに少し時間を費やしました qlikview と ワビット, 、そして、言わなければならない、私は非常に失望しています。
私は、BI業界全体が実際にその下にある科学を持っていると期待していましたが、私が見つけたことから、これは単なる流行語です。 このMSDNの記事 実際には目を見張るものでした。 BIのビジネス全体は、正常に正規化されたスキーマからデータを取得することで構成されています(彼らはそれを呼びます oltp)、それを少ない正常なスキーマに入れます(olap, スノーフレーク - また スタータイプ)そしてあなたが望むあらゆる側面のインデックスを作成する(これのための業界の専門家は データキューブ)。残りは、きれいなグラフを取得するためのいくつかのスクリプトです。
わかりました、私はここで物事を単純化しすぎていることを知っています。私は多くの異なる側面を見逃したかもしれません(素敵なレポート?Excelへのエクスポート?予測?)。しかし、コンピューターサイエンスの観点からは、ここではデータベースインデックス以外のものを見ることができません。
いくつかのBIツールは圧縮をサポートすると言われました。ルーセンもそれをサポートしています。一部のBIツールは、すべてのインデックスをメモリに保持できると言われました。そのためには、ルーセンキャッシュがあります。
2人の候補者(Wabit and Qlikview)といえば、1つ目は単に未熟です(デモで提案されたものの外に出ようとするとき、私は数十の例外があります)が、他はWindowsの下でのみ機能します(あまり良くありませんが、あまり良くありませんが、私はそれと一緒に暮らすことができました)そして、統合は私がいくつかのvbscript(yuck!)を書くことを要求するでしょう。単純な日付レンジコントロールを機能させるためだけにQlikviewフォーラムで数時間を費やさなければなりませんでした。誤解しないでください、それらは両方とも彼らが構築されたもののための良いツールですが、私はあまり得られないので、彼らとの統合を行うポイントを見るだけではありません。
(議論の余地のある)solrの不死身に対処するために、抽象的なAPIを定義して、すべてのデータを問題が発生した場合に全文クエリをサポートするデータベースに移動できるようにします。さらに悪いことに、必要に応じて、私はいつでもsolr/Luceneの上に何かを書くことができます。
他のヒント
あなたが本当にあなたがそうでないシナリオにいるなら あなたが知らないことを確かに オープンソースツールを探索し、自分の実装に飛び込む前にその有用性を評価することが最善だと思います。オープンソースソリューションを使用すると、独自の理解と必要な機能をさらに結晶化するのに役立つ可能性が非常に高いです。
私は以前にオープンソースソリューションと呼ばれていました ペンタホ. 。私は、私の目的にペンタホの特徴を使用することを学ぶことで、もっと多くをもっと理解していると真剣に感じました。もちろん、オープンソースのソリューションのほとんどが作業した場合と同様に、Pentahoは最初は少し威圧的であるように見えましたが、1か月後にはなんとかそれを手に入れることができました。私たちも仕事をしました Kettle ETL ツールと モンドリアン キューブ - 最近の深刻なBIツールのほとんどが上に構築されていると思います。
以前は、これらのコンポーネントはすべて独立していましたが、オフレートは、Pentahoがこれらすべてのプロジェクトの所有権を取ったと思います。
しかし、必要なものとそうでないことを自信があると、モンドリアンの実装に加えて、独自の基本的なレポートツールを構築することをお勧めします。洗練されたオープンソースツールをカスタマイズすることは、実際に大きな問題になる可能性があります。その上、警戒するライセンスがあります。ペンタホはGPLだと思いますが、それをチェックしたいと思うかもしれません。
まず、レポートが表示されるものを明確にする必要があります。どのレポート機能が必要ですか?どの出力形式が必要ですか?ブラウザ(HTML)、PDFとして、またはインタラクティブな視聴者(Java/Flash)で表示しますか。データ(データベース、Javaなど)はどこにありますか?アドホックレポートが必要ですか、それともハードコード化されたレポートのみが必要ですか?これはいくつかの質問にすぎません。
この質問に対する答えがなければ、本当の推奨事項を与えることは困難ですが、私の一般的な推奨事項は i-net clear Reports (以前はi-net Crystal-Clearと呼ばれていました)。 Javaツールです。これは商業用ツールですが、コストはSAPおよびCOのように低くなります。