質問

どのようにすることができます nosql のようなデータベース mongodb データ分析に使用されますか?データ分析をより速く強力にすることができる機能は何ですか?

役に立ちましたか?

解決

正直に言うと、ほとんどのNOSQLデータベースは、ビッグデータのアプリケーションにあまり適していません。すべてのビッグデータアプリケーションの大部分について、のパフォーマンス mongodb のようなリレーショナルデータベースと比較してください mysql大幅 Mongodbのようなものから完全に離れることを保証するのに十分なほど貧弱です。

そうは言っても、大規模なデータセットを使用しているときに確実に機能するNOSQLデータベースの非常に有用なプロパティがいくつかありますが、それらの利点がNOSQLの一般的に低いパフォーマンスを上回る可能性はあります。 SQL 読み取り集約型操作(典型的なビッグデータユースケースに最も似ています)は低いです。

  • スキーマはありません - 多くの構造化されていないデータを使用している場合、実際に決定し、スキーマを厳密に適用することは難しいかもしれません。 NOSQLデータベースは一般にこれを非常にサポートしており、SQLデータベースがサポートするものではありません。
  • JSON - ではなくJSONスタイルのドキュメントで作業している場合は CSV ファイルで、データベース層にMongoDBのようなものを使用することで多くの利点があります。通常、ワークフローの節約は、クエリタイムの増加を上回りません。
  • 使いやすさ - 私はSQLデータベースが常に使用が難しいと言っているのではありません、またはそれは カサンドラ 世界で最も簡単なものですが、一般的にNOSQLデータベースはSQLデータベースよりもセットアップと使用が簡単です。 MongoDBは、これの特に強力な例であり、使用するのが最も簡単なデータベースレイヤーの1つであることで知られています(以外 sqlite)。また、SQLは多くの正規化を扱っており、一般的に開発プロセスを停止するSQLベストプラクティスの大きな遺産があります。

個人的には、あなたもチェックアウトすることをお勧めします グラフデータベース そのような neo4j データサイエンスアプリケーションのバックエンドの選択を検討している場合、特定の種類のクエリに対して非常に優れたパフォーマンスを示しています。

他のヒント

スキーマフリーのNOSQLアプローチの利点の1つは、時期尚早にコミットせず、適切なツールを使用してクエリ時間に適切なスキーマを適用できることです。 アパッチドリル. 。見る このプレゼンテーション 詳細については。 MySQLは、ビッグデータ設定での私の最初の選択ではありません。

検討し、試して、おそらく複数のデータベースを使用してください。ここで作用している「パフォーマンス」問題だけではありません。それは本当にあなたの要件に帰着するでしょう。どのくらいのデータについて話しているのですか?どんなデータ?どれくらい速く必要ですか?もっと読みますか、それとも重いと書いていますか?

SQLデータベースでできないことの1つは次のとおりです。センチメントを計算します。 http://www.slideshare.net/shift8/mongodb-machine-learning

もちろん、その場合の速度はあなたのニーズに合わせて十分に速くないかもしれませんが、それは可能なことです。特定の骨材値のキャッシングにより、それは非常に受け入れられました。なぜこれをするのですか?快適。

利便性は本当にあなたが説得されるものです。それがまさに(私の意見では)NOSQLデータベースが作成された理由です。もちろんパフォーマンスもありますが、ベンチマークを割引き、他の懸念にもっと集中しようとしています。

MongoDB(および他のいくつかのNOSQL)データベースには、組み込みのマップ/Reduceなどの非常に強力な機能があります。これにより、Hadoopのようなものを使用する費用と時間の両方で節約できます。または、より大きなビジネスを立ち上げるためにプロトタイプまたはMVPを提供することもできます。

グラフデータベースはどうですか?彼らも「nosql」です。 OrientDBのようなデータベースを見てください。パフォーマンスを議論したい場合は...そこでより速いSQLデータベースを表示するとは思いません=)...そして、グラフデータベースには、必要なことに基づいて本当に素晴らしいアプリケーションがあります。

テクノロジーのルール(およびインターネット)は、1つのことであまり快適になりません。あなたは制限され、失敗のために自分自身を設定するつもりです。

ライセンス: CC-BY-SA帰属
所属していません datascience.stackexchange
scroll top