Frage

Wie kann NoSql Datenbanken mögen MongoDb Für die Datenanalyse verwendet werden? Was sind die Funktionen darin, die die Datenanalyse schneller und leistungsstark machen können?

War es hilfreich?

Lösung

Um ganz ehrlich zu sein, sind die meisten NoSQL -Datenbanken nicht sehr gut für Anwendungen in Big Data geeignet. Für die überwiegende Mehrheit aller Big -Data -Anwendungen die Leistung von MongoDb im Vergleich zu einer relationalen Datenbank wie Mysql ist bedeutend Ist arm genug, um zu rechtfertigen, sich von so etwas wie MongoDB fernzuhalten.

Trotzdem gibt es einige wirklich nützliche Eigenschaften von NoSQL -Datenbanken, die sicherlich zu Ihren Gunsten funktionieren, wenn Sie mit großen Datensätzen arbeiten Sql Für readintensive Operationen (am ähnlichsten zu typischen Big-Data-Anwendungsfällen) ist gering.

  • Kein Schema - Wenn Sie mit vielen unstrukturierten Daten arbeiten, ist es möglicherweise schwierig, tatsächlich ein Schema zu entscheiden und starr anzuwenden. NoSQL-Datenbanken im Allgemeinen unterstützen dies sehr und ermöglichen es Ihnen, Schema-Less-Dokumente im laufenden Fliegen einzufügen. Dies ist sicherlich nicht etwas, was eine SQL-Datenbank unterstützt.
  • JSON - Wenn Sie zufällig mit Dokumenten im JSON-Stil anstatt mit Dokumenten arbeiten CSV Dateien, dann sehen Sie einen großen Vorteil, wenn Sie etwas wie MongoDB für einen Datenbankschicht verwenden. Im Allgemeinen überwiegen die Workflow-Einsparungen jedoch nicht die erhöhten Anfragemäle.
  • Benutzerfreundlichkeit - Ich sage nicht, dass SQL -Datenbanken immer schwer zu bedienen sind oder das Kassandra ist das einfachste auf der Welt, um sich einzurichten, aber im Allgemeinen sind NoSQL -Datenbanken einfacher eingerichtet und verwenden als SQL -Datenbanken. MongoDB ist ein besonders starkes Beispiel dafür und ist dafür bekannt, eine der am einfachsten verwendeten Datenbankschichten zu sein (außerhalb von Sqlite). SQL befasst sich auch mit viel Normalisierung und es gibt ein großes Erbe von SQL -Best Practices, die im Allgemeinen den Entwicklungsprozess verkleinern.

Persönlich könnte ich vorschlagen, dass Sie auch auschecken Grafikdatenbanken wie zum Beispiel Neo4j Das zeigt eine wirklich gute Leistung für bestimmte Arten von Abfragen, wenn Sie ein Backend für Ihre Datenwissenschaftsanwendungen auswählen möchten.

Andere Tipps

Ein Vorteil des schemafreien NoSQL-Ansatz Apache -Drill. Sehen diese Präsentation für Details. MySQL wäre nicht meine erste Wahl in einer Big Data -Einstellung.

Betrachten Sie, versuchen Sie es und verwenden Sie vielleicht sogar mehrere Datenbanken. Es ist nicht nur ein "Performance" -Problem beim Spielen hier. Es wird wirklich auf Ihre Anforderungen zurückzuführen. Wie viele Daten sprechen Sie? Welche Art von Daten? Wie schnell brauchst du es? Sind Sie mehr schwer oder schreiben Sie schwer?

Hier ist eine Sache, die Sie in einer SQL -Datenbank nicht tun können: Berechnen Sie das Gefühl. http://www.slideshare.net/shift8/mongodb-machine-learning

Natürlich ist die Geschwindigkeit in diesem Fall möglicherweise nicht schnell genug für Ihre Bedürfnisse, aber es ist etwas möglich. Mit einiger Dauer spezifischer Gesamtwerte war es sogar recht akzeptabel. Wieso würdest du das machen? Bequemlichkeit.

Bequemlichkeit ist wirklich etwas, von dem Sie überzeugt werden. Genau deshalb wurden (meiner Meinung nach) NoSQL -Datenbanken erstellt. Natürlich auch Leistung, aber ich versuche, Benchmarks zu reduzieren und sich mehr auf andere Bedenken zu konzentrieren.

MongoDB (und einige andere NoSQL) -Datenbanken haben einige sehr leistungsstarke Funktionen wie eingebaute Karte/Reduzierung. Dies könnte zu einer Einsparung sowohl in Kosten als auch in der Zeit führen, um so etwas wie Hadoop zu verwenden. Oder es könnte einen Prototyp oder ein MVP zur Einführung eines größeren Unternehmens liefern.

Was ist mit Diagrammdatenbanken? Sie sind auch "NoSQL". Schauen Sie sich Datenbanken wie OrientDB an. Wenn Sie Leistung argumentieren möchten ... Ich glaube nicht, dass Sie mir eine SQL -Datenbank zeigen werden, die dort schneller ist =) ... und Diagrammdatenbanken haben eine wirklich erstaunliche Anwendung, basierend auf dem, was Sie tun müssen.

Technologieregel (und das Internet) werden mit einer Sache nicht zu wohl. Sie werden begrenzt sein und sich für Misserfolg einstellen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top