Welches System freie Datenbank ist am besten zu speichern und berechnen / analysiert große Textvergleiche, aus denen die Datenbank nutzbar Statistiken machen würde? [geschlossen]

StackOverflow https://stackoverflow.com/questions/202715

  •  03-07-2019
  •  | 
  •  

Frage

Ich habe Skript zu erstellen, die (miteinander) Tausende von großen Texten vergleichen würden. Und ich frage mich, ob MySQL die beste Lösung dafür ist. Gibt es ein anderes freie databse System, das ich einfach nutzen könnte zu tun - aber prozessorzeitraubend Computing

?

Bitte, wirft mich in dein Wissen Becken!

Edit: Natur der Dokumente - 500-7000 Zeichen Dokumente, -> die Dokumente zu vergleichen, wenn der Text das andere Dokument (Plagiat) und Statistiken der Spiele ->% Match jeden Satz mit schönen Setups wie das gefunden Ich mag würde setzen wie viele Zeichen die andere Zeichenfolge anders sein könnte immer noch als ein Spiel betrachtet werden ..

Technologie Server-basiert sein sollte, ich bin mehr interestedIn DB und dann würde ich entsprechende Sprache Skript wählen, um es mit.

Weitere Spezifikation: Die Größe der DB muss unbegrenzt sein

.
War es hilfreich?

Lösung

Sie sollten mit Lucene betrachten. Es ermöglicht Ihnen, große Mengen an Text zu speichern und abzufragen sie wirklich schnell. Mit einem guten Relevanz zu entsprechen.

Andere Tipps

Sie erwähnen nicht die Technologie, die Sie verwenden werden; Größe der Texteinträge oder die Art der Vergleiche. Allerdings habe ich gegründet h2 Datenbank ausgezeichnet. Es stammt aus Java und kann als In-Memory-Datenbank verwendet werden, die Einrichtung trivial macht.

PostgreSql ist ein freier Datenbank-Engine, die gut skalierbar ist und weit verbreitet ist, neben MySQL.

SQL Server Express

Ich würde empfehlen, MySQL. Es hat eine Menge von integrierten String-Handling-Funktionen.

führen, dass Sie nicht angeben, warum nicht SQL Server 2008 Express Edition

Alle der Suchfunktionen mit dem großen Bruder SQL Server 2008 mit dem einzigen Problem, dass Sie nicht 4Gb der Datenbank nicht überschreiten können.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top