Question

Je cherche à faire des analyses comparatives sur les index en texte intégral de la recherche dans PostgreSQL, SQL Server et Lucene.

Toutes les idées sur où trouver une bonne grosse base de données exemple pour effectuer des requêtes contre?

Merci beaucoup à l'avance.

Était-ce utile?

La solution

Je pense que la grande source serait la décharge de la base de données de wikipedia, car ils contiennent quantité vraiment super de texte. Ils sont disponibles ici: http://dumps.wikimedia.org/

Vous pouvez également essayer archives usenet, mais il est plus difficile de choisir la langue cible et la qualité de la langue est également plus faible.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top