Pregunta

Busco a hacer algo de evaluación comparativa sobre los índices de búsqueda de texto completo en PostgreSQL, SQL Server y Lucene.

¿Alguna idea sobre dónde encontrar una buena base de datos de muestra grande para realizar consultas en?

Muchas gracias de antemano.

¿Fue útil?

Solución

Creo que la gran fuente sería volcado de la base de la Wikipedia, ya que contiene realmente un gran cantidad de texto. Están disponibles aquí: http://dumps.wikimedia.org/

También podría tratar archivo Usenet, pero hay más para elegir idioma de destino y la calidad del lenguaje utilizado también es menor.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top