Domanda

Sto cercando di fare un po 'di benchmarking su Full Text indici di ricerca di PostgreSQL, SQLServer e Lucene.

Tutte le idee su dove trovare un buon database di grande esempio per eseguire query contro?

Grazie mille in anticipo.

È stato utile?

Soluzione

Penso che la grande fonte sarebbe dump del database di Wikipedia, dal momento che contiene davvero grande quantità di testo. Sono disponibili qui: http://dumps.wikimedia.org/

Si potrebbe anche provare archivio usenet, ma c'è di più per scegliere la lingua di destinazione e la qualità del linguaggio utilizzato è anche inferiore.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top