我希望在PostgreSQL,SQLServer和Lucene中对全文搜索索引进行一些基准测试。

关于在哪里可以找到一个很好的大型示例数据库来执行查询的任何想法?

非常感谢。

有帮助吗?

解决方案

我认为伟大的来源将是Wikipedia的数据库转储,因为它们包含大量文本。他们在这里可用: http://dumps.wikimedia.org/

您也可以尝试使用Usenet档案,但是很难选择目标语言,而所使用的语言的质量也较低。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top