全文検索のためのサンプルデータベース
-
01-10-2019 - |
質問
PostgreSQL、SQLServer、Luceneの全文検索インデックスでベンチマークを行いたいと考えています。
クエリを実行するための優れた大きなサンプルデータベースをどこで見つけるかについてのアイデアはありますか?
よろしくお願いします。
解決
素晴らしいソースは、ウィキペディアのデータベースダンプだと思います。ここで入手できます: http://dumps.wikimedia.org/
Usenetアーカイブを試すこともできますが、ターゲット言語を選択するのが難しく、使用される言語の品質も低くなります。
所属していません StackOverflow