質問

データベースのテストデータ、具体的には人の名前を含むテーブル列を生成しようとしています。名前ベースの検索に関してインデックス作成がどの程度うまく機能するかを適切に示すために、実際の名前とその実際の度数分布にできるだけ近づけたいと思います。いくつかのべき法則分布に周波数が分布している多くの異なる名前。

理想的には、名前の後に名前ごとに1つの頻度値(または同等の確率)が続く、無料で入手できるデータファイルを探しています。

アングロサクソン人に基づく名前で十分ですが、他の文化の名前も役立ちます。

役に立ちましたか?

解決

要件に適合する米国国勢調査データをいくつか見つけました。唯一の注意点は、少なくとも100回出現する名前のみがリストされることです...

他のヒント

jFairyプロジェクトをチェックすることもできます。これはJavaで記述されており、偽のデータ(名前など)を生成します。 http://codearte.github.io/jfairy/ ジェネラコディセタグプレ

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top