質問

ようにしているフィルター名のテキスト用途にでも便.現在、私を生成する単語リストをフィルタリングも手がん~8k言葉に行くんを探しております。しかで辞書やフィルターそのものが淘汰された名前のようにスミスは、宮殿の近隣にあります。

今必要なのは以下のいずれか:

  • リストの共通の氏名(しめる>5k最も一般的名)
  • リストの名のもう言葉

フィギュアとな組合せブラックリスト/whitelistに何をするか、必要な

役に立ちましたか?

解決

米国勢調査名リスト: http://www.census.gov/genealogy/www/

それはとにかく、あなたの問題の1つの角度を取得する必要があります。

の編集したはおよそページ以下のコメント移動するごとに、URLを変更しました。誰も

?もうHTTP 302を信じていません

他のヒント

かった Quoraの記事:

別途カーネギーメロン大学のネプロジェクトは、収集した膨大なリストの固有名詞とにより、ウェブから分類しています。閲覧できるオンライン: ミナレッジベースのブラウザ データをダウンロードさせることで 資源&データ.

Web scrapingの結果、 personUS されてきていることから効率よかったので、抽出のリストからタグ付きフレーズとして"人"を大きなタブ区切りCSVファイルです。どちらかを使用regex.

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top