-
23-09-2019 - |
質問
ようにしているフィルター名のテキスト用途にでも便.現在、私を生成する単語リストをフィルタリングも手がん~8k言葉に行くんを探しております。しかで辞書やフィルターそのものが淘汰された名前のようにスミスは、宮殿の近隣にあります。
今必要なのは以下のいずれか:
- リストの共通の氏名(しめる>5k最も一般的名)
- リストの名のもう言葉
フィギュアとな組合せブラックリスト/whitelistに何をするか、必要な
解決
米国勢調査名リスト: http://www.census.gov/genealogy/www/
それはとにかく、あなたの問題の1つの角度を取得する必要があります。
の の編集したののはおよそページ以下のコメント移動するごとに、URLを変更しました。誰もの
?もうHTTP 302を信じていません他のヒント
かった Quoraの記事:
別途カーネギーメロン大学のネプロジェクトは、収集した膨大なリストの固有名詞とにより、ウェブから分類しています。閲覧できるオンライン: ミナレッジベースのブラウザ データをダウンロードさせることで 資源&データ.
Web scrapingの結果、 personUS されてきていることから効率よかったので、抽出のリストからタグ付きフレーズとして"人"を大きなタブ区切りCSVファイルです。どちらかを使用regex.
所属していません StackOverflow