質問

文字に基づいて「通常の英語」テキストを暗号化および復号化するソフトウェアを作成するように頼まれました 周波数.

問題は、公式周波数が一致するテキストサンプルをどこで見つけることができますか?

これまでのところ、私は試しました レフ・トルストイによる「戦争と平和」, 、うまくいきませんでした。

LE:単語のリストだけが必要ではなく、処理を行うにはテキストサンプルが必要です。
LE2:目標は、2000文字の長いテキストで26から20を推測することです。

役に立ちましたか?

解決

あなたは探しています 英語のテキストコーパス, 、例: http://faculty.washington.edu/ebender/corpora/corpora.html#modern. 。そこにリストされているもののうち、私はプロジェクトGutenbergが無料であることを知っています。他の多くはそうではないかもしれません。

公式周波数が何を意味するのかわかりません。周波数のポイントは、野生で見つけたものと一致させることです。そうでない場合、それが周波数テーブルの問題です。

他のヒント

チェックアウト Infochimps;それらは、便利かもしれない自由に利用可能なデータセットをたくさん持っています。

この英語の単語のリストを試してください:

http://www.openbsd.org/cgi-bin/cvsweb/src/share/dict/

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top