Cryptographie. Anglais « texte normal »?
-
08-10-2019 - |
Question
on m'a demandé de faire un logiciel qui chiffrer et déchiffrer un texte « anglais normal » basé sur la lettre fréquences .
La question est de savoir où je trouve des échantillons de texte où les fréquences officielles correspondront?
Jusqu'à présent, j'ai essayé « Guerre et Paix » par Lev Tolstoï , il n'a pas bien ..
LE: Je ne suis pas juste besoin d'une liste de mots, je besoin d'un échantillon de texte pour un certain traitement
.
LE2. Le but est de deviner 20 de 26 dans un long texte de 2000 caractères
La solution
Vous êtes à la recherche corpora texte anglais , par exemple http://faculty.washington.edu/ebender/corpora/corpora.html#modern . Sur ce qui y sont énumérés, je sais que le projet Gutenberg est libre; beaucoup d'autres pourraient ne pas être.
Je ne sais pas ce que vous entendez par les fréquences officielles - le point des fréquences est de correspondre à ce que vous trouvez dans la nature, et si elles ne le font pas, c'est le problème de la table de fréquence
.Autres conseils
Consultez infochimps ; ils ont un tas de jeux de données disponibles librement qui peuvent être utiles.
Essayez cette liste de mots anglais:
http://www.openbsd.org/cgi-bin / cvsweb / src / share / dict /