Question

on m'a demandé de faire un logiciel qui chiffrer et déchiffrer un texte « anglais normal » basé sur la lettre fréquences .

La question est de savoir où je trouve des échantillons de texte où les fréquences officielles correspondront?

Jusqu'à présent, j'ai essayé « Guerre et Paix » par Lev Tolstoï , il n'a pas bien ..

LE: Je ne suis pas juste besoin d'une liste de mots, je besoin d'un échantillon de texte pour un certain traitement
. LE2. Le but est de deviner 20 de 26 dans un long texte de 2000 caractères

Était-ce utile?

La solution

Vous êtes à la recherche corpora texte anglais , par exemple http://faculty.washington.edu/ebender/corpora/corpora.html#modern . Sur ce qui y sont énumérés, je sais que le projet Gutenberg est libre; beaucoup d'autres pourraient ne pas être.

Je ne sais pas ce que vous entendez par les fréquences officielles - le point des fréquences est de correspondre à ce que vous trouvez dans la nature, et si elles ne le font pas, c'est le problème de la table de fréquence

.

Autres conseils

Consultez infochimps ; ils ont un tas de jeux de données disponibles librement qui peuvent être utiles.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top