Crittografia. Inglese “Testo normale”?
-
08-10-2019 - |
Domanda
mi è stato chiesto di fare un software che vi cifrare e decifrare un testo "normale inglese" basato sulla lettera frequenze .
La domanda è: dove posso trovare alcuni campioni di testo in cui le frequenze ufficiali corrisponderanno?
Finora, ho cercato "Guerra e Pace" di Lev Tolstoj , non ha funzionato bene ..
LE: Non ho bisogno di un semplice elenco di parole, ho bisogno di un testo di esempio per fare qualche trattamento
.
LE2:. L'obiettivo è quello di indovinare 20 da 26 in un testo lungo 2000 caratteri
Soluzione
siete alla ricerca di inglese corpora , per esempio http://faculty.washington.edu/ebender/corpora/corpora.html#modern . Su ciò che è elencato lì, lo so che il Progetto Gutenberg è libero; molti degli altri potrebbe non essere.
Non sono sicuro di cosa si intende per le frequenze ufficiali - il punto delle frequenze è quello di abbinare quello che si trova in natura, e se non lo fanno, questo è il problema del tabella di frequenza
.Altri suggerimenti
Infochimps ; hanno una serie di gruppi di dati liberamente disponibili che potrebbero essere utili.
Prova questa lista di parole inglesi:
http://www.openbsd.org/cgi-bin / CVSweb / src / share / dict /