Domanda

mi è stato chiesto di fare un software che vi cifrare e decifrare un testo "normale inglese" basato sulla lettera frequenze .

La domanda è: dove posso trovare alcuni campioni di testo in cui le frequenze ufficiali corrisponderanno?

Finora, ho cercato "Guerra e Pace" di Lev Tolstoj , non ha funzionato bene ..

LE: Non ho bisogno di un semplice elenco di parole, ho bisogno di un testo di esempio per fare qualche trattamento
. LE2:. L'obiettivo è quello di indovinare 20 da 26 in un testo lungo 2000 caratteri

È stato utile?

Soluzione

siete alla ricerca di inglese corpora , per esempio http://faculty.washington.edu/ebender/corpora/corpora.html#modern . Su ciò che è elencato lì, lo so che il Progetto Gutenberg è libero; molti degli altri potrebbe non essere.

Non sono sicuro di cosa si intende per le frequenze ufficiali - il punto delle frequenze è quello di abbinare quello che si trova in natura, e se non lo fanno, questo è il problema del tabella di frequenza

.

Altri suggerimenti

Infochimps ; hanno una serie di gruppi di dati liberamente disponibili che potrebbero essere utili.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top