Como eu poderia criar um sistema semelhante ao reCAPTCHA?
Pergunta
Estou fascinado pelo sistema CAPTCHA utilizado no SO ... Eu gostaria de saber mais sobre o " muitos fatores ", que fazem trabalho reCAPTCHA. Os desenvolvedores, compreensivelmente, dado o potencial para o abuso, continuo bastante tranquila sobre o funcionamento exato internas do seu sistema ... Mas o comportamento é bem documentado, e assim, talvez, a minha curiosidade ainda pode ser saciado:
Se eu fosse para criar um clone de reCAPTCHA, como eu poderia ir sobre ele?
reCAPTCHA permite:
- um erro de digitação
- em um lugar onde as pessoas fazê-las. Isso me sugere que você precisa ter dados históricos sobre erros, e em seguida, fazer um algoritmo com base nisso.
A detecção de erros de digitação requer uso extensivo de bases de dados:. Um para palavras de livros que estão sendo digitalizados e outro para as palavras que são conhecidos
Técnico detalhes
conhecido- duas bases de dados: uma para palavras conhecidas e outra para palavras desconhecidas
- banco de dados posterior para combinação de palavra
Desconhecido detalhes técnicos
- Como podem as palavras sejam separadas na mosca de tal forma que você vê uma combinação de palavras a partir de bases de dados diferentes? Esta é sobre o sinal de processamento.
- Como podem os dados de dois bancos de dados ser dada para o usuário?
- O que é a forma inicial de dados em dois bancos de dados separados? PDF?
- O que é a forma subseqüente de dados quando os dados de dois bancos de dados é combinado? Pdf?
- Como podem os dados ser combinadas para de dois pdf -limas para um?
- Como você pode imagens eficazmente girar?
- Que algoritmos são usados ??para separar as imagens do livro?
Tópicos relacionados
- processamento de sinal
- cálculo :. Séries como Fourier e Laplace para algoritmos em detecções palavra
- teoria da probabilidade : para ter um coeficiente de "computador-humano" que é passado somente se for, por exemplo, com 95 intervalo de confiança
- Talvez teoria dos números : é preciso ser eficaz em armazenar e comparar os dados
Solução
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow