Pergunta

Estou fascinado pelo sistema CAPTCHA utilizado no SO ... Eu gostaria de saber mais sobre o " muitos fatores ", que fazem trabalho reCAPTCHA. Os desenvolvedores, compreensivelmente, dado o potencial para o abuso, continuo bastante tranquila sobre o funcionamento exato internas do seu sistema ... Mas o comportamento é bem documentado, e assim, talvez, a minha curiosidade ainda pode ser saciado:

Se eu fosse para criar um clone de reCAPTCHA, como eu poderia ir sobre ele?


reCAPTCHA permite:

  1. um erro de digitação
  2. em um lugar onde as pessoas fazê-las. Isso me sugere que você precisa ter dados históricos sobre erros, e em seguida, fazer um algoritmo com base nisso.

A detecção de erros de digitação requer uso extensivo de bases de dados:. Um para palavras de livros que estão sendo digitalizados e outro para as palavras que são conhecidos

Técnico detalhes

conhecido
  1. duas bases de dados: uma para palavras conhecidas e outra para palavras desconhecidas
  2. banco de dados posterior para combinação de palavra

Desconhecido detalhes técnicos

  1. Como podem as palavras sejam separadas na mosca de tal forma que você vê uma combinação de palavras a partir de bases de dados diferentes? Esta é sobre o sinal de processamento.
  2. Como podem os dados de dois bancos de dados ser dada para o usuário?
  3. O que é a forma inicial de dados em dois bancos de dados separados? PDF?
  4. O que é a forma subseqüente de dados quando os dados de dois bancos de dados é combinado? Pdf?
  5. Como podem os dados ser combinadas para de dois pdf -limas para um?
  6. Como você pode imagens eficazmente girar?
  7. Que algoritmos são usados ??para separar as imagens do livro?

Tópicos relacionados

  1. processamento de sinal
  2. cálculo :. Séries como Fourier e Laplace para algoritmos em detecções palavra
  3. teoria da probabilidade : para ter um coeficiente de "computador-humano" que é passado somente se for, por exemplo, com 95 intervalo de confiança
  4. Talvez teoria dos números : é preciso ser eficaz em armazenar e comparar os dados
Foi útil?

Solução

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top