Domanda

Voglio scrivere un'applicazione online che:

  1. legge l'URL dalla barra degli indirizzi del browser
  2. estrae le sue caratteristiche lessicali (come n-grammi)
  3. estrae le sue caratteristiche di accoglienza basato (recuperano i record DNS on-line, il suo A, PTR, campi TTL)
  4. classificare l'URL in (apprendimento automatico usando) dannoso o benigna

Qualcuno mi può aiutare con 1 e 3?

È stato utile?

Soluzione

Non credo che questo (applicazione) è un compito che si può realizzare, in quanto non è possibile determinare realmente il contenuto del sito in base a URL.

Mozilla Phishing Protection Design Documentazione e Navigazione sicura di Google spec invece

Altri suggerimenti

Non ho idea di quale lingua si può guardare.

Per la voce 1 qui è una libreria .NET che forse utile

http://msdn.microsoft.com/en -us / library / system.web.httputility.aspx

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top