Domanda

es. l'algoritmo Soundex è ottimizzato per l'inglese. Esiste un algoritmo più universale che si applicherebbe a famiglie numerose di lingue?

È stato utile?

Soluzione

SOUNDEX è davvero orientato all'inglese. Altre due che tengono conto di una più ampia varietà di differenze fonetiche sono: Double Metaphone e NYSIIS .

Producono codifiche in uno spazio molto più ampio di quanto non faccia SOUNDEX. Double Metaphone, in particolare, include riduzioni con lo scopo esplicito di gestire pronunce alternative basate su più lingue dell'inglese.

Di recente ho fatto una presentazione sulla corrispondenza della stringa fuzzy, le diapositive possono essere utili.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top