Domanda

Sto usando l'algoritmo Lawrence Philips Double-Metaphone con grande successo , ma ho trovato il risultato dispari "imprevisto" per alcune combinazioni.

Qualcun altro ha aggiunte o modifiche all'algoritmo per altre parti di esso che non gli dispiacerebbe condividere, o solo le combinazioni che hanno trovato che non funzionano come previsto.

ad es. Ho avuto problemi tra:

  • Peashill e Bushley. (entrambi corrispondono a PXL)
  • Rockliffe e Rockcliffe (RKLF e RKKL)
È stato utile?

Soluzione

Tutti gli schemi Soundex, Metaphone e varianti occasionalmente daranno risultati che non sono identici a quello che ti aspetti. Questo è inevitabile: possono essere considerati algoritmi hash più o meno semplici con informazioni speciali che preservano le proprietà e talvolta producono collisioni quando preferisci che non lo facciano e talvolta producono differenze quando preferisci che non lo facessero .

Un possibile modo per migliorare le cose è usare gli "anelli dei sinonimi". Questo in sostanza produce elenchi di parole che dovrebbero essere considerate sinonimi, indipendentemente dall'ortografia. Li ho incontrati nel contesto della corrispondenza dei nomi. Ad esempio, varianti su Chaudri incluso:

Chaudary CHAUDERI CHAUDERY CHAUDHARY CHAUDHERI CHAUDHERY Chaudhri CHAUDHRY Chaudhuri Chaudhury CHAUDHY Chaudrey Chaudri Chaudry CHAUDURI CHAWDHARY Chawdhry CHAWDHURY CHDRY CHODARY CHODHARI CHODHOURY CHODHRY CHODREY CHODRY CHODURY CHOUDARI Choudary CHOUDERY Choudhari Choudhary CHOUDHERY Choudhoury CHOUDHRI Choudhry Choudhuri Choudhury CHOUDREY CHOUDRI Choudry Choudury CHOUWDHRY CHOWDARI Chowdary Chowdhary CHOWDHERY CHOWDHRI Chowdhry CHOWDHURI CHOWDHURRYY CHOWDHURY CHOWDORY CHOWDRAY CHOWDREY CHOWDRI CHOWDRURY Chowdry CHOWDURI Chowdury CHUDARY CHUDHRY CHUDORY COWDHURY

Altri suggerimenti

il metafono normale sta restituendo una differenza tra Peashill e Bushley

Peashill PXL Bushley BXL

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top