Question

esquisse comte-Min est une structure de données impressionnant pour estimer les fréquences des différents éléments dans un flux de données . Intuitivement, cela fonctionne en une variété de fonctions de hachage, hachant chaque élément avec les fonctions de hachage, et incrémenter les fréquences des différents créneaux horaires dans les différentes tables. Pour estimer la fréquence d'un élément, l'esquisse Count-Min applique les fonctions de hachage à ces éléments et prend la valeur minimum de toutes les fentes qui sont hachés à.

Le article original sur le croquis comte-Min indique que la structure de données nécessite par paires fonctions de hachage indépendantes afin d'obtenir les garanties nécessaires sur sa performance attendue. Cependant, la recherche sur la structure, je ne vois pas pourquoi l'indépendance est nécessaire par paires. Intuitivement, je pense que tout ce qui serait nécessaire serait que la fonction de hachage soit une fonction de hachage universelle , car hachage universelle fonctions sont des fonctions de hachage avec de faibles probabilités de collisions. L'analyse des probabilités de collision dans le croquis du comte-Min semble remarquablement similaire à l'analyse des probabilités de collision dans une table de hachage chaînée (qui ne nécessite qu'une famille de fonctions de hachage universel, et non deux à deux fonctions de hachage indépendantes), et je ne peux pas lieu la différence dans les analyses.

Pourquoi est-il nécessaire pour les fonctions de hachage dans le croquis comte-Min d'être indépendant par paires?

Merci!

Était-ce utile?

La solution

Vous avez raison: suffit de hachage universelle. l'indépendance par paires, alors que plus forte, est la méthode habituelle pour construire une famille de hachage universelle. Aussi l'indépendance est contrastée par paires dans le document avec l'indépendance 4 sage requis par les méthodes précédentes, comme l'esquisse AMS.

Licencié sous: CC-BY-SA avec attribution
Non affilié à cs.stackexchange
scroll top