哈希函数,$ h(k)=lfloor km \ rfloor $非常简单,真正的$ k $独立,均匀分布在$ 0 \ LEQ K <1 $

cs.stackexchange https://cs.stackexchange.com/questions/127682

我正在通过cormen等来通过文本介绍算法。 al。我遇到以下声明的地方:

如果已知键是随机实数 $ k $ 在范围 $ 0 \ Leq中k <1 $ ,散列函数

$$ h(k)=lfloor km \ rfloor $$ 满足简单均匀散列的条件。

现在我能理解的是,他们可能考虑在“连续”的感觉中均匀令人骚扰,而不是在离散的意义上。如果它已经处于离散的感觉,那么为<跨度类=“math-container”> $ n $ 键,概率质量函数(PMF)应为常量,等于<跨度类=“math-container” > $ 1 / n $ ,因此它同样可能在散列中使用的每个键,通过效果所需的结果。

但如果被称为连续的分发是连续的(我感觉如此:“统一分布在范围 $ 0 \ leq k <1 $ “)

let $ f(x)$ 是相关概率密度函数(pdf),并且从给定的信息我们有 $ f(x)= 1 $ ,(很容易找到,集成 $ f(x)$ 在范围 $ 0 $ $ 1 $ ,并使用 $ 1 $ 并注意到在均匀分布中,PDF是常数)。

现在虽然p.d.f是常数但是p.d.f不是概率。相当频谱点的概率是<跨度类=“math-container”> $ 0 $ 。现在如何使用此结果来获得作者的索赔。

或者我完全终于考虑分布是连续的?

(有一个答案在这里,但它没有以此细节作为有不同的问题毕竟)。

有帮助吗?

解决方案

$ h \在[m] ^ u $ 如果 $ x x x \ IN u$ 随机选择均匀,然后 $ h(x)$ 均匀分布于 $ [m]$ ,或等效 $ \ forall i \ in [m]:\ pr \ limits_ {x \在u} [h(x)= i]=frac {1} {m} $ 。在我们的情况下我们有:

$ \ pr [h(x)= i]=pr \ big [\ lfloor mx \ rfloor= i \ big]=pr [i \ le mx

我们使用的是,如果 $ x $ 统一分发 $ [0,1] $ 然后 $ \ pr [a \ le x \ le b]= ba $ (相等包含 $ \ le $ 的所有四种组合$ <$ )。

许可以下: CC-BY-SA归因
不隶属于 cs.stackexchange
scroll top