我正在研究Count Sketch的流算法。
我的教授介绍了3种算法,
一个是
<Generate r in >
Update(i, c)
s = s + ri c
Estimate(i)
return ri s
第二个是这个
Initialization
<Generate r in {-1, 1}^n>
Update(i, c)
t = h(i)
s(t) = s(t) + ri c
Estimate(i)
t = h(i)
return ri s(t)
第三个是计算n次相同的算法并取平均值。 我知道,第一个只是更新计数,第二个可能是使用哈希函数更新值。
但是引入方差和期望的概念。也许是为了证明估算是正确的?
教授建议使用此资源,但我觉得不方便
https://www.cs.rutgers.edu/~farach/pubs/FrequentStream.pdf
我在关注这个 https://courses.cs.washington.edu/courses/cse522/14sp/lectures/lect05.pdf
第4页的何处解释了第二种算法的差异。
任何人都可以澄清方差与这个问题之间的联系吗?