我通过阅读一篇论文研究了最小草图(CMS):
http://dimacs.rutgers.edu/~graham/pubs/papers/cmsoft.pdf
但是我没有阅读算法的经验,所以有一些混乱。有人可以帮忙回答关于计数最小草图的一些问题。
- 假设深度为d,w为w,那么我可以向CMS添加多少元素,以免影响错误率
- 我想通过向CMS添加大量元素然后查询放入CMS的所有密钥来对CMS进行测试。如何计算错误并评估错误?
- 如果我将CMS用作网络服务作为重量级的击球手并且我的网络服务日复一日地运行,那么计数器将会溢出。那么我应该每天创建然后删除CMS吗?
谢谢!