我正在尝试找出是否有可能从大型查询中导出超日志草图并将其合并到外部以进行基数估计。是否有可用的开源库可以轻松解析大型查询草图?
如果没有,是否存在有关biq查询的超日志草图的格式的公开可用信息?具体来说,使用哪种哈希算法,包含哪种类型的元数据以及草图的结构如何?
答案 0 :(得分:0)
现在,您可以使用ZetaSketch(https://github.com/google/zetasketch)来实现此目标,它包括与Google Cloud BigQuery的实现兼容的HLL ++算法的实现。