任何人都可以向我解释一下kognitio中可用的所有成像技术。
如果你涵盖以下技巧,那就太棒了。
1)复制
2)复制的分区图像(column_name)
3)HASHED ON(column_name)PARTITION IMAGE BY(column_name)
提前致谢。
答案 0 :(得分:1)
Kognitio社区论坛文章here包含所有最新文档的链接。
特别是,Kognitio指南的第2章涵盖了现有的各种表格和视图图像选项。
原始问题中提到的是:
答案 1 :(得分:0)
我们在WX2中有四种不同的成像选项 随机 - 甚至循环分配(默认) 散列 - 根据键放置在RAM存储中 部分哈希 - 作为哈希但处理偏斜属性 复制 - 每个RAM存储上的完整副本
复制会在每个RAM Store上放置映像的副本。就RAM和再分配时间而言,它可能是昂贵的。适用于小型查找/维度表 它不能分散。 Theta加入是必需的。复制是按RAM存储而不是每个节点。
Hashing在RAM存储中分配表或视图图像的行。它取决于一列或多列的值。它很适合加入大表 - 哈希在公共密钥上。这可能会导致倾斜。不同值的数量小于RAM存储的数量。一个或两个值在频率上大大超过其他值。部分分布可用于中和价值偏差
部分散列是一种在大型表严重偏向关键列时处理连接的机制。它是直接散列的替代方案。类型是部分散列/随机RAM存储和跨RAM存储的部分散列/复制