Pentaho

时间:2015-09-03 18:11:11

标签: postgresql hash pentaho kettle

任何人都可以向我建议我可以在 pentaho 中使用的最佳选项以满足我的要求。要求是我们需要转换first_name& last_name属性为哈希值,并将这些列的哈希值加载到用户表中以支持业务报告。对于报告,不需要这些列的实际值,报告代码仅检查first_name&中的NULL值。 last_name列,并验证这些字段的长度。

我尝试使用添加校验和转换将字段转换为哈希,但不确定要使用哪种类型的校验和(CRC 32,ADLER 32,MD5,SHA-1)。有什么建议吗?

来源&目标数据库是PostgreSql ,不确定是否需要。

提前致谢。

1 个答案:

答案 0 :(得分:3)

散列和加密不是一回事。

似乎你想要一个单向哈希。你选择什么哈希主要取决于你对碰撞的关注程度。如果您不在乎多个名称可以生成相同的哈希值,那么像CRC32这样的短快速哈希就可以了。如果您确实关心碰撞,那么我至少使用MD5。