Google Dataprep - 替换列中的数据

时间:2018-02-08 14:08:18

标签: google-cloud-datastore google-cloud-dataprep

我已开始使用Google的Dataprep解决方案来清理电子商务产品Feed。当我收到来自100多家电子商务商店的数据时,我想清理数据以保持一致性,并重命名品牌的各种拼写。例如,我有一个列'供应商',其中包含数百万行,其中Adidas拼写不同:

阿迪达斯
阿迪达斯
阿迪达斯经典款 阿迪达斯orginals
adidas原件
adidas滑板车 阿迪达斯滑板

出于我的要求,我想将所有示例重命名为'adidas'。我正在研究Dataprep中的各种例程,而Replace函数可以完成这项工作,但是,它不是一个可扩展的解决方案。

Dataprep中是否有办法拥有品牌名称的主文件并对此数据进行查找并替换不正确的实例?在Excel中,一个简单的VLOOKUP可能会起作用,我在质疑Dataprep中是否存在这种情况。

我希望以上内容有道理,谢谢那些可以提供帮助的人。

克雷格

1 个答案:

答案 0 :(得分:1)

如果您有一个将错误拼写映射到标准化名称的主文件,则查找对话框(在列菜单中)可能是您正在寻找的内容:https://cloud.google.com/dataprep/docs/html/Lookup-Wizard_57344860