是否可以使用BigQuery进行近似字符串匹配/模糊字符串搜索?

时间:2012-05-11 05:56:31

标签: google-bigquery

感谢Google提供BigQuery,这太棒了! 是否可以使用BigQuery进行近似字符串匹配/模糊字符串搜索? Google是否计划将此功能添加到BigQuery?

Google专有的近似字符串匹配算法当然可以用来为BigQuery提供此功能,同时仍然保留Google知识产权。我们搜索了所有BigQuery文档和Stack Overflow问题。当然,有很多算法可以做到这一点,但如何与BigQuery集成?

我们的需求很简单,比较两个大致相同的字符串虽然可能略有不同。例如:

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC".  

从我们的BigQuery测试中看来,两个字符串需要完全匹配BigQuery才能加入它们,甚至是每个字符串中的尾随空格数。将非常感谢添加此功能或与BigQuery集成的指南。这是对位于威斯康星州密尔沃基市的区域性,创新型,分数喷气式飞机所有权公司Milwaukee Jets的支持。再次感谢Google提供BigQuery。

非常感谢和最诚挚的问候, 安德鲁保罗 (414)212-5372

1 个答案:

答案 0 :(得分:5)

不幸的是,不支持近似字符串匹配。您可以获得的最接近的是使用正则表达式。你最好的选择可能是在数据到达BigQuery之前对其进行规范化 - 即将“Rhodes USA”和“Rhodes,USA。”转换为相同的字符串。但是,我会为此支持添加一个功能请求错误。