检查Google表格中Coloumn之间的相似性字符串

时间:2018-08-27 09:59:50

标签: google-sheets

我在下面的链接中有一个表格:

https://docs.google.com/spreadsheets/d/1EOALaBVzHijUP_8dM1Sr7KTutdTah8b9Q0xDRoNHBLo/edit#gid=0

enter image description here

如果首先分割文本,然后检查该怎么做?例如“ Kebumen区办公室”与“ Kebumen区地方办公室”,那么我们需要7x7列= 49列,因为我们将为每个单词匹配1-1、1-2、1-3、1-4、2- 1,2-2.2-3.2-4等 拆分B列中的文本,然后与A列中的文本一起检查每个单词。如果在B列中找到许多不同的单词,则该文本不相似。

只有我仍然对制定公式感到困惑。请给我解决方法先生。谢谢。

2 个答案:

答案 0 :(得分:0)

在您的情况下,匹配模式非常不同,我看不到基于公式(正则表达式)的解决方案。

您可能需要查找有关fuzzy vlookup的文章。

这是我在Google表格中找到的内容(未经测试):

这个问题是common for Excel,有一些基于的解决方案。


正如我所说,一个公式不能解决您的任务,因为您有很多情况。使用公式轻松检查第一个示例Mc DonaldMcDonald的情况:

= substitute(A, " ", "") = substitute(B, " ", "")

您的下一个样本是不同的。您可以使用一些代码,但是即使这样也无法获得预期的结果。我的建议是:将任务分解为几个小案例,并尝试分别解决。针对每个案例进行调查或提出新的问题。


您的第二行和3维行均为case2。在这种情况下,您需要检查A中的所有单词也都在B中。您需要尝试解决它,并在需要时询问另一个问题。等等。

答案 1 :(得分:0)

模糊匹配绝对是必经之路。不同的算法有不同的优点和缺点。我的建议是您访问附加商店并查找 Flookup 或直接点击以下链接:

它允许您查找相似度在0%到100%之间的匹配项。基本公式是:

FLOOKUP(lookupValue, tableArray, lookupCol, indexNum, threshold, rank)

从官方网站上找到更多信息。