我在下面的链接中有一个表格:
https://docs.google.com/spreadsheets/d/1EOALaBVzHijUP_8dM1Sr7KTutdTah8b9Q0xDRoNHBLo/edit#gid=0
如果首先分割文本,然后检查该怎么做?例如“ Kebumen区办公室”与“ Kebumen区地方办公室”,那么我们需要7x7列= 49列,因为我们将为每个单词匹配1-1、1-2、1-3、1-4、2- 1,2-2.2-3.2-4等 拆分B列中的文本,然后与A列中的文本一起检查每个单词。如果在B列中找到许多不同的单词,则该文本不相似。
只有我仍然对制定公式感到困惑。请给我解决方法先生。谢谢。
答案 0 :(得分:0)
在您的情况下,匹配模式非常不同,我看不到基于公式(正则表达式)的解决方案。
您可能需要查找有关fuzzy vlookup
的文章。
这是我在Google表格中找到的内容(未经测试):
这个问题是common for Excel,有一些基于vba的解决方案。
正如我所说,一个公式不能解决您的任务,因为您有很多情况。使用公式轻松检查第一个示例Mc Donald
与McDonald
的情况:
= substitute(A, " ", "") = substitute(B, " ", "")
您的下一个样本是不同的。您可以使用一些代码,但是即使这样也无法获得预期的结果。我的建议是:将任务分解为几个小案例,并尝试分别解决。针对每个案例进行调查或提出新的问题。
您的第二行和3维行均为case2。在这种情况下,您需要检查A中的所有单词也都在B中。您需要尝试解决它,并在需要时询问另一个问题。等等。
答案 1 :(得分:0)
模糊匹配绝对是必经之路。不同的算法有不同的优点和缺点。我的建议是您访问附加商店并查找 Flookup 或直接点击以下链接:
它允许您查找相似度在0%到100%之间的匹配项。基本公式是:
FLOOKUP(lookupValue, tableArray, lookupCol, indexNum, threshold, rank)
从官方网站上找到更多信息。