Question

我在下面的链接中有一个表格：

https://docs.google.com/spreadsheets/d/1EOALaBVzHijUP_8dM1Sr7KTutdTah8b9Q0xDRoNHBLo/edit#gid=0

如果首先分割文本，然后检查该怎么做？例如“ Kebumen区办公室”与“ Kebumen区地方办公室”，那么我们需要7x7列= 49列，因为我们将为每个单词匹配1-1、1-2、1-3、1-4、2- 1，2-2.2-3.2-4等拆分B列中的文本，然后与A列中的文本一起检查每个单词。如果在B列中找到许多不同的单词，则该文本不相似。

只有我仍然对制定公式感到困惑。请给我解决方法先生。谢谢。

Answer 1

在您的情况下，匹配模式非常不同，我看不到基于公式（正则表达式）的解决方案。

您可能需要查找有关fuzzy vlookup的文章。

这是我在Google表格中找到的内容（未经测试）：

插件，find fuzzy matches

这个问题是common for Excel，有一些基于vba的解决方案。

正如我所说，一个公式不能解决您的任务，因为您有很多情况。使用公式轻松检查第一个示例Mc Donald与McDonald的情况：

= substitute(A, " ", "") = substitute(B, " ", "")

您的下一个样本是不同的。您可以使用一些代码，但是即使这样也无法获得预期的结果。我的建议是：将任务分解为几个小案例，并尝试分别解决。针对每个案例进行调查或提出新的问题。

您的第二行和3维行均为case2。在这种情况下，您需要检查A中的所有单词也都在B中。您需要尝试解决它，并在需要时询问另一个问题。等等。

Answer 2

模糊匹配绝对是必经之路。不同的算法有不同的优点和缺点。我的建议是您访问附加商店并查找 Flookup 或直接点击以下链接：

Flookup for Google Sheets

它允许您查找相似度在0％到100％之间的匹配项。基本公式是：

FLOOKUP(lookupValue, tableArray, lookupCol, indexNum, threshold, rank)

从官方网站上找到更多信息。

检查Google表格中Coloumn之间的相似性字符串

2 个答案: