搜索行中具有相同单词一半以上的行

时间:2019-11-22 18:26:53

标签: string pandas dataframe

我正在尝试查找哪些行的相同单词超过其长度的一半。 在这里,从下面的屏幕截图中,您可以看到行号93188和行号93248的标题是相同的(至少从屏幕上可以看到),标题93240和93247也相同。 我想找到所有标题相同的行,以便我可以丢掉其中的一行,只剩下一张。

str.contain需要特定的单词作为字符串参数,因此我认为这不是我可以使用的。请让我知道我该怎么做。

einstein dataframe

0 个答案:

没有答案