我想在列中匹配一些公司名称。
如果我的数据框包含'book company services ltd'
并且我要匹配的字符串是'book company services'
,则此操作可以正常运行。
但是如果我的匹配字符串是'book company ltd'
,那么它根本就不匹配。
任何决议。是否有一种明智的方式在令牌级别上做同样的事情。
答案 0 :(得分:1)
您可以使用
B = A(:,mod(1:size(A,2),n)~=0)
检查df.foo.str.split(' ').apply(lambda l: set(l).issuperset(set('book company ltd'.split(' '))))
中的每个单词是否显示在'book company limited'
的{{1}}列的行中。
如果您希望比较与案例无关,则可以使用
进行foo