使用熊猫多对多应用功能

时间:2018-07-30 21:41:13

标签: python pandas

我正在使用<!DOCTYPE html> <html> <head> <title></title> <link rel="stylesheet" type="text/css" href="style.css" media="screen" /> </head> <body> <button onclick="add()">OK</button> <br><br> <textarea id="tt4" name="t4"></textarea> </body> </html>基于pandas模块的字符串匹配进行条件过滤。我编写了一些有效的代码,但是速度很慢,并且与我体内的每一种本能背道而驰,因为我在熊猫系列上使用了for循环。

我的问题是我想将字符串数组与另一个字符串进行比较,如果一个数组中的字符串与另一个数组中的任何字符串足够相似,我想将其从数组中完全删除。我当前的代码是这样:

fuzzywuzzy

有人有什么建议/最佳实践来使此代码更快吗?

1 个答案:

答案 0 :(得分:0)

可能有一种更快的方式来完成您要问的事情。如果可能的话,请您重新评估对Fuzzywuzzy软件包的需求。编辑距离计算非常昂贵,因为它会为数组中的每一对字符串构造一个大小为n * mnm是两个字符串的大小)的矩阵。