我正在使用<!DOCTYPE html>
<html>
<head>
<title></title>
<link rel="stylesheet" type="text/css" href="style.css" media="screen" />
</head>
<body>
<button onclick="add()">OK</button>
<br><br>
<textarea id="tt4" name="t4"></textarea>
</body>
</html>
基于pandas
模块的字符串匹配进行条件过滤。我编写了一些有效的代码,但是速度很慢,并且与我体内的每一种本能背道而驰,因为我在熊猫系列上使用了for循环。
我的问题是我想将字符串数组与另一个字符串进行比较,如果一个数组中的字符串与另一个数组中的任何字符串足够相似,我想将其从数组中完全删除。我当前的代码是这样:
fuzzywuzzy
有人有什么建议/最佳实践来使此代码更快吗?
答案 0 :(得分:0)
可能有一种更快的方式来完成您要问的事情。如果可能的话,请您重新评估对Fuzzywuzzy软件包的需求。编辑距离计算非常昂贵,因为它会为数组中的每一对字符串构造一个大小为n * m
(n
和m
是两个字符串的大小)的矩阵。>