应用错误收集

在Python中快速实现N-Grams

时间：2018-10-18 01:18:31

标签： python n-gram

我想优化此功能。它将超过数千行。

当前可以使用，但是将其应用于具有很多记录的列非常慢。谁能想到一种更快的方式来运行此脚本？关于记录总数，我大约需要45秒。

from ngram import NGram
import time 

d = {'col1': ["instruments",'instruments music','instrum 2']}
d = pd.DataFrame(data=d)

start = time.time()
d['ratio'] = d['col1'].apply(lambda x: ngram.NGram.compare(x,'instrum'))
print time.time() - start

0 个答案:

没有答案