如何更快地编译我的拼写检查脚本?我当前的脚本花费太多时间

时间:2019-06-03 18:37:48

标签: python pandas dataframe spell-checking

我有一个数据集,其中有154,051行和13列。列之一包含文本。我想找出经常出现的单词。我想确保拼写正确。因此,我运行了以下脚本,但是它花费了太多时间,并且仍在运行。有什么办法可以使我运行得更快吗?

import pandas as pd
from spellchecker import SpellChecker

df = pd.read_excel('D:\Text\Text.xlsx')
df = df.astype({"SEARCH_TEXT": str})

mispelled = " ".join(df["SEARCH_TEXT"]).split()

spell = SpellChecker()
eng=[]
for i in mispelled:
    i=spell.correction(i)
    eng.append(i)

有人可以告诉我更快的执行方法吗?

0 个答案:

没有答案