应用错误收集

如何更快地编译我的拼写检查脚本？我当前的脚本花费太多时间

时间：2019-06-03 18:37:48

标签： python pandas dataframe spell-checking

我有一个数据集，其中有154,051行和13列。列之一包含文本。我想找出经常出现的单词。我想确保拼写正确。因此，我运行了以下脚本，但是它花费了太多时间，并且仍在运行。有什么办法可以使我运行得更快吗？

import pandas as pd
from spellchecker import SpellChecker

df = pd.read_excel('D:\Text\Text.xlsx')
df = df.astype({"SEARCH_TEXT": str})

mispelled = " ".join(df["SEARCH_TEXT"]).split()

spell = SpellChecker()
eng=[]
for i in mispelled:
    i=spell.correction(i)
    eng.append(i)

有人可以告诉我更快的执行方法吗？

0 个答案:

没有答案