我有一个数据集,其中有154,051行和13列。列之一包含文本。我想找出经常出现的单词。我想确保拼写正确。因此,我运行了以下脚本,但是它花费了太多时间,并且仍在运行。有什么办法可以使我运行得更快吗?
import pandas as pd
from spellchecker import SpellChecker
df = pd.read_excel('D:\Text\Text.xlsx')
df = df.astype({"SEARCH_TEXT": str})
mispelled = " ".join(df["SEARCH_TEXT"]).split()
spell = SpellChecker()
eng=[]
for i in mispelled:
i=spell.correction(i)
eng.append(i)
有人可以告诉我更快的执行方法吗?