我想在数据框中的文本列上应用附魔函数,并在我的数据框中创建一个仅包含英文单词的新列。
import enchant
d = enchant.Dict('en_US')
for i in range(len(df['Text'])):
english_words = []
for w in df['Text'].split()[i]:
if d.check(w) == True:
english_words.append(w)
df['English_words'] = english_words
示例输入和输出:
答案 0 :(得分:0)
您是否尝试过.map()
(来自此related answer)?
也许是这样的:
d = enchant.Dict('en_US')
def my_func(s):
print(type(s))
return ' '.join(
word
for word in s.split()
if d.check(w))
df['English_words'] = df['Text'].map(my_func)