Python删除西班牙语单词

时间:2019-03-14 19:06:05

标签: python

我有一个标记列表,例如["Adiós", "John", "Salud", "Love"],我的任务是删除被识别为西班牙语的单词。

我尝试过enchantpolyglot,但它们只是无法连接到aspell

还有其他更简单的模块或方法可以检测西班牙语单词并将其删除吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

我找到了language-detector。您可以尝试一下。

from language_detector import detect_language

data = ["Adiós", "John", "Salud", "Love"]

not_spanish_data = [word for word in data if detect_language(word) != 'Spanish']

print(not_spanish_data)
#['John', "Salud" 'Love']