我有一个标记列表,例如["Adiós", "John", "Salud", "Love"]
,我的任务是删除被识别为西班牙语的单词。
我尝试过enchant
和polyglot
,但它们只是无法连接到aspell
。
还有其他更简单的模块或方法可以检测西班牙语单词并将其删除吗?
谢谢!
答案 0 :(得分:0)
我找到了language-detector。您可以尝试一下。
from language_detector import detect_language
data = ["Adiós", "John", "Salud", "Love"]
not_spanish_data = [word for word in data if detect_language(word) != 'Spanish']
print(not_spanish_data)
#['John', "Salud" 'Love']