是否有一个易于使用的python模块可以进行英语或芬兰文本验证?
如果我能检查用户定义的字典中存在的单词并且可能检查语法是否合适,那就没关系。
我计划对我之前做过的目录内容实施一个奇特的验证。这涉及一些简单的事情,比如检查配置脚本是否会崩溃并完成所有这些操作。这一切都很容易。
对于验证器,我应该能够输入整个文件或unicode文本字符串。
答案 0 :(得分:2)
我不确定你要做什么,但是如果你正在寻找可以说“这是有效的英语”或“这是有效的芬兰语”的东西,那么你正在寻找一类很可能无法解决的问题。
如果没有,则使用字典和/或字母频率和贝叶斯分析来确定给定文本是否类似英文或芬兰文。如果您尝试自动检测某种语言,这可能是最好的途径,尽管您会遇到混合语言文本的问题。