我已将数据库表导入pandas数据帧。其中一列是一个字符串,我想要检查拼写错误,双打字。
是否有可以帮助解决这个问题的模块?
答案 0 :(得分:1)
可以轻松找到双打字词"手动" (我的意思是寻找连续的重复)。对于拼写错误,曾经有一个库,即pyenchant,依赖于附魔进行一些拼写检查。但是,不再维护,但您仍然可以使用它。
一些参考文献:
https://pypi.python.org/pypi/pyenchant/和 https://github.com/rfk/pyenchant
答案 1 :(得分:0)
分享我刚刚发现的有用资源供其他人参考。下面是拼写检查的python模块的索引..
https://pypi.python.org/pypi?%3Aaction=search&term=spellcheck