应用错误收集

我在Mysql表中有大量文本。我想做一些统计分析，然后使用NLTK工具包对我的文本进行一些NLP。我有两个选择：

后者看起来相当复杂，我没有发现任何实际描述如何使用它的文章我只发现：Creating a MongoDB backed corpus reader使用MongoDB作为其数据库，代码非常复杂，还需要知道MongoDB 。另一方面，前者似乎非常简单，但会导致从DB中提取文本的开销。

现在的问题是NLTK中语料库的优势是什么？换句话说，如果我接受挑战并深入研究覆盖NTLK方法，以便它可以从MySQL数据库中读取，那值得麻烦吗？将我的文本转换为语料库会给我一些我不能（或有很多困难）使用普通NLTK函数的东西吗？

如果您对将MySQL连接到NLTK有所了解，请告诉我。感谢