标签: python-3.x nlp text-database
我想组织产品评论以进行文本分析。整理数据的最佳方法是什么?
我想向学生展示如何使用sklearn进行文本分析,但我想让他们使用自己的数据。我要使用的示例包括产品评论。这些是CSV文件中的文本格式。每个记录都是评论,因此是一个文档。整个文件是语料库。这是组织评论的最佳方法吗?还是每个评论都是单独的文本文件?在这两种情况下,熊猫最好是导入文本还是应该使用python read函数?感谢您提供有关数据组织的建议。