如何在Python中使用PorterStemmer来阻止大型csv文件?

时间:2016-03-15 01:41:29

标签: python csv porter-stemmer stem

我最近在使用python在nlp中做项目。我需要预处理包含许多行和列的文本的csv文件。我只能干掉简单的句子。并且无法立即阻止整个csv文件。我怎么能这样做?

1 个答案:

答案 0 :(得分:0)

您可能必须阅读整个CSV文件并阻止每个单元格。 Python csv library将允许您阅读CSV文件。您可能希望使用csv.reader()csv.DictReader()。第一个将允许您循环CSV的行并单独读取它们;第二个会自动将CSV中的数据放入Python dictionary。这对你的任务来说都是一个不错的选择。

读完CSV后,您需要使用已读过的字词。如果您尚未安装,可以使用可能需要安装的nltk libraryHere是关于源代码nltk的资源。