需要使用Python NLTK标记CSV列中人员的姓名

时间:2014-07-16 17:05:51

标签: python csv nltk

我有一个这样的CSV文件

记录|说明|日期|等....

1 |玛丽珍不喜欢收到的服务。 | 07/04/02 |

我需要标记文本字段中存在私有名称的实例。我想在CSV 1中设置两个新列,表示记录包含一个名称,另一个列出记录中的名称。在Google Refine运行75k记录后,它允许使用Google Refine进行加急清理。我知道NLTK可以对这些进行标记,但在如何使用它来执行此类任务方面相对较新。

输出csv文件应如下所示:

记录|说明|日期|包含名称|命名实体

1 |玛丽珍不喜欢收到的服务。 | 07/04/02 | True |玛丽珍

1 个答案:

答案 0 :(得分:0)

我不熟悉nltk,但http://www.nltk.org/book/ch07.html似乎会有你想要的东西。