我有一个这样的CSV文件
记录|说明|日期|等....
1 |玛丽珍不喜欢收到的服务。 | 07/04/02 |
我需要标记文本字段中存在私有名称的实例。我想在CSV 1中设置两个新列,表示记录包含一个名称,另一个列出记录中的名称。在Google Refine运行75k记录后,它允许使用Google Refine进行加急清理。我知道NLTK可以对这些进行标记,但在如何使用它来执行此类任务方面相对较新。
输出csv文件应如下所示:
记录|说明|日期|包含名称|命名实体
1 |玛丽珍不喜欢收到的服务。 | 07/04/02 | True |玛丽珍