NLTK - 关于管理标记集

时间:2016-04-26 07:04:42

标签: python nltk

有几种工具可以将pos标签添加到单词中。但是我们能够管理这些标签吗?例如,有时未大写的单词可以有/ NNP标签。为了避免这种情况,我应该添加特定的单词以使它们保持不标记或告诉nltk停止标记未大写的单词吗?

编辑: 创造这个问题的原因在于我之前的工作,我试图将大写单词分组,这些单词应该是专有名词(如果它不是句子的起始单词)。但有一段时间,大写的词之间有一个词:

['Aynı, 'zamanda', 'Ayhan', 'Eczanesi']

0 个答案:

没有答案