标签: r nlp maxent
我正在寻找一个为NLP任务实现MaxEnt的R包(即对于参数数量较多的情况)。
要求是对医疗文本执行命名实体识别。我习惯于依靠CRF ++进行序列标记工作,但是对于这个特定的实体识别任务,我不想要转换/标签输入。
我检查了Maxent Package - 它创建了一个我不想要的tf-idf表示。我需要提供我的功能,作为前一个和下一个单词,pos标签等的组合。非常类似于如何使用CRF ++。