斯坦福CoreNLP和表情符号?

时间:2017-01-26 17:59:32

标签: java nlp stanford-nlp

到目前为止,当我尝试使用表情符号并使用POS标签时,它显示为未知符号,小盒子。有没有办法让POS标签器与表情符号一起使用?表情符号在unicode版本中。

2 个答案:

答案 0 :(得分:2)

如果您的代码,系统和Stanford CoreNLP代码中的字符编码正确,则应正确表示表情符号。但是,您还有两个基本问题:

首先,表情符号是一个字符长,除了不定冠词外,它们不太可能被标记为任何其他内容。 '一个'用英语讲。智能标记器可能会更好地表达表情符号,但我对此表示怀疑。

其次,更重要的是,POS标记符注释parts of speech。表情符号不是演讲的一部分。至少,它们是一个独立的,新的一类标记,但肯定不是语法。

所有这些......你知道他们的字符代码......他们已经被标记了。

答案 1 :(得分:2)

从版本3.8.0开始,Stanford CoreNLP支持emojis。

Release notes.