在进行情绪分析时,我怎样才能让机器明白我是指苹果(iphone),而不是苹果(水果)?
感谢您的建议!
答案 0 :(得分:4)
嗯,有几种方法,
我首先检查大写字母,通常在提到名字时,首字母大写。
在进行情绪分析之前,我会使用一些词性和命名实体识别来标记相关的单词。
Stanford CoreNLP是一个很好的文本分析项目,它将开始教授 你是基本概念。
来自CoreNLP的示例:
您可以看到标签如何为您提供帮助。
并查看more info
答案 1 :(得分:3)
如Ofiris所述,NER只是解决问题的一种方法。我觉得使用词嵌入来代表您的词更有效。机器以这种方式自动识别单词的上下文。例如,“ Apple”通常与“ eat”一起使用,但是如果给定的输入“ Apple”与“ mobile”或该域中的其他任何单词一起出现,Machine将理解为“ iPhone apple”而不是“ apple fruit” ”。有两种流行的方式来生成单词嵌入,例如word2vec和fasttext。 Gensim为word2vec和fasttext提供了更可靠的实现。
https://radimrehurek.com/gensim/models/word2vec.html https://radimrehurek.com/gensim/models/fasttext.html
答案 2 :(得分:0)
在日期,知名品牌,贵宾或历史人物的存在下,您可以使用NER(命名实体识别)算法;在这种情况下,正如Ofiris所建议的那样,斯坦福CoreNLP提供了一个很好的命名实体识别器。
对于多义词的更一般的消歧(即,具有多于一种意义的词,例如“好”),您可以使用与Word Sense Disambiguation(WSD)算法相结合的POS标记符。可以找到后者的一个示例HERE,但我不知道为此目的可以免费下载的库。
答案 3 :(得分:0)
许多开源的预训练NER模型已经解决了这个问题。无论如何,您都可以尝试重新训练现有的NER模型以对其进行微调以解决此问题。 您可以找到Spacy NER here完成的NER结果演示。