我想在我的项目中使用SentiWordNet,我无法弄清楚感觉数字的作用是什么?以下是SentiWordNet的单词列表的一部分;
POS ID PosScore NegScore SynsetTerms Gloss
00002730 0 0 acroscopic#1面向或朝向顶点的一侧
00002843 0 0基础#1面向或朝向基部的一侧
<00> 00003829 0.25 0产妇#2分娩; &#34;产妇小母牛&#34;
以下是SentiWordNet的单词列表文档的解释;
该对(POS,ID)唯一标识WordNet(3.0)同义词集。该 值PosScore和NegScore是积极性和消极性得分 由SentiWordNet分配给synset。客观性得分可以是 计算公式为:ObjScore = 1 - (PosScore + NegScore)SynsetTerms列 报告带有感应编号的术语,属于synset (以空格分隔)。
我也在这里找到了一个相关的问题,但是我从答案中理解感觉号码的特征。以下是相关问题的链接:What does sentiwordnet 3.0 result signify?
我的问题是:如何在代码中使用感应数字部分? 它到底做了什么?
答案 0 :(得分:5)
如果您lookup "parturient" in WordNet,您会看到两个含义。这些分别是产妇#1和产妇#2。
在这种情况下,差异相当微妙。但是,例如,单词"field" has lots of senses,您可能会关心哪一个被引用。
如果您开始查看该单词的语义关系,则可以使用它们。例如。字段#4的上位词是&#34;知识域&#34;,而字段#1的上位词是&#34; tract&#34; (一块土地)。
考虑情绪时的一个典型例子是compare suck#2 and suck#4在谈论一个真空清洁工的背景下!例如。 &#34;这个清洁工真的很糟糕#4,因为它根本不会吸#2;&#34;