为什么URLGetRelations API将某些句子误标为“未来”时态?

时间:2016-02-24 16:39:13

标签: ibm-watson alchemyapi

我希望使用URLGetRelations API来帮助识别将来时的文本中的句子。但是,我发现API在识别为将来时态的句子中存在不准确之处。以下示例均标识为“未来”,但这些可能是不正确的。我在下面的API响应中看到有一些乱码(例如第一篇文章中的“revivehim”),也许这会导致错误标记?但是,如果您查看我已将API指向的URL,则原始源文本中不会出现扭曲。

来自:http://www.reuters.com/article/new-york-police-idUSL2N15R02C

  

{“句子”:“我的上帝,有人受到了打击,”一位泪流满面的梁回忆说   发现流血的格利躺在降落地上,作为他的   女朋友疯狂地试图复活。“,”主题“:{”text“:”他的   女朋友“},”行动“:{”文字“:”试图复活“,”lemmatized“:”试试   恢复“,”动词“:{”text“:”revive“,”tense“:”future“}},”object“:   {“text”:“他”,“sentimentFromSubject”:{“type”:“negative”,“score”:   “-0.70197”}}},

两个来自:http://www.cnn.com/2016/02/11/us/nypd-officer-trial/

  

{“句子”:“星期四,在判决前约一小时,   陪审团要求法官丹尼·春(Danny Chun)向他们提供指控和法律   定义,本周第二次。“,”subject“:{”text“:”正义   Danny Chun“},”行动“:{”text“:”to read“,”lemmatized“:”to read“,   “动词”:{“text”:“read”,“tense”:“future”}},“object”:{“text”:   “指控和法律定义”,“情绪”:{“类型”:“否定”,   “得分”:“ - 0.597878”}}},

1 个答案:

答案 0 :(得分:1)

我认为这是"到"这引起了这种混乱。看到将来紧张的动词短语包括"到"这一点非常普遍,例如"我将在以后吃掉#34;和#34;我们计划今晚飞行。"你也会看到像#" Joe这样的短语今晚出现在电视上#34;即使它没有100%语法正确,也意味着将来时态。在您分享的案例中,单词" to"正在行动形成一个不定式,但由于与未来时态动词短语的结构非常相似,它们被归类为将来时态。通过第二个例子可以很容易地看出这是怎么回事:主题是#34;正义Danny Chun",行动是"阅读",对象是& #34;收费......"。该系统将此视为一句话,其中包括#34;法官Danny Chun阅读费用",这给了我们将来的时态。