我希望使用URLGetRelations API来帮助识别将来时的文本中的句子。但是,我发现API在识别为将来时态的句子中存在不准确之处。以下示例均标识为“未来”,但这些可能是不正确的。我在下面的API响应中看到有一些乱码(例如第一篇文章中的“revivehim”),也许这会导致错误标记?但是,如果您查看我已将API指向的URL,则原始源文本中不会出现扭曲。
来自:http://www.reuters.com/article/new-york-police-idUSL2N15R02C
{“句子”:“我的上帝,有人受到了打击,”一位泪流满面的梁回忆说 发现流血的格利躺在降落地上,作为他的 女朋友疯狂地试图复活。“,”主题“:{”text“:”他的 女朋友“},”行动“:{”文字“:”试图复活“,”lemmatized“:”试试 恢复“,”动词“:{”text“:”revive“,”tense“:”future“}},”object“: {“text”:“他”,“sentimentFromSubject”:{“type”:“negative”,“score”: “-0.70197”}}},
两个来自:http://www.cnn.com/2016/02/11/us/nypd-officer-trial/
{“句子”:“星期四,在判决前约一小时, 陪审团要求法官丹尼·春(Danny Chun)向他们提供指控和法律 定义,本周第二次。“,”subject“:{”text“:”正义 Danny Chun“},”行动“:{”text“:”to read“,”lemmatized“:”to read“, “动词”:{“text”:“read”,“tense”:“future”}},“object”:{“text”: “指控和法律定义”,“情绪”:{“类型”:“否定”, “得分”:“ - 0.597878”}}},
答案 0 :(得分:1)
我认为这是"到"这引起了这种混乱。看到将来紧张的动词短语包括"到"这一点非常普遍,例如"我将在以后吃掉#34;和#34;我们计划今晚飞行。"你也会看到像#" Joe这样的短语今晚出现在电视上#34;即使它没有100%语法正确,也意味着将来时态。在您分享的案例中,单词" to"正在行动形成一个不定式,但由于与未来时态动词短语的结构非常相似,它们被归类为将来时态。通过第二个例子可以很容易地看出这是怎么回事:主题是#34;正义Danny Chun",行动是"阅读",对象是& #34;收费......"。该系统将此视为一句话,其中包括#34;法官Danny Chun阅读费用",这给了我们将来的时态。