我试过基本的问题,比如问题是否以" who / what /.."但是有很多句子不是以疑问词开头的,但仍然要求像#34;新加坡的酒店和#34;这样的答案。
我已经归结为这样一种逻辑,即那些没有提供某些信息但在这种意义上不完整的句子,只能落入疑问班。是否有一些关于这个主题的参考文献?
答案 0 :(得分:1)
这可能是一项非常具有挑战性的任务,但是您可以采取一些正确的方向(其中一个步骤已经检查了开头的WH'单词)。它还在很大程度上取决于你的句子的范围。 (搜索查询,话语等)。
你可以尝试的一件事是(1)彻底检查你已经描述过的明显问题。这包括检查第一个单词是WH单词还是辅助动词(''''''''''可以& #39;,' can'等),因为在英语中经常会有问题经过主辅助倒置。 (2)如果您有任何可用的自然语言处理库,请使用POS分块并查找仅由名词短语(NP)组成的句子。这些,因为它们不包含预测信息,通常是关于名词短语的查询。我不确定你用于分析的是什么,但是一个伟大的POS块分析器是用于python的模式nlp模块(http://www.clips.ua.ac.be/pages/pattern-en#parser)。希望这会有所帮助。