我正在使用spacy库构建聊天机器人。如何确定文档是否是一个有把握的问题?我知道如何进行关联,但不确定如何从问题中过滤陈述。
我正在寻找类似以下的内容:
spacy.load('en_core_web_lg')('Is this a question?').is_question
答案 0 :(得分:0)
我的第一个反应是建议在句子结尾处寻找问号。
否则,大多数问题都以{is,do,do,什么,何时,何地,谁,为什么,什么,怎么做}开头。
还有一个更复杂的答案,涉及包含辅助动词及其相对于动词的位置,但是,如果您的数据格式正确,这可能就足够了(而且很快)。