我正在使用nltk
库在python中使用聊天机器人。我想使用POS
标记符将我的句子分类。首先,我想将它们分为四类"IMPERATIVE", "INTERROGATIVE", "EXCLAMATORY", "DECLARATIVE"
。最后,我想添加QUESTION
,SALUTATION
和APOLOGY
等类别。我正在寻找关于如何定义英语句型的一些参考。像BNF这样的英语句子。我在哪里可以找到这样的东西。
答案 0 :(得分:0)
您的任务描述听起来不像POS tagging,而是对话建模:基本上,您需要找到根据dialogue act类型注释的英语句子语料库。我之前使用的一个好的注释方案是Allen and Core's Dialog Act Markup in Several Layers (DAMSL)。您还可以查看their 1997 paper以获取有关如何使用它的更多信息,但遗憾的是,我不知道有任何可自由使用的通用语料库注释了这些数据。