我想解析文本并根据语法结构对句子进行分类,但我对NLP的理解很少,所以我甚至不知道从哪里开始。
据我所知,我需要解析文本并找出(或标记?)每个单词的词性。然后我搜索动词从句或我想用来对句子进行分类的任何其他定义特征。
我不知道的是,是否已经有一些方法可以更容易地做到这一点,或者我是否需要单独定义语法规则或者什么。
讨论这个问题的NLP上的任何资源都会很棒。也欢迎程序示例。我之前使用过NLTK,但没有广泛使用过。其他解析器或语言也可以!
答案 0 :(得分:3)
Python Natural Language Toolkit是一个适合做这样工作的库。与任何NLP库一样,您必须单独下载数据集以进行培训,并且还可以使用语料库(数据)和培训脚本。
还有一些example tutorials可帮助您识别单词的语音部分。无论如何,我认为nltk.org应该是你想要的地方。
具体问题可以在此处再次发布。
答案 1 :(得分:0)
可能您需要为每种语法结构定义类似“名词动词名词”等的模式,并在部分语音标记输出序列中搜索匹配。