我经历过OpenNLP,NLTK和其他一些不太知名的自然语言处理库。我知道,这不是我需要的,我的意思是复杂程度太高了。
我只需要对句子(标记化)执行一些基本操作,就好像“from”之后的单词将它添加到数组中,如果单词出现在“to”将其添加到数组之后,如果它是最后一个单词,将它添加到另一个数组。
我相信,我能够解释实际的要求。现在,看起来最好的是句子的XML树。在XML解析器中,我们可以选择终端节点,下一个兄弟节点,以前的兄弟节点等。但我知道这不是道路。那应该是什么?我怎样才能做到这一点? Openfst? ,ANTLR?我真的不确定应采用什么样的途径来获得最终的幸福。