我使用OpenNLP解析一些医学报告,但其中一个Parser树结果引起了我的注意。原始行如下:
“它们被肿瘤组织取代,肿瘤组织显示出腺体分化。”
Parser树看起来像这样
(TOP (S (NP (PRP They)) (VP (VBP are) (VP (VBN replaced) (PP (IN by)
(NP (NP (JJ tumour) (NN tissue,)) (SBAR (WHNP (WDT which))
(S (VP (VBP show) (NP (JJ glandular))))))))) (. differentiation.) ))
我不明白的是(。区别。),因为我知道“。”平均句子更接近。但正如你所看到的那样,有“差异化”这个词,那么它的含义是什么?我知道这是一个NN但是我该怎么办才能让OpenNLP处理它?我是否需要提供自己的信息并为此训练系统?