如何使用python正则表达式搜索标记的语料库以提取某些POS

时间:2018-10-07 03:16:21

标签: python

我在文本文件中有以下带标签的语料库。

[/ DT [/ DT证券/ NNPS]和/ CC [/ DTP / NNP委员会/ NNP] / [提交的/ DT未决/ VBG分拆/ NN]提交/ VBN提交的文件/ VBN / VBD那/ IN [Cray / NNP Research / NNP Inc./NNP]将/ MD撤回/ VB [the / DT]几乎/ RB [$ / $ 100 / CD百万/ CD] in / IN [融资/ NN] [ / PRP是/ VBZ提供/ VBG [/ DT新/ JJ公司/ NNS]如果/ IN [Mr./NNP Cray / NNP]离开/ VBZ或/ CC if / IN [/ DT产品设计/ JJ project / NN] [he / PRP] Heads / VBZ is / VBZ scraped / VBN ./.

我正在尝试使用python中的正则表达式提取NNP和NNPS。这是我的代码: [\ w + .-?] *?/(NNP)|(NNPS) 但是它只能捕获NNP?!

0 个答案:

没有答案