从文档中提取斜体文本

时间:2018-10-04 11:16:15

标签: python text text-analysis

我有一个Word文档,其中列出了物种名称,然后列出了有关每个物种的各种文本。我只想提取所有物种名称。这样做的明显方法是只提取所有斜体文本。但是,我找不到在python中执行此操作的方法,有人有任何想法吗?

例如输入:棘刺龙 鲁迪斯(Rudis) 小猎物孤零零– 1吗? 1个招聘:孤零零,经常抓捕弹跳虫等 小猎物(GRONENBERG等,1998)。 尺寸:小巧,可以由一个 Acromyrmex取回 冠状动脉

输出:棘刺龙 鲁迪斯(Acromyrmex) 日冕

0 个答案:

没有答案