标签: python text text-analysis
我有一个Word文档,其中列出了物种名称,然后列出了有关每个物种的各种文本。我只想提取所有物种名称。这样做的明显方法是只提取所有斜体文本。但是,我找不到在python中执行此操作的方法,有人有任何想法吗?
例如输入:棘刺龙 鲁迪斯(Rudis) 小猎物孤零零– 1吗? 1个招聘:孤零零,经常抓捕弹跳虫等 小猎物(GRONENBERG等,1998)。 尺寸:小巧,可以由一个 Acromyrmex取回 冠状动脉
输出:棘刺龙 鲁迪斯(Acromyrmex) 日冕