如何使用python从.txt文件中提取段落?

时间:2018-12-04 05:26:08

标签: python extraction paragraph

我需要从.txt文件中提取段落,每个段落均以字母摘要开头,如下所示。

摘要:大规模多输入多输出天线系统,毫米波通信和超致密网络已被广泛认为是 促进5G开发和部署的三个关键推动因素 系统。我们提出了一种灵活的,可快速部署的跨层人工模型 基于智能(AI)的框架,可以满足迫在眉睫的需求 5G及其他基础设施。我们提供了示例AI支持的5G用例 容纳重要的5G特定功能并讨论AI的价值 实现超越5G网络的演进。


摘要:无线革命已经从指定的愿景,总体目标以及第5代(5G)无线网络的第一个3GPP正式发布开始。尽管已发展了几种现代通信技术,但自数字通信现代时代开始以来,我们主要通过改变正弦载波信号的幅度,相位或频率来传递信息,这具有固有的缺点。一方面,索引调制(IM)提供了另一种传输数字信息的方式:相应通信系统构件的索引。


摘要:安全性是旨在利用蜂窝(C)服务将车辆连接到一切(V2X)的网络的主要关注点。当前,C-V2X正在观察从长期演进(LTE)-演进的通用陆地无线接入网(E-UTRAN)到基于第五代(5G)的功能架构的范式转变。但是,在5G-V2X下仍然需要解决安全性和凭据管理。


如何使用python脚本实现这一目标?

2 个答案:

答案 0 :(得分:2)

我假设每个段落都用新行分隔。如果是这样,您可以只使用splitlines()

with open("file", "r") as fd:
    lines = fd.read().splitlines()

如果需要,您可以像这样删除“摘要:”:

lines2 = [i[len("Abstract: ")] for i in lines]

答案 1 :(得分:1)

像这样:

with open("./abstract.txt", "r") as f:
    for line in f:
        print(line)

这是怎么回事?

我们正在创建一个用于管理文件处理程序的上下文管理器(with)。这样可以防止我们完成文件后打开文件,以及避免其他麻烦。我们用f将其分配给as f。 “模式”很简单,将open的参数设为"r"

此后,我们的f是可迭代的类似于“文件”的对象,因此我们可以执行for循环之类的列表操作,并使用它进行列表理解。每行都是一个字符串,就像您在@bunbun的出色答案中所看到的那样,我们可以对其进行字符串操作。