在Python中逐段复制文本文件到列表中

时间:2016-10-22 22:56:41

标签: python python-3.x format paragraph

我正在编写一个带有长文本文件的代码,以某种方式格式化每个段落并将输出打印到控制台。我已经提出了不同的方法来做到这一点,但他们都非常漫长而笨重。我只是想知道是否有命令或其他东西可以做到这一点。可能是.format()re命令的修改版本。谢谢

文字如下:

diffindere. 3. Et adhuc singulorum supplicia narro: quid si tibi
libuerit, relictis in quos ira uiritim exarsit, aspicere caesas gladio
contiones et plebem inmisso milite contrucidatam et in perniciem
promiscuam totos populos capitis damna

4.tamquam aut curam nostram deserentibus aut auctoritatem
contemnentibus. Quid? gladiatoribus quare populus irascitur, et tam
inique ut iniuriam putet quod non libenter pereunt? contemni se
iudicat et uultu gestu ardore ex spectatore in aduersarium uertitur.

输出将取决于我如何格式化它,但一切都保留在段落中。例如,我可以通过用完全停止替换所有逗号来格式化它,然后输出就是:

diffindere. 3. Et adhuc singulorum supplicia narro: quid si tibi
libuerit. relictis in quos ira uiritim exarsit. aspicere caesas gladio
contiones et plebem inmisso milite contrucidatam et in perniciem
promiscuam totos populos capitis damna

4.tamquam aut curam nostram deserentibus aut auctoritatem
contemnentibus. Quid? gladiatoribus quare populus irascitur. et tam
inique ut iniuriam putet quod non libenter pereunt? contemni se
iudicat et uultu gestu ardore ex spectatore in aduersarium uertitur.

1 个答案:

答案 0 :(得分:2)

空行是由新行,没有文本和新行组成的,所以实际上是\n\n

使用.split方法:

par = open('file.txt').read().split('\n\n')

将段落(由换行符拆分)存储为par内的字符串数组。

然后你可以处理这些段落,然后加入它们:

text = '\n\n'.join(par)