波斯语和英语文字之间附加“ \ n”

时间:2019-04-14 04:57:43

标签: python pdf

我正在使用PyMuPDF软件包和python3.7来阅读波斯语pdf。

问题

阅读页面中的每一行时,如果有英文单词,请在单词之后添加一个额外的\n。像这样:

سلام你好。 ==== >>>>سلام\ nhello \ n。\ n。

代码

import fitz
doc = fitz.Document(input)
page_count = doc.pageCount

for i in range(page_count):
     load_page = doc.loadPage(i)
     page = load_page.getText()  # read a page
     page = str(page)
     line_list.append(page.strip())
print(line_list)

如何删除\n

0 个答案:

没有答案