我正在使用PyMuPDF
软件包和python3.7
来阅读波斯语pdf。
问题:
阅读页面中的每一行时,如果有英文单词,请在单词之后添加一个额外的\n
。像这样:
سلام你好。 ==== >>>>سلام\ nhello \ n。\ n。
代码:
import fitz
doc = fitz.Document(input)
page_count = doc.pageCount
for i in range(page_count):
load_page = doc.loadPage(i)
page = load_page.getText() # read a page
page = str(page)
line_list.append(page.strip())
print(line_list)
如何删除\n
?