PDF到txt的转换:为什么txt.write()不起作用?

时间:2018-01-02 15:02:38

标签: python pdftotext pypdf2

我在这里要做的是将pdf转换为文本文件。此txt不是预先存在的,但它是使用creaty创建的。问题是尽管writy.write()在其他脚本中运行良好,但它现在无法更改writy文件,所以它仍然是空白的。我应该改变什么? 感谢

P.S。 open中的编码都存在,因为结果中有u \ u0152

import PyPDF2

pdfFileObj = open('Computer_science_paper_1__HL.pdf', 'rb')
creaty = open('Computer_science_paper_1__HL.txt', 'w+', encoding="utf-8")
writy = open('Computer_science_paper_1__HL.txt', 'a', encoding="utf-8")

pdfReader = PyPDF2.PdfFileReader(pdfFileObj)

for x in range(1,pdfReader.numPages):
    pageObj = pdfReader.getPage(x)
    result = pageObj.extractText()

    writy.write(result)

0 个答案:

没有答案