在python中正确读取docx文件

时间:2019-07-04 09:55:55

标签: python docx

我一直在尝试读取docx文件,但是python中没有成功。问题是由于某种原因,它删除了我行首的数字。

text = docx2txt.process("X.docx")
text_new = text.replace('\n\n',"\n")

text_new.split('\n')

有人建议为什么会发生吗?

这是输出:

['1. melléklet a 36/2018. (XI. 13.) MNB rendelethez',

 '',

 'A pénz- és hitelpiaci szervezetek felügyeleti jelentéseire vonatkozó általános kitöltési előírások',

 '',

 '',

 'Kapcsolódó jogszabályok',

 '\ta Magyar Export-Import Bank Részvénytársaságról és a Magyar Exporthitel Biztosító Részvénytársaságról szóló 1994. évi XLII. törvény 

相反,输出应包含数字“ 1”。在'Kapcsolódó jogszabályok'之前,并且不应说\ta

0 个答案:

没有答案