我一直在尝试读取docx文件,但是python中没有成功。问题是由于某种原因,它删除了我行首的数字。
text = docx2txt.process("X.docx")
text_new = text.replace('\n\n',"\n")
text_new.split('\n')
有人建议为什么会发生吗?
这是输出:
['1. melléklet a 36/2018. (XI. 13.) MNB rendelethez',
'',
'A pénz- és hitelpiaci szervezetek felügyeleti jelentéseire vonatkozó általános kitöltési előírások',
'',
'',
'Kapcsolódó jogszabályok',
'\ta Magyar Export-Import Bank Részvénytársaságról és a Magyar Exporthitel Biztosító Részvénytársaságról szóló 1994. évi XLII. törvény
相反,输出应包含数字“ 1”。在'Kapcsolódó jogszabályok'
之前,并且不应说\ta
。