我有150个.doc(Microsoft Word)文件,每个文件由6页制作。 我想将每个文件保存为3个文件,第一个是第1-2页,第二个是3-4,第三个是5-6。 最好的方法是循环此操作,因此使用一个脚本我可以处理所有150个文件。 输出是.doc还是PDF无关紧要。 有没有办法做到这一点? 一旦手动执行了类似的拆分操作并花了很多时间,所以我想采取一种捷径。
非常感谢, 微米。
答案 0 :(得分:0)
也许您可以使用python读取每个文档并将其保存为临时文件或流,然后重新编写doc文件。
示例:
one_doc = open('1.docx', 'rb')
two_doc = open('2.docx', 'rb')
three_doc = open('3.docx', 'rb')
lines_one = one_doc.readlines()
lines_two = two_doc.readlines()
lines_three = three_doc.readlines()
file = open("C:\myfile.doc","w")
file.writelines(lines_one)
file.writelines(lines_two)
file.writelines(lines_three)
file.close()
http://python-docx.readthedocs.io/en/latest/user/documents.html
对于记录,如果您需要切入某个特定页面,也可以对行进行计数并除以它。