用于在多个页面中保存多个.doc文件的脚本

时间:2017-05-22 21:36:11

标签: file ms-word

我有150个.doc(Microsoft Word)文件,每个文件由6页制作。 我想将每个文件保存为3个文件,第一个是第1-2页,第二个是3-4,第三个是5-6。 最好的方法是循环此操作,因此使用一个脚本我可以处理所有150个文件。 输出是.doc还是PDF无关紧要。 有没有办法做到这一点? 一旦手动执行了类似的拆分操作并花了很多时间,所以我想采取一种捷径。

非常感谢, 微米。

1 个答案:

答案 0 :(得分:0)

也许您可以使用python读取每个文档并将其保存为临时文件或流,然后重新编写doc文件。

示例:

one_doc = open('1.docx', 'rb')
two_doc = open('2.docx', 'rb') 
three_doc = open('3.docx', 'rb')

lines_one = one_doc.readlines()
lines_two = two_doc.readlines()
lines_three = three_doc.readlines() 

file = open("C:\myfile.doc","w")
file.writelines(lines_one)
file.writelines(lines_two)
file.writelines(lines_three)

file.close()

http://python-docx.readthedocs.io/en/latest/user/documents.html

对于记录,如果您需要切入某个特定页面,也可以对行进行计数并除以它。