我有一个包含近95000页的大型pdf文件。它包含12000个语句。我需要分成个人陈述。我使用pdftk,但速度太慢,每7分钟只生成2个语句。你知道任何可以在命令行运行的好软件。
提前谢谢
答案 0 :(得分:1)
尝试cpdf:
cpdf -split in.pdf -o %%%.pdf
会生成001.pdf,002.pdf等。还有其他特殊代码可以生成好的输出名称。
您可以使用-chunksize n
拆分为多个页面的组。
既然你说有95000页和12000个语句,那么这些语句可能有不同的长度。在这种情况下,您可以手动执行此操作:
cpdf in.pdf 3455-3471 -o out.pdf
将页面3455-3471提取到out.pdf
cpdf可免费用于非商业用途。我们也有支持电子邮件地址。
还有一个全面的manual。
答案 1 :(得分:0)
您可以信赖pdfbox。它非常快速可靠。它还有一个命令行方式来分割或合并pdf文档。非常方便!
下载提供的jar后,您可以通过
完成工作java -jar pdfbox-app-x.y.z.jar PDFSplit [OPTIONS] <PDF file>
请查看以下选项中的链接:
http://pdfbox.apache.org/commandline/#pdfSplit
您还可以尝试一些在线工具。 http://www.pdfPi.com也非常方便使用。文件大小上传限制为100MB。
答案 2 :(得分:0)
我认为您可以使用以下Java应用程序:https://github.com/reinardhz/project-split-file
我自己做了,因为“拆分”应用程序太慢而无法拆分大文件。您可以使用该文件分割任何文件。