我借助可用的命令行将PDF分割成页面:
for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do
gs \
-dSAFER \
-sDEVICE=pdfwrite \
-dBATCH \
-dNOPAUSE \
-dFirstPage=$G \
-dLastPage=$G \
-o $G.pdf \
47.pdf ;
done
但有些页面没有文字(图形仍然存在)
所以,我试图从PDF中提取嵌入字体:
gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"
我在系统Fonts文件夹中安装了这些字体。
之后,我重复拆分,没有发生任何变化。
如何确保页面正确提取,我现在不知道。
答案 0 :(得分:2)
Ghostscript和pdfwrite实际上并不是为了分割PDF文件,还有其他工具可能会更好用,为什么不试试pdftk?
如果您真的想使用Ghostscript,那么我建议您从Git存储库中获取最新的前沿代码,在该代码中,pdfwrite设备将接受包含'%d'的输出文件名,并且每页写一个文件。
除此之外,我似乎最有可能只是遇到一个错误,而不是“丢失字体”,如果字体丢失,文本仍然可以使用不同的字体。您使用的是哪个版本的GS?