Question

我借助可用的命令行将PDF分割成页面：

for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do 
   gs \
    -dSAFER \
    -sDEVICE=pdfwrite \
    -dBATCH \
    -dNOPAUSE \
    -dFirstPage=$G \
    -dLastPage=$G \
    -o $G.pdf \
     47.pdf ;
done

但有些页面没有文字（图形仍然存在）

所以，我试图从PDF中提取嵌入字体：

gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"

我在系统Fonts文件夹中安装了这些字体。

之后，我重复拆分，没有发生任何变化。

如何确保页面正确提取，我现在不知道。

Answer 1

Ghostscript和pdfwrite实际上并不是为了分割PDF文件，还有其他工具可能会更好用，为什么不试试pdftk？

如果您真的想使用Ghostscript，那么我建议您从Git存储库中获取最新的前沿代码，在该代码中，pdfwrite设备将接受包含'％d'的输出文件名，并且每页写一个文件。

除此之外，我似乎最有可能只是遇到一个错误，而不是“丢失字体”，如果字体丢失，文本仍然可以使用不同的字体。您使用的是哪个版本的GS？

Ghostscript在从PDF中提取页面时丢失字体

1 个答案: