标签: unix pdf ghostscript
我希望能够搜索某些文本并将其替换或从PDF文档中删除。
我试过了pdf2ps。生成的.ps文档未响应grep或sed命令。
pdf2ps
.ps
grep
sed
是否有任何工具可以让我grep或sed或使用类似的功能?
xpdf
pdfedit
ghostscript是否允许PDF编辑?如果是,使用的功能是什么?
ghostscript
答案 0 :(得分:1)
来自Wikipedia:
Poppler还附带了一个文本渲染后端,可以从命令行实用程序pdftotext调用。例如,使用实用程序grep从命令行搜索PDF中的字符串非常有用。
这不会解决您的整个问题,因为您也想编辑,但Poppler可能是一个构建工具的库,如果没有这样的工具可用。 它似乎具有处理PDF格式的功能,这并非易事:
PDF结合了三种技术: PostScript页面描述编程语言的子集,用于生成布局和图形。 字体嵌入/替换系统,允许字体随文档一起移动。 一个结构化存储系统,用于将这些元素和任何相关内容捆绑到一个文件中,并在适当情况下进行数据压缩。
PDF结合了三种技术:
来源:Wikipedia