以编程方式替换PDF中的文本

时间:2011-07-05 23:50:48

标签: pdf pdf-scraping

我的PDF文件包含应该替换的文本。更具体地说,应翻译文本并用翻译版本替换。 重要的是PDF结构的其余部分保持不变。请注意,文本在PDF中可用,并且不需要像OCr这样的技术。此外,如果保留字体和其他文本属性,那就太好了。

您建议使用哪些库将文本解压缩为易于编辑的格式(例如CSV)并重新放入新文本?

1 个答案:

答案 0 :(得分:1)

假设您要用其他语言替换文本,在大多数情况下您将不得不选择不同的字体,并且字体选择非常重要。我已经使用Foxit库来成功更改文本或创建PDF。