标签: pdf pdf-scraping
我的PDF文件包含应该替换的文本。更具体地说,应翻译文本并用翻译版本替换。 重要的是PDF结构的其余部分保持不变。请注意,文本在PDF中可用,并且不需要像OCr这样的技术。此外,如果保留字体和其他文本属性,那就太好了。
您建议使用哪些库将文本解压缩为易于编辑的格式(例如CSV)并重新放入新文本?
答案 0 :(得分:1)
假设您要用其他语言替换文本,在大多数情况下您将不得不选择不同的字体,并且字体选择非常重要。我已经使用Foxit库来成功更改文本或创建PDF。