我有一个包含表格,图片等的PDF文件。我想将此PDF文件的文本翻译成另一种语言,并创建一个类似于第一个文件但包含翻译文本的PDF文件(它应该包含图像,表格,......和第一个文件一样)。
如何用C ++编写一个能够完成这项工作的程序?
我有一个程序可以从PDF文件中提取文本并转换文本但我无法创建包含特殊位置的表格和图像的输出PDF文件。如何创建将布局作为原始文件的PDF文件?
答案 0 :(得分:0)
您的程序应该读取内存结构中的PDF(如对象树),然后翻译内存中的文本叶,然后将内存结构转储回PDF。 为此,您需要一个pdf解析库,它允许您操作对象表示。
我不是C ++开发人员,因此我不了解C ++库世界;但是通过谷歌上的快速搜索,看起来PoDoFo可以完成这项工作。