我正在使用文件编写c ++程序,我需要从现有文件(如doc文件和pdf文件)中获取输入。如何用c ++编程?获得输入后,如何将这些详细信息写入新的doc或pdf文件?任何人都可以用一个例子来解释我吗?
答案 0 :(得分:2)
C ++作为一种语言并不具备“写入DOC文件”或“从PDF文件中读取”等功能。程序员可以使用的唯一工作人员是逐字节读取或写入。要使您的新品牌文件兼容PDF / DOC / etc,您必须符合所选的文件格式。阅读相同 - 你应该了解原始字节数组的哪些部分负责什么。
通常,此任务命名为“解析”或“序列化”。最好将现有解析器之一用于特定文件格式,而不是重新发明轮子。此外,某些文件格式可能正在申请专利,因此未经许可购买就不允许您处理。
到目前为止的一些线索:
答案 1 :(得分:0)
现在网上有一些图书馆(问题是从2013年开始的,也许那时还没有很多)。
除了所选答案中的链接之外,您还可以尝试PDFTron。它还支持新功能,例如。线性化。
这里是他们的样本之一-> https://www.pdftron.com/documentation/samples/cpp/TextExtractTest
(该程序本身包含4个if块,可以尝试使用库/ SDK的功能稍有不同)
应该有更多的东西,可以在网上搜索PDF解析库。