我需要使用C#将PDF文件转换为.doc文件。虽然计算机没有安装Office,但它没有文件系统。我有什么好主意可以解决这个问题吗?我做了一些研究,大多数人都使用互操作服务。
答案 0 :(得分:0)
选项/想法可能是将PDF转换为Html,可以在Word中打开?
答案 1 :(得分:0)
您需要了解PDF并未真正实现为单一文档格式。
如果您的PDF文档是通过将文本渲染为PDF文件来创建的,那么不仅可以直接进行PDF转换,而且可以非常好(可靠)。
如果PDF的来源是扫描仪或传真(实际上是扫描仪......),那么您所拥有的是带有文本“图片”的文档。这种情况更难以处理。如果为此打开标记,则不会转换“文本”。在这种情况下,你必须处理一些OCR(光学字符识别),由于各种各样的问题,它的可靠性较低。
如果您可以选择在将数据呈现为PDF之前拦截数据(例如SSRS或Crystal中的那样),那么最好绕过PDF舞台并将数据移动到Word文档。
如果您不得不接收传真,然后需要解释其内容,请准备好OCR地狱。我去那儿已经有一段时间了,所以我希望它变得更好。
即使您的计算机上安装了办公室,您也可以访问(使用Visual Studios)Office开发人员工具包,这将允许您构建以Word格式分发的文档。(。doc / .docx)。
答案 2 :(得分:0)
使用aspose pdf工具包将pdf转换为文本,然后使用filestream或aspose doc将文本转换为doc