想通过C#,所有内联,没有Process.Start()......和免费...可以是RTF,HTML,无论情况如何......只要我可以在Word中打开,然后我可以将其保存为RTF,然后我可以在RichTextBox中加载。
我知道这些年来类似的问题充斥着这个论坛,但似乎没有什么能解决我的问题。
编辑:
答案 0 :(得分:2)
使用PDF库(例如iTextSharp)来解析PDF。您将能够访问PDF中的所有文本和图像,并转换为您想要的任何表示。
还有其他解决方案(例如安装xpdf并对其进行shelling - 如果传入正确的命令行参数,它将转换为html。)
答案 1 :(得分:0)
我不确定Word是否可以打开pdf,除非您在word文档中创建了pdf。
我认为唯一的快速解决方案是购买或找到进行PDF处理的第三方库,然后使用它的API来提取您需要的文本。在任何情况下,任何情况下的文本格式都非常糟糕我相信。还要注意,一些显示文本的pdf实际上已将其保存为图像,因此无法获取数据。