使用c#在pdf文件中搜索和着色文本

时间:2010-01-06 19:38:47

标签: c# pdf

我恐怕我甚至不知道从哪里开始遇到以下问题,所以如果你们中的任何人都给我一些指示,我会很感激。

我需要加载并显示pdf文件。然后我需要使用C#在所述pdf文件(注意位置,页面等)中搜索和着色几个感兴趣的单词。我有Adobe Acrobat 7专业版,所以我有一些COM工具。

问候。

3 个答案:

答案 0 :(得分:1)

您可以使用iText加载,修改和重新保存文档。如果你之后只是启动Acrobat就可以继续,那么你就回家了。

答案 1 :(得分:1)

操作PDF文件很难,因为pdf是一种硬格式。好的图书馆做得很好,例如ITextSharp

但我的建议是将pdf文件转换为html并使用html输出。然后将其显示在WebBrowser控件上。

我知道这是丑陋的解决方案。此丑陋的解决方案还有另一个丑陋的解决方案,用于将pdf文件转换为html。

请参阅:http://aspdotnetcodebook.blogspot.com/2008/08/how-to-convert-pdf-file-to-text-in.html

答案 2 :(得分:0)

我的company销售.NET PDF组件,可用于从文档中提取文本以及显示页面。我们有a demo here可以对PDF文档进行全文搜索和突出显示,这与您想要做的非常接近。只要更改不需要是永久性的,这种技术对您有用。