有没有办法从.doc中提取超链接。我在doc中有一堆超链接需要在我的数据库中导入。
我尝试将doc转换为HTML,但不会传输超链接。
Regardz, 姆拉登纳莱
答案 0 :(得分:2)
我们遇到了类似的问题,最终使用了名为Aspose.Words的第三方组件。 您可以在此处找到它:http://www.aspose.com
可用于.NET和Java。
答案 1 :(得分:0)
您可以尝试将文件导入OpenOffice并查看是否传输了超链接。 OpenDocument只是一个内置XML的ZIP文件,一旦掌握了它就很容易解析。
答案 2 :(得分:0)
我做了以下事情。我用officeXP打开了.doc文件,然后将其作为博客发布,之后我以过滤网页的形式保存了该博客。这为您提供了很好的HTML,您可以轻松解析。
答案 3 :(得分:0)
我意识到这是在您的初始问题之后的几个月,但是,您还可以通过Word Automation在.doc文件中提取超链接。 API中有超链接对象,您可以轻松提取它们。