从.doc中提取超链接

时间:2009-10-16 22:03:02

标签: php hyperlink doc

有没有办法从.doc中提取超链接。我在doc中有一堆超链接需要在我的数据库中导入。

我尝试将doc转换为HTML,但不会传输超链接。

Regardz, 姆拉登纳莱

4 个答案:

答案 0 :(得分:2)

我们遇到了类似的问题,最终使用了名为Aspose.Words的第三方组件。 您可以在此处找到它:http://www.aspose.com

可用于.NET和Java。

答案 1 :(得分:0)

您可以尝试将文件导入OpenOffice并查看是否传输了超链接。 OpenDocument只是一个内置XML的ZIP文件,一旦掌握了它就很容易解析。

答案 2 :(得分:0)

我做了以下事情。我用officeXP打开了.doc文件,然后将其作为博客发布,之后我以过滤网页的形式保存了该博客。这为您提供了很好的HTML,您可以轻松解析。

答案 3 :(得分:0)

我意识到这是在您的初始问题之后的几个月,但是,您还可以通过Word Automation在.doc文件中提取超链接。 API中有超链接对象,您可以轻松提取它们。