如何读取HTML文档并提取图像名称?

时间:2012-04-13 18:53:10

标签: wpf

我正在使用WPF,C#和VS2010开发一个应用程序,我不知道如何继续这个......

我对获取html文件中引用的所有.jpg和.bmp图像的算法感兴趣。如何从html文件中提取主体?

由于

2 个答案:

答案 0 :(得分:0)

您可以使用正则表达式执行此操作。

http://msdn.microsoft.com/en-us/library/ms228595.aspx

以下模式应该有效:

(http?:\/\/.*\.(?:png|jpg|gif))

答案 1 :(得分:0)

HTML Agility Pack是一个非常可靠的库,用于从HTML文档中提取元素。一个简单的视图是将它看作是XPATH的包装器,带有一个很好的API。