我正在构建图像数据库,并希望自动化该过程。我对HTML有点熟悉,我的核心程序是用C#构建的。什么是一个好的库可以帮助我下载一个页面作为HTML,并抓住页面上的URL链接到所需的图像?我熟悉如何从URL下载图像,因此不需要解决。
(图书馆或其他语言。数据库建设和程序不需要合并。)
答案 0 :(得分:0)
您想构建一个抓取工具或网站蜘蛛,它将从网站中获取内容。有一个名为 HtmlAgilityPack 的解析库,可以帮助您轻松完成。 This post will tell you how to use this library.
希望它有所帮助!