我需要从源代码下载页面...例如
<span id="businessNumOnMap" class="resultNumberOnMap" style="display:none;"></span><span><a href="/len/aapproximatch%20search/285295.php" onclick="loadBusinessInfo('0', '285295'); return false;" class="businessName">Cellini's Italian Restaurant</a>
我想下载“/len/aaproximat...php”......我没有为它找到合适的正则表达式...我需要下载那个页面..有人可以帮忙吗?
即时通讯使用vb.net
答案 0 :(得分:3)
通常不建议使用正则表达式解析HTML,但如果这是一个您知道其格式的简单页面,则通常建议使用Html Agility Pack。
请注意,如果您从互联网上的网页解析此内容,相关网站可能会使用T&amp; Cs来使用您可能需要遵守的数据以保持合法。
答案 1 :(得分:2)
你想用所有代码而不是唯一的html代码下载php文件本身吗?如果是这种情况则不可能
答案 2 :(得分:1)
使用WebClient.DownloadString方法进行下载。如果您没有找到合适的表达式从源中提取“Span”,那么构建您自己的。