从URL读取.txt文件的内容

时间:2017-08-30 13:08:37

标签: vb.net web-scraping

我想从网址读取.txt文件的内容。

.txt文件内容为:

  

170000082.zip

我目前正在使用这个:

Dim address As String = "http://linktotxt"
Dim client As WebClient = New WebClient()
Dim reader As StreamReader = New StreamReader(client.OpenRead(address))
Label1.Text = reader.ReadToEnd

但它将Label1.Text值设置为HTML代码而不是txt文件的内容。

我不想在本地下载txt文件然后阅读它的文本,我想从URL中获取它。

任何帮助将不胜感激!

编辑:这是HTML文件内容:

<html><body><script type="text/javascript" src="/aes.js" ></script><script>function toNumbers(d){var e=[];d.replace(/(..)/g,function(d){e.push(parseInt(d,16))});return e}function toHex(){for(var d=[],d=1==arguments.length&&arguments[0].constructor==Array?arguments[0]:arguments,e="",f=0;f<d.length;f++)e+=(16>d[f]?"0":"")+d[f].toString(16);return e.toLowerCase()}var a=toNumbers("f655ba9d09a112d4968c63579db590b4"),b=toNumbers("98344c2eee86c3994890592585b49f80"),c=toNumbers("b8ff12f43c40961786132a275820f477");document.cookie="__test="+toHex(slowAES.decrypt(c,2,a,b))+"; expires=Thu, 31-Dec-37 23:55:55 GMT; path=/"; location.href="http://I_REMOVED_IT_SORRY/lastfilename.txt?i=1";</script><noscript>This site requires Javascript to work, please enable Javascript in your browser or use a browser with Javascript support</noscript></body></html>

谢谢! : - )

2 个答案:

答案 0 :(得分:1)

当您在浏览器中访问该地址时,Web服务器首先返回html,一个文本文件。您所看到的是完全在下载该地址的内容后您应该看到的内容。这个html然后告诉浏览器也下载并运行一些额外的javascript(aes.js)。这个javascript最终会下载你的文本文件。

您需要使用浏览器的开发工具查看javascript或监控会话,并找到文本文件的真实地址(可能是http://I_REMOVED_IT_SORRY/lastfilename.txt?i=1)。

答案 1 :(得分:0)

好的,相同的代码在我的新服务器上工作: - )

现在一切都解决了,这是一个服务器问题。