我正在尝试解析一个Web文档。使用HtmlAgilityPack(C#) 这正是寻找标签的href值的原因。
我正在解析http://www.ntis.go.kr/ThRndGateList.do
虽然成功解析,但值略有不同。 我不知道为什么。
网络的实际价值如下:
通过Htmlagilitypack获得的值如下:
正如您所看到的,这个奇怪的开始于href值中的“jsessionid”值。是什么原因?
感谢您的问候。
答案 0 :(得分:0)
可能是因为您的浏览器(在您的情况下是Chrome)已登录。如果您通过 HtmlAgilityPack 发出请求,则您就像是一个刚刚打开的浏览器:
当有人第一次打开页面时,您尝试使用的Web应用程序会生成JSESSIONID
,并且此ID通过URL传输。
这个问题可以帮助您了解Web应用程序背后的技术:Under what conditions is a JSESSIONID created?