解析HTML,源代码,javascript问题

时间:2011-01-22 21:55:03

标签: c# html

http://booking.travel24.com/index.php?KID=610000&&id=lmpergebnis&showresult=1&detail=zielgebiet&region=-1&ziel=-1&termin=20.02.2011&ruecktermin=17.03.2011&dauer=-1&abflughafen=46&personen=25;25&kategorie=-1&verpflegung=-1&zimmer=-1

我正在尝试解析此页面的一些HTML部分,但是当我检查源代码时,我找不到这个:“Tunesien,Marokko”。

如果我查看xdeveloper,我可以将其视为html:

<a class="reglreg" href="javascript:s_hliste(20009);">Tunesien, Marokko</a>

但是,如果我检查页面的源代码,我找不到这个。为什么呢?

3 个答案:

答案 0 :(得分:2)

如果查看源代码并搜索“Marokko”,您会看到有几处出现(在多个JavaScript数组中作为数据加载)。

好像有些内容是通过加载到页面上的JavaScript动态生成的。 JavaScript构建HTML并更改页面以包含您要查找的内容。

答案 1 :(得分:2)

回答你的第一个真正的问题

  

为什么?

因为当您在浏览器中检查源代码时,您将获得原始的html代码。然后javascript出现并修改您可以在任何现代浏览器控制台中关注的DOM

  

我能以某种方式得到完整的源代码   然后?如果我在浏览器中看不到它   我怎么能看到它?

为简单起见,这取决于您是如何尝试解析它的。用什么语言?

答案 2 :(得分:0)

也许这些数据是通过AJAX调用来实现的,所以它一开始就不在html上,而是动态添加到它。

如果您需要解析此问题,可以尝试自己“模拟”ajax调用。