根据下拉列表进行刮擦

时间:2014-06-27 09:34:15

标签: c# .net web-scraping

#document
    <html>
        <head></head>
        <body bgcolor="f2f2f2" leftmargin="0" topmargin="5">
          <style>  ...
          </style>
            <table width="100%"">
                <tbody>
                    <tr></tr>
                    <tr>
                        <form id="frmFindParts"></form>
                        <td>
                            <select id="selYear" 
                            onchange="document.getElementById('frmFindParts').
                            submit();" name="year">    
                            <option value="">2015</option>
                         </td>

                      </tr>
                      <tr>...</tr></tbody></table>

我需要应该抓住价值2015的xapth

以下是我的代码,当我执行时,我的空值为标签变量

          var html = PageRetriever.ReadFromServer(pqi.URL, false);
            var htmlDoc = new HtmlDocument();
            htmlDoc.LoadHtml(html);
var tags = htmlDoc.DocumentNode.SelectNodes("//select[@id='selYear'] //option");

这是链接 我得到var标签的空值。我的确切位置是link。我必须在2014年到1940年之间榨取下降列表。

1 个答案:

答案 0 :(得分:1)

您要选择的HTML内容不会直接出现在所描述的网址中,但会加载到iframe中。您需要分析this URL