如何从网站上刮取表格并使用c#导出到excel

时间:2014-03-31 20:33:56

标签: c# excel web-scraping

我有一个链接,我想应用webscraping,我可以通过它获取表的信息,然后将此表导出到excel.Please建议

  HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
        var myTable = doc.DocumentNode
                         .Descendants("table")
                         .Where(t => t.Attributes["id"].Value == someTableId)
                         .FirstOrDefault();

        if (myTable != null)
        {
            ///further parsing here
        }

我将要使用的代码如上所述。因为我是初学者所以任何人都可以告诉我该怎么做

1 个答案:

答案 0 :(得分:1)

您可以继续遍历表行和单元格:

 if (myTable != null)
    {
        int iRow=0;
        var tableRows = myTable
                     .Descendants("tr");

        foreach (var tableRow in tableRows)
        {
             var rowCells = tableRow
                     .Descendants("td");

             int iColumn=0;
             foreach (var cell in rowCells)
             {
                //Save to Excel code
                //Perform any checks here to ensure youre getting a valid value from the cell contents
                //Excel.Cell[iRow,iColumn++]=cell.InnerText;

             }
             iRow++;
        }
    }
}

如果要使用OpenXML格式(Excel 2007及更高版本),您可以使用任何第三方工具将值保存到Excel,例如NPOI表示二进制格式(最多Excel 2003)或ClosedXML )。