我有一个链接,我想应用webscraping,我可以通过它获取表的信息,然后将此表导出到excel.Please建议
HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
var myTable = doc.DocumentNode
.Descendants("table")
.Where(t => t.Attributes["id"].Value == someTableId)
.FirstOrDefault();
if (myTable != null)
{
///further parsing here
}
我将要使用的代码如上所述。因为我是初学者所以任何人都可以告诉我该怎么做
答案 0 :(得分:1)
您可以继续遍历表行和单元格:
if (myTable != null)
{
int iRow=0;
var tableRows = myTable
.Descendants("tr");
foreach (var tableRow in tableRows)
{
var rowCells = tableRow
.Descendants("td");
int iColumn=0;
foreach (var cell in rowCells)
{
//Save to Excel code
//Perform any checks here to ensure youre getting a valid value from the cell contents
//Excel.Cell[iRow,iColumn++]=cell.InnerText;
}
iRow++;
}
}
}
如果要使用OpenXML格式(Excel 2007及更高版本),您可以使用任何第三方工具将值保存到Excel,例如NPOI表示二进制格式(最多Excel 2003)或ClosedXML )。