根据特定的单词从网站内容中获取数据

时间:2019-02-06 19:13:09

标签: c#

using (WebClient client = new WebClient())
        {
            string url = "http://www.internalcompanywebsite.com";
            string content = client.DownloadString(url);
        }

我需要从网站内容中获取一些数据,例如(权重值或日期值)-除了权重词为(权重号)以外,使用上述代码,字符串将包含网站的html代码,如何将网站内容(而不是html)转换为数组或表(如果可以复制网站内容并使用for循环创建数组?),这可以让我在特定位置获取确切的数据,

我已经在VBA Excel中完成了以下操作,并且正在努力将该项目转换为C#申请表格。

Link = "URL;http://companyInternalWebsite.com/data=" &
Worksheets("Storage_Fees").Range("F6").Value

With Worksheets("NPTS").QueryTables.Add(Connection:=Link, Destination:=Worksheets("NPTS").Range("A1"))

    .BackgroundQuery = False
    .TablesOnlyFromHTML = True
    .Refresh BackgroundQuery:=False
    .SaveData = True
End With

'create NPTS data in MyArray
For c = 0 To 12
    For r = 0 To 1000
        NPTSArray(r, c) = Worksheets("NPTS").Range("A1").Offset(r, c)
    Next r
Next c

预先感谢

1 个答案:

答案 0 :(得分:0)

使用C#nuget包Html Agility Pack将html解析为一个对象。如果您走得太远,则发布另一个问题,如果您仍然需要有关如何使用它的帮助。

http://davidgiard.com/2018/06/20/UsingHTMLAgilityPackToParseAWebPage.aspx