从C#中的html文档中获取值

时间:2016-03-20 15:42:45

标签: c# html

我的HTML是这样的:

<i>Real Name:</i> Marcos Barbosa<br>
<i>Country:</i> BR<br>
<i>Account Created:</i> 03 Sep 2012<br>
<i>Last Logoff:</i> 20 Mar 2016<br>
<i>Status:</i> Online<br>
<i>Visibility:</i> Public<br>

在/ i&gt;中获取值的最简单方法BR&GT; ?

2 个答案:

答案 0 :(得分:1)

如果这很简单,您可以使用正则表达式。否则,您可以使用Html Agility Pack。

例如,使用正则表达式,您可以匹配:

<i>Real Name:</i>(.+?)<br>

<i>Real Name:</i>([^<]+)<br>

答案 1 :(得分:0)

您可以使用.Net Framework内置的XmlDocument Parser。首先,创建一个xml文档,如下所示:

            System.Xml.XmlDocument d = new XmlDocument();
            d.LoadXml(html);

然后,您可以通过选择节点轻松访问数据。 但是,您需要对数据进行一些重新格式化以便对其进行解析。 (<br>代码需要关闭,等等......)

像这样格式化数据会起作用:

<data>
<i>Real Name:</i><a> Marcos Barbosa</a>
<i>Country:</i><a> BR</a>
<i>Account Created:</i><a> 03 Sep 2012</a>
<i>Last Logoff:</i><a> 20 Mar 2016</a>
<i>Status:</i><a> Online</a>
<i>Visibility:</i><a> Public</a>
<i>Visibility:</i><a> Public</a>
</data>