从html字符串中检索特定数据

时间:2018-10-30 14:22:42

标签: c# html regex

我正在从html字符串中检索数据。

字符串如下:

<html dir="ltr">

<head>
    <meta http-equiv="Content-Type" content="text/html;charset=utf-8">
    <title>Výstup reportu</title>
    <style>
        table.list {
            border-collapse: collapse;
        }
    </style>
</head>
<!script!>

<body bgcolor="#E8EAD8">
    <blockquote>
        <p><font size=+2><b> </b></font></p>
        <p> <font style="font-family:monospaced"> <table  class="list" border=1 cellspacing=0 cellpadding=1 rules=groups borderColor=black ><colgroup><colgroup>  <tbody><tr><td style= background:#5dcbfd ><font face="courier new" size="2"><nobr   id=l0002003>Statistika&nbsp;dat&nbsp;</nobr></font></td>
            <td style=b ackground:#5dcbfd><font face="courier new" size="2"><nobr   id=l0002019>&nbsp;PoÄŤet</nobr></font></td>
            </tr>
            <tbody>
                <tr>
                    <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0004003>Předan&#xe9;&nbsp;z&#xe1;znamy</nobr></font></td>
                    <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0004019>18.048</nobr></font></td>
                </tr>
                <tbody></tbody>
                </table><font face="courier new" size="2"><span style="white-space:nowrap"><font face="courier new" size="2" color=#0273bc><nobr style= background:#E8EAD8 id=l0006002>16.10.2018&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;mbew_wg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0</nobr></font></span>
                </font>
                <br><font face="courier new" size="2"><nobr><strike>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</strike></nobr></font>
                <br><font face="courier new" size="2"><span style="white-space:nowrap"><font face="courier new" size="2" color=#0273bc><nobr style= background:#E8EAD8 id=l0008002>mbew_wg</nobr></font></span>
                </font>
                <br>
                <table class="list" border=1 cellspacing=0 cellpadding=1 rules=groups borderColor=black>
                    <colgroup>
                        <colgroup>
                            <colgroup>
                                <tbody>
                                    <tr>
                                        <td style=b ackground:#5dcbfd><font face="courier new" size="2"><nobr   id=l0010003>OkOc</nobr></font></td>
                                        <td style=b ackground:#5dcbfd><font face="courier new" size="2"><nobr   id=l0010008>Artikl&nbsp;&nbsp;</nobr></font></td>
                                        <td style=b ackground:#5dcbfd><font face="courier new" size="2"><nobr   id=l0010017>celkem&nbsp;bez&nbsp;trans</nobr></font></td>
                                    </tr>
                                    <tbody>
                                        <tr>
                                            <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0012003>1210</nobr></font></td>
                                            <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0012008>xxx</nobr></font></td>
                                            <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0012017>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0&nbsp;</nobr></font></td>
                                        </tr>
                                            <tr>
                                                <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0013003>1210</nobr></font></td>
                                                <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0013008>xxx</nobr></font></td>
                                                <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0013017>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0&nbsp;</nobr></font></td>
                                            </tr>
.....

 <tbody></tbody>
                </table><font face="courier new" size="2"><span style="white-space:nowrap"><font face="courier new" size="2" color=#0273bc><nobr style= background:#E8EAD8 id=l0070002>16.10.2018&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;mbew_wg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;3</nobr></font></span>
                </font>
                <br><font face="courier new" size="2"><nobr><strike>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</strike></nobr></font>
                <br>
                <table class="list" border=1 cellspacing=0 cellpadding=1 rules=groups borderColor=black>
                    <colgroup>
                        <colgroup>
                            <colgroup>
                                <tbody>
                                    <tr>
                                        <td style=b ackground:#5dcbfd><font face="courier new" size="2"><nobr   id=l0073003>OkOc</nobr></font></td>
                                        <td style=b ackground:#5dcbfd><font face="courier new" size="2"><nobr   id=l0073008>Artikl&nbsp;&nbsp;</nobr></font></td>
                                        <td style=b ackground:#5dcbfd><font face="courier new" size="2"><nobr   id=l0073017>celkem&nbsp;bez&nbsp;trans</nobr></font></td>
                                    </tr>
                                    <tbody>
                                        <tr>
                                            <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0075003>1210</nobr></font></td>
                                            <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0075008>yyy</nobr></font></td>
                                            <td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0075017>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0&nbsp;</nobr></font></td>
                                        </tr>

我有兴趣从此行获取xxx值:

<td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0012008>xxx</nobr></font></td>

,其中的0:(between **&nbsp; and &nbsp;<nobr></font></td>**

<td style=b ackground:#eef9ff><font face="courier new" size="2"><nobr   id=l0012017>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;0&nbsp;</nobr></font></td>

我想要一个对象,例如

public class Result
{
  string value1;
  string value2; 
}

我可以在其中存储从html检索到的数据。

我该怎么做?我知道我可以使用Regex表达式,但是我的正则表达式无法正常运行,因为我期望它可以正常工作。

到目前为止,我的代码如下:

var html = myDataAsString; 

var matchForValue1 = @"nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;(.+?)&nbsp;</nobr></font></td"

var matchForValue2 = ? (I have no idea) 

第一个匹配项是匹配一些随机值,而不是我希望它匹配的值。

0 个答案:

没有答案