需要帮助来捕获正则表达式中的组

时间:2015-04-22 07:03:02

标签: regex

我有一些动态内容可能看起来像这样:

<table id="1429023316617" class="item group table hdr" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <h3>Produkt/tjänst</h3>
        </td>
        <td>
            <h3>SEK</h3>
        </td>
    </tr>
</tbody>
</table>
<table class="item group table bdy" jrow="true" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <p>Nem inctenihit am et eumquiae
                <br>Nem inctenihit am et eumquiae net, nimi, te cullam
                <br>aut dis senectu rehentis imi, cullande repratusape eict</p>
        </td>
        <td>
            <p>000:-</p>
        </td>
    </tr>
</tbody>
</table>
<table class="item group table bdy" jrow="true" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <p>Nem inctenihit am et eumquiae
                <br>Nem inctenihit am et eumquiae net, nimi, te cullam
                <br>aut dis senectu rehentis imi, cullande repratusape eict</p>
        </td>
        <td>
            <p>000:-</p>
        </td>
    </tr>
</tbody>
</table>
<table class="item group table bdy" jrow="true" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <p>Nem inctenihit am et eumquiae
                <br>Nem inctenihit am et eumquiae net, nimi, te cullam
                <br>aut dis senectu rehentis imi, cullande repratusape eict</p>
        </td>
        <td>
            <p>000:-</p>
        </td>
    </tr>
</tbody>
</table>
<table class="item group table bdy" jrow="true" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <p>Nem inctenihit am et eumquiae
                <br>Nem inctenihit am et eumquiae net, nimi, te cullam
                <br>aut dis senectu rehentis imi, cullande repratusape eict</p>
        </td>
        <td>
            <p>000:-</p>
        </td>
    </tr>
</tbody>
</table>
<table class="item group table bdy" jrow="true" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <p>Nem inctenihit am et eumquiae
                <br>Nem inctenihit am et eumquiae net, nimi, te cullam
                <br>aut dis senectu rehentis imi, cullande repratusape eict</p>
        </td>
        <td>
            <p>000:-</p>
        </td>
    </tr>
</tbody>
</table>
<ul>
<li>A</li>
<li>B</li>
</ul>
<table id="1429605671510" class="item group table hdr" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <h3>Optioner</h3>
        </td>
        <td>
            <h3></h3>
        </td>
    </tr>
</tbody>
</table>
<table class="item group table bdy" jrow="true" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <p>Aktivt miljöval – Eurostage 3a motor
                <br>
                <br>Som ett led i vårt miljöarbete och för att bidra till minskad miljöpåverkan och utsläpp från reservkraftanläggningen offererar vi ett motoralternativ med optimerad prestanda och avgasemissioner. Motorn möter kraven på emissioner enligt Eurostage 3a som gäller för mobila reservelverk och som idag inte är ett krav för stationära anläggningar.</p>
        </td>
        <td>
            <p>SEK XX XXX:-</p>
        </td>
    </tr>
</tbody>
</table>
<table class="item group table bdy" jrow="true" editor="false" cellpadding="0" cellspacing="0">
<tbody style="">
    <tr style="">
        <td>
            <p>Aktivt miljöval – Eurostage 3a motor
                <br>
                <br>Som ett led i vårt miljöarbete och för att bidra till minskad miljöpåverkan och utsläpp från reservkraftanläggningen offererar vi ett motoralternativ med optimerad prestanda och avgasemissioner. Motorn möter kraven på emissioner enligt Eurostage 3a som gäller för mobila reservelverk och som idag inte är ett krav för stationära anläggningar.</p>
        </td>
        <td>
            <p>SEK XX XXX:-</p>
        </td>
    </tr>
</tbody>
</table>

我需要做的是获得所有&#34;项目组表bdy&#34;元素和知道哪些是彼此的直接兄弟,所以在这种情况下它将是2组,一组有5个表,一个有2个。

我设法捕获所有&#34;项目组表bdy&#34;单独使用此regx:

/(<(.+?) .+?jrow="true"[^\r]+?</\2>)/g

jrow =&#34; true&#34;总是会出现在这些类型的桌子上,以便我可以轻松地将它们单独出来,但我不知道如何继续进行而不是单独捕捉它们直接兄弟姐妹。

我已经尝试了解这个问题,因为我知道有关Stackoverflow的regEx问题有点不满意,但我无法找到答案:(

0 个答案:

没有答案