Regex没有找到匹配

时间:2014-01-19 14:08:41

标签: python regex

我使用正则表达式相当新,我试图找到以下文字:

<div class="name">

    <a href="/rd/?S=1401191307481569663391991831690328817&I=&DS=42639&T=55&U=http%3A%2F%2Fwww.spokeo.com%2Fmapview%2Fperson%2F18643819031%3Fpx%3D%26piplstart%3D%26q%3DJoe%2BHenderson%2C%2BPhoenix%2C%2BAZ%26g%3Dname_piplv2_scd_city01&P=">
        <span class="highlight"> … </span>

         T 

        <span class="highlight"> … </span>

        , E Flower St, 

        <span class="highlight"> … </span>

        , 

        <span class="highlight"> … </span>

        , 

        <span class="highlight"> … </span>

        , 50 years old

    </a>

</div>
<div class="url">

    www.spokeo.com/mapview/person/18643819031?px=&piplstart=&q=Joe+Hend...

</div>

我想出的表达是:

("<div class=\"name\">[\S\s]+</div><div class=\"url\">[\S\s]+</div>") 

但未找到匹配项。任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:0)

这里有一个新行:

</div>
<div class="url">

但你的正则表达中没有一个:

         |
         V
...</div><div...

尝试在那里添加\s*(假设\s包含Python中的新行,并且div实际上总是在彼此之间只有空格而后面只有空格

但是,如前所述,using regex to parse HTML is playing with fire