我使用正则表达式相当新,我试图找到以下文字:
<div class="name">
<a href="/rd/?S=1401191307481569663391991831690328817&I=&DS=42639&T=55&U=http%3A%2F%2Fwww.spokeo.com%2Fmapview%2Fperson%2F18643819031%3Fpx%3D%26piplstart%3D%26q%3DJoe%2BHenderson%2C%2BPhoenix%2C%2BAZ%26g%3Dname_piplv2_scd_city01&P=">
<span class="highlight"> … </span>
T
<span class="highlight"> … </span>
, E Flower St,
<span class="highlight"> … </span>
,
<span class="highlight"> … </span>
,
<span class="highlight"> … </span>
, 50 years old
</a>
</div>
<div class="url">
www.spokeo.com/mapview/person/18643819031?px=&piplstart=&q=Joe+Hend...
</div>
我想出的表达是:
("<div class=\"name\">[\S\s]+</div><div class=\"url\">[\S\s]+</div>")
但未找到匹配项。任何帮助表示赞赏。
答案 0 :(得分:0)
这里有一个新行:
</div>
<div class="url">
但你的正则表达中没有一个:
|
V
...</div><div...
尝试在那里添加\s*
(假设\s
包含Python中的新行,并且div
实际上总是在彼此之间只有空格而后面只有空格