preg_match为td

时间:2013-03-24 10:52:23

标签: php preg-match

我正在尝试从td内的网页过滤数据,它是这样的:

    <td colspan="2">several anchor,bold and other html tags are inside this td</td>

我已经使用了这个preg_match但它给出了所有其他td的输出,但在上面的情况下它没有给出任何输出。

    preg_match("/\<td colspan\=\"2\"\>(.*)\<\/td\>/",$str,$title);

这是完整的td:

    <td colspan="2">
      <div align="left" style="width:370; height:315;">
            <ins style="display:inline-table;border:none;height:280px;margin:0;padding:0;position:relative;visibility:visible;width:336px">      

          <ins style="display:block;border:none;height:280px;margin:0;padding:0;position:relative;visibility:visible;width:336px" id="aswift_1_anchor"><iframe width="336" scrolling="no" height="280" frameborder="0" style="left:0;position:absolute;top:0;" name="aswift_1" id="aswift_1" onload="var i=this.id,s=window.google_iframe_oncopy,H=s&amp;&amp;s.handlers,h=H&amp;&amp;H[i],w=this.contentWindow,d;try{d=w.document}catch(e){}if(h&amp;&amp;d&amp;&amp;(!d.body||!d.body.firstChild)){if(h.call){setTimeout(h,0)}else if(h.match){w.location.replace(h)}}" allowtransparency="true" hspace="0" vspace="0" marginheight="0" marginwidth="0"></iframe></ins></ins>
           </div><p>  When starting out sometimes it is a good idea to write down your            <a href="#" style="text-decoration: underline !important;position:static;font-family:inherit !important;font-weight:inherit !important;font-size:inherit !important;" class="kLink" id="KonaLink1">   
      <font color="blue" style="color: blue !important; font-family:inherit !important;font-weight:inherit !important;font-size:inherit !important;position:static;">                   <span style="color: blue !impor  If you seriously want to take back control of your money you need to build a <a href="http://ezinearticles.com/?To-Set-Up-a-Personal-Budget-Get-a-Pencil-and-Paper&amp;id=1629478">Personal Budget</a>. To learn more about creating a budget please visit the website <a href="http://household-budget.home-choices-net.com">Household Budgets by clicking here</a>. </p><p> </p><p><!-- google_ad_section_end -->

              </p><p>
        <font style="color:02679D; font-size:12"><b><font color="000000">Related Articles - 

       </font>
           </b></font>
        </p><p><table width="100%" border="0"><tbody><tr>
        <td align="center">
           <br><br><br><br>

        <br><br>

          </font></p></td></tr></tbody></table>
            </p></td>

2 个答案:

答案 0 :(得分:1)

通常不要使用正则表达式来解析html。但是你的问题是你的正则表达式是gready并且捕获所有可能的数据。尝试添加问号:

preg_match("/\<td colspan\=\"2\"\>(.*?)\<\/td\>/",$str,$title);

问号使得该组不准确,字符串将在下一个可能的标记处结束。

答案 1 :(得分:0)

您需要添加修饰符:

        preg_match("/\<td colspan\=\"2\"\>(.*)\<\/td\>/s",$str,$title);

http://php.net/manual/en/reference.pcre.pattern.modifiers.php

 s (PCRE_DOTALL)
     

如果设置了此修饰符,则模式中的点元字符将匹配所有字符,包括换行符。没有它,新行就是   排除。此修饰符等效于Perl的/ s修饰符。一个   负面类如[^ a]总是匹配换行符,   独立于此修饰符的设置。