从内容中获取图片网址

时间:2012-01-19 00:50:59

标签: php

我的内容很重要。通过file_get_content获取。它是这样的:

<div class="nwsdetail">


    <div class="othernws">
        <div class="ttlcate">
            Các tin đã đăng</div>
        <div class="items">

                <div class="nwsoitem">
                   <img width="9px" src="pic/web/icon/blue_bullet.gif" border="0" />  <a class="nwsottl" href='?u=nws&su=d&cid=10&id=53948'>
                        Những con số thống kê Internet của năm 2010 và 2011
                    </a>

                    </div>

                    <div class="sepothernws">
                    </div>

                <div class="nwsoitem">
                   <img width="9px" src="pic/web/icon/blue_bullet.gif" border="0" />  <a class="nwsottl" href='?u=nws&su=d&cid=10&id=53946'>
                        Ít giám đốc tiếp thị biết khai thác sức mạnh thông tin số
                    </a>
                    </div>

                    <div class="sepothernws">

                    </div>

                <div class="nwsoitem">
                   <img width="9px" src="pic/web/icon/blue_bullet.gif" border="0" />  <a class="nwsottl" href='?u=nws&su=d&cid=10&id=53943'>
                        Dùng gói SMS nội mạng MobiFone, nhận khuyến mại tiền tỷ 
                    </a>
                    </div>

                    <div class="sepothernws">
                    </div>

                <div class="nwsoitem">

                   <img width="9px" src="pic/web/icon/blue_bullet.gif" border="0" />  <a class="nwsottl" href='?u=nws&su=d&cid=10&id=53936'>
                        CIO đầu tiên của Chính phủ Mỹ gia nhập Salesforce 
                    </a>
                    </div>

                    <div class="sepothernws">
                    </div>

                <div class="nwsoitem">
                   <img width="9px" src="pic/web/icon/blue_bullet.gif" border="0" />  <a class="nwsottl" href='?u=nws&su=d&cid=10&id=53934'>

                        Symantec thâu tóm LiveOffice
                    </a>
                    </div>

        </div>
    </div>
</div>

在这个内容中有一些图片网址,现在我想把这个内容的所有图片网址放到数组图片网址中

请指导我。非常感谢你。

2 个答案:

答案 0 :(得分:1)

结帐simple HTML DOM。有了它,您可以从页面中抓取任何内容。

答案 1 :(得分:1)

您可以使用preg_match_all过滤内容并创建一个包含所有img标记的src值的数组。

$input = "your html from file_get_contents";
preg_match_all('/<img[^>]+>/i',$input, $result); 

$images = array();
foreach( $result as $image)
{
    preg_match_all('/src=("[^"]*")/i',$image, $images[$img_tag]);
}