Question

我正在尝试从类似

的网站解析源代码

   <html>
    ...
    ...
    ...
    <div class="menu_body">
    <a href="url" onclick="_gaq.push([parameters]);location.href=this.href+'?channelId=287&date='+dateOfMonth;return false;"> <img src="img"></a>
    <a href="url"><img src="img"></a>
    <a href="url"><img src="img"></a>
    </div>
    ...
    ...
    <div class="menu_body">
    <a href="url"><img src="img></a>
    <a href="url"><img src="img"></a>
    <a href="url"><img src="img"></a>
    </div>
    ...
    ...
    ...
    </html>

如果可能的话，我想要做的只是查看包含channelId的所有行，不确定是否可能？

Answer 1

听起来你想要某种HTML Parser

http://simplehtmldom.sourceforge.net/    <-- PHP
http://htmlparser.sourceforge.net/         <--- Java

/ ** @see Robust and Mature HTML Parser for PHP * /

Answer 2

使用CURL或file_get_contents将html作为字符串读取，然后使用的preg_match。 http://php.net/manual/en/function.preg-match.php

PHP：获取包含特定文本的所有行

2 个答案: