如何使用PHP Simple HTML DOM Parser获取javascript标记内的文本

时间:2014-04-02 09:09:56

标签: php web-scraping simple-html-dom

示例:

<script>
var TEST = { "contextData" :
{id:01,title:one},{id:02,title:two},{id:03,title:three}}
</script>

如何获得所有头衔?使用PHP Simple HTML DOM Parser,我根本不知道这样做。

1 个答案:

答案 0 :(得分:3)

以下内容未经测试但应该有效:

  • 使用$script = $html->find('script', 0);
  • 获取脚本
  • 使用@pguardiario建议的preg_match_all以下模式获取标题值:/title\s*:\s*([^}]+)/

DEMO

修改

要获得所有头衔和desc(不同的qwerty),请将模式修改为:/(title|desc)\s*:\s*(?!qwerty)([^},]+)/

DEMO