使用正则表达式和php从txt文件中提取ID

时间:2011-10-30 23:37:18

标签: php regex

我花了2个多小时试图让它发挥作用 我想提取

":"

之间的值

","eng_data&

txt在这里http://fdguirhgeruih.x10.mx/html.txt

输出应该是超过300个ID的列表,但我只得到一个

http://fdguirhgeruih.x10.mx/extract.php

我运行脚本时

 <? php

    //First, open the file. Change your filename
    $file = "http://fdguirhgeruih.x10.mx/html.txt";
    $word1='&quot;:&quot;';
    $word2='&quot;,&quot;eng_data&';


    $contents = file_get_contents($file);

    $between=substr($contents, strpos($contents, $word1), strpos($contents, $word2) - strpos($contents, $word1));

    echo $between; 


    ?>

2 个答案:

答案 0 :(得分:3)

这看起来像一个标准的XML文件 使用simpleXML来解析它而不是正则表达式

答案 1 :(得分:1)

内容是HTML,而不是第一个回答的XML。使用simple html dom parser