使用php从html标签中提取数据到mysql

时间:2012-12-29 16:48:50

标签: php html sql curl web-scraping

  

可能重复:
  PHP Simple HTML DOM Parser: Accessing custom attributes

我正在寻找一种将数据从html标签导入sql的方法。该网页位于外部服务器上。

我有一个包含此字符串的网站;

<div class="item_1" value_1="1a" value_2="1b" value_3="1c">
  some text which i don't want to import into sql
</div>

<div class="item_2" value_1="2a" value_2="2b" value_3="2c">
  some text which i don't want to import into sql
</div>

我想使用php脚本文件将类和value_1,value_2和value_3属性存储到mySQL数据库。

我已经设置了一个cURL脚本来将数据导出到文本文件,但这包括所有文本而不仅仅是我需要的属性。我只能以HTML格式回应结果。

有人可以请我如何做到这一点。如果它甚至可能......

1 个答案:

答案 0 :(得分:1)

您可以使用类似这样的HTML解析器:http://simplehtmldom.sourceforge.net/

或者你可以像文本一样解析它(简单或w.RegEx)