从唯一的html类中获取网站数据

时间:2015-07-24 11:38:27

标签: html web-scraping

我如何从网站获取特定数据?如果它有帮助那么我需要的数据被标记在一个独特的html类下。

2 个答案:

答案 0 :(得分:0)

  1. 获取网页。
  2. 使其成为DOM结构。
  3. 使用xPath遍历它://*[@class='target_class']
  4. 输出结果。
  5. 如果你共享一种你使用的语言,我可能会给你一些带例子的帖子。对于 php ,请阅读here

答案 1 :(得分:0)

你可以使用Beautifulsoup在python中做你想做的事。你可以从特定的html类中抓取数据。见http://www.crummy.com/software/BeautifulSoup/bs4/doc/