html - 从唯一的html类中获取网站数据 - Thinbug

从唯一的html类中获取网站数据

时间：2015-07-24 11:38:27

标签： html web-scraping

我如何从网站获取特定数据？如果它有帮助那么我需要的数据被标记在一个独特的html类下。

2 个答案:

答案 0 :(得分：0)

获取网页。
使其成为DOM结构。
使用xPath遍历它：//*[@class='target_class']
输出结果。

如果你共享一种你使用的语言，我可能会给你一些带例子的帖子。对于 php ，请阅读here。

答案 1 :(得分：0)

你可以使用Beautifulsoup在python中做你想做的事。你可以从特定的html类中抓取数据。见http://www.crummy.com/software/BeautifulSoup/bs4/doc/