这些路径到底是什么格式的?

时间:2017-02-10 16:53:57

标签: html dom web-scraping

我有几条路径用于解析HTML页面的某些部分。

以下是几个例子:

body > div > div.inner-wrap > div > div > div > div.person > div > a

body > div > div > div:nth-child(4) > div:nth-child(1) > div.large-7.medium-6.columns > div > h1

tbody > tr:nth-child(2) > td

我已经看到了html节点的多种不同格式类型(例如IRB,Ancestry,CSS,Xpath< - 虽然我认为我刚刚发现Xpath特定于XML),而且我也是对我上面的例子中的确切内容感到困惑。

我问的原因是因为我正在寻找可以找到的最佳浏览器扩展程序来帮助我创建这些用于抓取目的的路径。

1 个答案:

答案 0 :(得分:0)

这些是CSS选择器。您可能想查看有关该主题的MDN docs。你也不需要浏览器扩展,只需检查元素,右键单击并复制css选择器(在chrome和firefox中工作)