来自在线社区的XPath数据搜索

时间:2015-05-01 16:45:19

标签: excel xpath web-scraping

我最近阅读了这篇article有关如何使用Excel抓取Inbound.org社区成员个人资料的信息。如果您愿意,可以在这里观看video

自本教程发布以来,入站网站结构发生了一些变化,如您在视频中的11:00分钟所看到的,如果您尝试复制社交媒体图标的XPath,它看起来会略有不同,因为我没有能够提取这些信息。

这是我现在得到的:

/html/body/div[3]/div/div/div[1]/div/div[2]/a[1]/i

这就是我在Excel中编写语法的方法:

=XPathOnUrl(A2,"//a[@class='twitter']","href")

然后像这样:

=XPathOnUrl(A2,"//a[contains(@class,twitter)]/@href")

虽然我尝试过许多不同的方式,但没有一个向我展示会员社交媒体资料的链接。

我甚至尝试以多种方式更改xpath以从页面获取不同的数据,但这些都不是社交媒体信息:

=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/div[1]")

=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/h1")

老实说,我不知道该怎么做,有些不对劲,我无法弄清楚。任何人都有足够的经验,或者可以用我的语法查明问题吗?

非常感谢

0 个答案:

没有答案