我想从以下网页抓取电子邮件地址 Facebook Business Info Page
所以我决定在Python中使用selenium驱动程序。我认为最好的方法是通过定义xpath。从元素的检查,我注意到我正在寻找的信息在以下HTML结构中找到,如下所示:
现在我必须承认,在使用Selenium并通过xpath定义元素时,我有点像菜鸟,所以我希望如果我错误地定义了以下xpath,有人会纠正我。这就是我现在所拥有的:
但我相当肯定我正在定义错误的xpath。我知道我想获取_50f4 div类中的信息,但我不知道如何定义它。如果有人能帮助我解决这个问题,我会非常感激。
答案 0 :(得分:0)
您可以使用xpath获取电子邮件地址的文本: // div [@id ='u_0_u'] // ul / li [4] // div [@class ='_50f4'] 强>