如何从Tripadvisor Python抓取年龄段的用户

时间:2018-10-09 04:07:23

标签: python selenium web-scraping

我正在努力从TripAdvisor提取用户信息。

如果您查看评论,请单击用户名或照片,它将显示更多信息,包括ageg_group,贡献,有用的投票和访问的城市。

我想抓取年龄段和访问的城市。请查看下面的图片以获取更多详细信息。

enter image description here

我可以单击它,但是它只显示第一个用户的信息,而不会移到第二个用户。我把它放到了for_loop中,但是没用。

info = browser.find_element_by_class_name('info_text')
info.click()

有人建议使用python抓取所有用户信息吗? 感谢您的时间。

1 个答案:

答案 0 :(得分:0)

@Murthi建议尝试遍历它的外观应类似于:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC 


data = []
my_xpath = '//div[@class="info_text"]'
wait = WebDriverWait(browser, 10)
wait.until(EC.presence_of_all_elements_located((By.XPATH, my_xpath)))
users_info = browser.find_elements_by_xpath(my_xpath)
for index, user in enumerate(users_info):
    user.click()
    inf = browser.find_elements_by_xpath('//*[@class="countsReviewEnhancementsItem"]')
    data.append(inf)

    try:
        users_info[index+1].click()
    except :
        pass

希望这会有所帮助!