如何在flipkart中抓取移动评论的数据?

时间:2017-11-27 17:00:45

标签: python

如何废弃Flipkart的移动评论数据

我尝试使用selenium包,但除了一篇评论外,无法一目了然地提取所有评论,所以任何人都可以帮我处理代码......

fk_path = ('[https://www.flipkart.com/moto-g-turbo-white-16-gb/product-
 reviews/itmecc4uhbue7ve6?pid=MOBECC4UQTJ5QZFR][1]')  
 from selenium import webdriver
 browser = webdriver.Chrome('/home/subhasis/chromedriver')  
 browser.get(fk_path)  
 browser.find_element_by_xpath("//span[@class='_1EPkIx']/span").click()  
 # Mimick clicking on 'Read More'
 [p.click() for p in browser.find_elements_by_xpath("//span[@class='_1EPkIx']/span")] # Expand 
 all 'Read More' buttons 
 browser.find_element_by_xpath("//div[@class='_3DCdKt']//div[@class='qwjRop']/div").text  
# Extract texts from respective Xpaths (1st review) 

1 个答案:

答案 0 :(得分:1)

尝试打开像firefox / chrome这样的浏览器并检查xpath选择。

$x('//div[@class="col"]')
$x('//div[@class="col"]/*/*/p/text()')

考虑给浏览器一些时间来加载所有额外的javascript,然后再进行快速点击,这也可以防止由于因为如此快速地发出如此多的请求而被阻止而导致的任何超时,请考虑点击“阅读更多“:

time.sleep(1)

原因是,点击“阅读更多”时可能会发出网络请求。

enter image description here