使用硒的网站所有链接中的单词频率

时间:2017-06-17 14:37:32

标签: python excel selenium

我正在编写代码来使用Selenium自动计算给定链接的单词数。我在driver.get()中提供了网址。我使用find_elements_by_xpath将返回一个链接列表。我想要做的是抓取每个链接并查找单词的频率,例如"机器学习","深度学习"并打印频率以及excel表中的单词。

我已经提取了链接。我该如何进一步。

from selenium import webdriver
import os 

driverLocation = "C:\\Users\\Shishir\\workspace\\libs\\chromedriver.exe"
os.environ["webdriver.chrome.driver"] = driverLocation
driver = webdriver.Chrome(driverLocation)
driver.get("https://www.servicenow.com/solutions-by-category.html")

#Get elements by Xpath
links = driver.find_elements_by_xpath("//a[@href]")
for elem in links:
    #print all the links 
    print(elem.get_attribute("href"))

0 个答案:

没有答案