为什么Selenium Google Colab会提供空的csv数据?

时间:2020-01-08 20:10:34

标签: selenium selenium-webdriver selenium-chromedriver google-colaboratory

  1. 我在Google colab上运行以下脚本,它运行正常,并且也提供了我想要的csv输出,但它是空的csv。为什么会发生这种情况?如何正确获取csv数据,其中必须有从目标网站抓取的信息?

Code

注意:在获得屏幕截图时,目标网站上有数据,该数据不为空。

  1. 此外,当我在google colab上运行此代码时,它没有打开测试chrome浏览器,通常在运行此代码后必须出现测试chrome浏览器。为什么我看不到?

!apt-get update

!apt install chromium-chromedriver

!cp /usr/lib/chromium-browser/chromedriver /usr/bin

!pip install selenium

from selenium import webdriver

options = webdriver.ChromeOptions()

options.add_argument('--headless')

options.add_argument('--no-sandbox')

options.add_argument('--disable-dev-shm-usage')


wd = webdriver.Chrome('chromedriver',options=options)

wd.get('http://arsiv.mackolik.com/Genis-Iddaa-Programi')

import pandas as pd

import time

timestr = time.strftime("%Y%m%d-%H%M%S")

first_team= wd.find_elements_by_xpath('//*[@id="resultsList"]/tbody/tr/td[6]/a')

second_team= wd.find_elements_by_xpath('//*[@id="resultsList"]/tbody/tr/td[7]/a')


my_list1=[]

my_list2=[]


for name in first_team:

    print(name.text)
    my_list1.append(name.text)

for name in second_team:

    print(name.text)
    my_list2.append(name.text)


df = pd.DataFrame({ 

    'FIRST TEAM': my_list1, 
    'SECOND TEAM': my_list2
})

df.to_csv(f'{timestr}.csv')

wd.quit()

0 个答案:

没有答案