这是一个Web搜寻器代码,我正在将所有大学模块移植到csv文件中,但我无法理解为什么我的if / else语句不起作用,尝试了许多不同的解决方案,但仍然没有运气。也许我缺少什么? 这是代码(条件在底部):
from bs4 import BeautifulSoup, BeautifulStoneSoup
# import requests
import csv
with open('timetable.html', encoding='UTF-8', newline='') as html_file:
soup = BeautifulSoup(html_file, 'lxml')
csv_file = open('lol.csv', 'w', encoding='utf-8')
csv_writer = csv.writer(csv_file)
csv_writer.writerow(['Subject', 'Start date', 'Start time', 'End time', 'Location'])
table = soup.find('table')
for modulis in table.find_all('td', class_='modclass'):
# randam modulį
# randam modulio pavadinimą
pav = modulis.find_all('a')[1]
name = pav['title']
print(name)
# modulio laiko pradžia
time1 = modulis.text[0:5]
print(time1)
# modulio laiko pabaiga
time2 = modulis.text[6:11]
print(time2)
# modulio vieta
aud = modulis.find('a').text[1:]
print(aud)
# modulio data
data = modulis.parent.find('td', class_='date').text
if data[0] == 0:
rand = '2019.' + data
else:
rand = '2018.' + data
# rašom csv
print(rand)
csv_writer.writerow([name, rand, time1, time2, aud])
它永远不会被评估为真,因此它总是会被其他语句蚂蚁放入错误的年份。 我所有的约会都以2018.xx.xx结尾,但是这些以0开头的月份应该以2019.xx.xx开头
此外,数据始终采用xx.xx格式,因此data [0]总是选择第一个数字。
答案 0 :(得分:0)
您将data
设置为文本,然后将其评估为整数。只需将其更改为“ 0”即可使用。
...
data = modulis.parent.find('td', class_='date').text
if data[0] == '0':
rand = '2019.' + data
else:
rand = '2018.' + data
...