我是网络抓取的新手,目前我很难获得特定的文字元素。
这是我正在使用的一段html,我正在尝试获取一个周末是否包含带有“已关闭”文本的元素的信息。
我尝试了很多东西,但我得到的不仅仅是周六和周日的元素。有没有办法如何以某种方式访问我已经检索过的兄弟元素的文本或其他方式?
timetable = soup.find_all('th', text=["Sat", "Sun"])
for day in timetable:
print day.find_next_sibling('td').text.strip() /// this doesn't work
任何帮助都非常感谢。
答案 0 :(得分:0)
而不是find_next_sibling()
使用find_next('td')
:
timetable = soup.find_all('th', text=["Sat", "Sun"])
for day in timetable:
td = tr.find_next('td')
if(td.text == 'Closed'):
print(day.text,'Closed')