带有beautifulsoup的html元素的文本和元素数据的有序列表

时间:2016-10-11 09:10:06

标签: python html screen-scraping

我想用BeautifulSoup(bs4)解析以下div元素的内容:

def wait_until_reload(&block)
  old_element = driver.find_element(:tag_name, 'html')
  yield
  wait.until do
    begin
      old_element.first(id: 'doesnt-matter')
      false
    rescue Selenium::WebDriver::Error::StaleElementReferenceError
      true
    end
  end
end

wait_until_reload { element.click }

我需要一个有序的内容列表。对于这种情况,该清单应包含以下项目:

from celery.result import allow_join_result

with allow_join_result():
    result.get()

使用tag.find_all()我可以得到像“br”这样的标签列表,但tag.find_all()不会返回所有其他数据,例如不间断的空格或文本数据。

1 个答案:

答案 0 :(得分:0)

tag.contents是我一直在寻找的。