选择打印什么BeautifulSoup .text方法?

时间:2018-10-25 05:34:34

标签: python html web-scraping beautifulsoup python-requests

我正在使用BeautifulSoup对网站上的数据进行网络抓取。在我的主要功能中,我正在打印HTML文件中的所有“强”元素,但是我想过滤掉一些我不想打印的文本。

x = "abcdef"
for i,strong in enumerate(html.select("strong")):
    print(i,strong.text)

在这种情况下,我想检查x是否在strong.text中,如果文本不包含x,则将其打印出来。

1 个答案:

答案 0 :(得分:0)

BeautifulSoup中基于<a data-toggle="tab" href="#some_special_tab_anchor"> <div id="some_special_tab_anchor" class="tab-pane fade"> special tab content </div> $( 'a[data-toggle="tab"]' ).on( 'shown.bs.tab', function( evt ) { var anchor = $( evt.target ).attr( 'href' ); alert("TAB SHOWN = "+anchor); // take action based on what tab was shown if(anchor === "some_special_tab_anchor"){ // do my special thing :) } }); 的大多数查找器方法都使用可选的文本参数。

当此参数为函数时,将传递给匹配的节点(bs4.element.SoupStrainer)。 例如

bs4.element.NavigableString