使用Beautiful Soup在HTML中提取Text的一部分

时间:2017-06-30 16:28:41

标签: python html beautifulsoup

我的HTML为:

<span id="lbldiv" class="lbl" style="color:Blue;">
    Division : First; Grand Total: 3861; Grand Max Total: 4600
</span>

我可以使用span元素上的Division : First; Grand Total: 3861; Grand Max Total: 4600提取文字get_text

是否可以从文本中提取数字 - 38614600或通过使用Python中的Beautiful Soup库跳过字母来获取字符(数字)?

1 个答案:

答案 0 :(得分:1)

如果您的数据是常规的,并且根据它的外观,它是由分号分隔的键值对。下面的函数会将其提取为键值元组。然后,您可以使用类似下面的内容,仅查找有数字的行。

WSGIPassAuthorization On