在python中使用beautifulsoup包后如何保留标签内的文本

时间:2017-01-10 06:43:37

标签: python beautifulsoup

我有一个html标签,如下所示



<a href="http://cwe.mitre.org/data/definitions/134.html">CWE-134</a>
&#13;
&#13;
&#13;

我想保留

中的href部分

请建议执行此操作的任何步骤

2 个答案:

答案 0 :(得分:0)

提取物:

a_tag['href']  

保存到文件:

with open('output.txt', 'w') as f:
    f.write(a_tag['href'])

将其写入文件,如TXT或CSV。或者将其存储到数据库中。

答案 1 :(得分:0)

for _ in soup.find_all('a'):
    print _
    text = re.split(r'">',re.split(r'="', str(_))[-1])[0]
    print text