使用BeautifulSoup从一行中提取某些值

时间:2018-11-30 17:09:40

标签: python beautifulsoup slice

对于一门学校课程,我们正在学习高级python,以初步了解网络抓取和类似内容。...我有一个练习,我必须从以下代码行中提取值v1,v2 HTML ...我尝试查找,但找不到任何真正特定的东西...。如果它不适合使用,则将其删除。...

HTML部分

{"v1":"first","ex":"first_soup","foo":"0","doo":"0","v1":["second"]}

所以之后,当我想显示值时,它应该像

print(v1)
first
print(v2)
second

我试图通过像这样切整行来获取值:

v1=htmltext[7,12]
v2=htmltext[60,66]

但是在这种情况下,我不使用bs4模块,建议使用...。如果有人教我,我将不胜感激。

1 个答案:

答案 0 :(得分:1)

您看到的不是HTML文件,而是JSON。在这种情况下,使用BeautifulSoup的HTML解析器没有任何意义,您可能想要使用标准的JSON library来做到这一点,就像这样:

import json
json_Dict=json.loads(str(soup))

然后您可以使用标题(或键)对其进行索引

json_Dict["v1"]
>>>"first"