Question

对于一门学校课程，我们正在学习高级python，以初步了解网络抓取和类似内容。...我有一个练习，我必须从以下代码行中提取值v1，v2 HTML ...我尝试查找，但找不到任何真正特定的东西...。如果它不适合使用，则将其删除。...

HTML部分

{"v1":"first","ex":"first_soup","foo":"0","doo":"0","v1":["second"]}

所以之后，当我想显示值时，它应该像

print(v1)
first
print(v2)
second

我试图通过像这样切整行来获取值：

v1=htmltext[7,12]
v2=htmltext[60,66]

但是在这种情况下，我不使用bs4模块，建议使用...。如果有人教我，我将不胜感激。

Answer 1

您看到的不是HTML文件，而是JSON。在这种情况下，使用BeautifulSoup的HTML解析器没有任何意义，您可能想要使用标准的JSON library来做到这一点，就像这样：

import json
json_Dict=json.loads(str(soup))

然后您可以使用标题（或键）对其进行索引

json_Dict["v1"]
>>>"first"