很抱歉,如果这已在其他地方得到解答,我无法确切地知道如何做到这一点,而且我对BeautifulSoup的正则表达式并不是最有经验的。
基本上,我有这些代码。
finder = re.compile('div_\w\w\w_basic')
for soup_ in soup.find_all("div", {"id" : finder}):
这给了我所有的div标签,其中出现了一些“div _ ### _ basic”。现在,我想将结果保存在字典中,这样键就是###, 而数据就是我正在抓的信息。
感谢任何帮助,谢谢!
答案 0 :(得分:0)
没关系,我想出了我的问题。万一其他人遇到它,
finder = re.compile('div_(\w\w\w)_basic')
print re.findall(finder, str(soup))
for soup_ in soup.find_all("div", {"id" : finder}):
这让我得到一个点的部分字符串和另一个点的完整字符串。再一次,我非常确定这不是最好的方法,但它是有效的。