Python Regex / Beautiful Soup Wild Card

时间:2015-04-12 19:37:26

标签: python regex beautifulsoup regex-negation

很抱歉,如果这已在其他地方得到解答,我无法确切地知道如何做到这一点,而且我对BeautifulSoup的正则表达式并不是最有经验的。

基本上,我有这些代码。

finder = re.compile('div_\w\w\w_basic')
for soup_ in soup.find_all("div", {"id" : finder}):

这给了我所有的div标签,其中出现了一些“div _ ### _ basic”。现在,我想将结果保存在字典中,这样键就是###, 而数据就是我正在抓的信息。

感谢任何帮助,谢谢!

1 个答案:

答案 0 :(得分:0)

没关系,我想出了我的问题。万一其他人遇到它,

finder = re.compile('div_(\w\w\w)_basic')
print re.findall(finder, str(soup))
for soup_ in soup.find_all("div", {"id" : finder}):

这让我得到一个点的部分字符串和另一个点的完整字符串。再一次,我非常确定这不是最好的方法,但它是有效的。