如何在使用“ Beautiful Soup”抓取网页时找到特定的模式?

时间:2018-10-01 19:13:16

标签: python beautifulsoup web-crawler

我正在尝试从twitaholic网站获取Twitter用户名,我运行以下代码,但结果打印为None(无错误消息),这是怎么回事?

import requests
from bs4 import BeautifulSoup

url = "https://www.twitaholic.com/"
headers = {'User-Agent': 'Mozilla/5.0'}
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
soup.findall(id="@(.*)")

1 个答案:

答案 0 :(得分:1)

我认为您在使用正则表达式时犯了一个错误。您应该编译模式,然后将其传递给function paramDropDown(){ var paramValue = $('#userSearchParam').val(); console.log(paramValue); return paramValue; } $( '#userSearchParam' ).change(paramDropDown); var paramDD = paramDropDown(); console.log(paramDD);

soup