我将如何从Instagram收集此类数据以进行Web抓取项目,我尝试自己使用beautifulsoup来获取它,并要求真实解析整个页面: 但这不起作用
import requests
from bs4 import BeautifulSoup
usrs=[]
soup=BeautifulSoup(requests.get("https://www.instagram.com/p/Bziq7f2C-jM/").content,'html.parser')
elem1=soup.find_all('div',class_="EtaWk")
#elem1 contains all the usernames within it
if elem1:
elem2=elem1.find('ul',class_="XQXOT")
if elem2:
xelems=elem2.findAll('ul',class_="Mr508")
for i in range(len(xelems)):
lis=xelems[i].find('a',class_="FPmhX notranslate TlrDj",title=True)
usrs.append(a["title"])
答案 0 :(得分:1)
如果您不需要使用Beautifulsoup并自己解析HTML响应,则有Instaloader,这是一个Python库,可以很轻松地访问Instagram。完成pip install instaloader
的安装后,您可以完成
import instaloader
L = instaloader.Instaloader()
Post = instaloader.Post.from_shortcode(L.context, 'Bziq7f2C-jM')
然后,Post.get_likes()
在喜欢帖子的个人档案上返回一个迭代器,因此要打印所有用户名,您可以
for like in Post.get_likes():
print(like.username)
除了简单的解决方案外,Instaloader还具有自动处理限速的优势,并且支持处理登录和访问私人资料的帖子。