我试图从Amazon goldbox中提取所有产品详细信息,但从 view-pagesource 中仅获得8个产品详细信息。下面是我的代码。
import requests
url='https://www.amazon.in/gp/goldbox/'
htmltext=requests.get(url).content.decode('utf-8')
print(type(htmltext))
pattern = re.compile(r"https://www.amazon.in/.*/dp/(.*?)\"")
asin=set(re.findall(pattern,htmltext)) '''getting only 7 records but this URL https://www.amazon.in/gp/goldbox/ has atleast 30 products'''
是否有任何操作/模块/功能来获取所有产品详细信息,而不是使用 view-pagesource (因为它仅包含某些产品的详细信息)。可能是 view-pagesource 不处理前端中的实时数据