如何使用美丽的汤铲刮Shopify网站并获取所有标签(#)

时间:2018-10-17 18:32:47

标签: web-scraping beautifulsoup shopify webscarab

我正在尝试使用Beautiful Soup在特定网页中查找所有#元素。

source =“ https://www.runinrabbit.com/

def getPageContents(source):

    req = requests.get(source)
    print("req : ",req,type(req))
    print("***************************")
    content = Soup(req.text, 'html.parser')
    print("content data",type(content),content)
    return content

就像内容一样,我得到的只是标记值以外的所有内容。

例如,带有标签的字符串(如下所示)未在我的函数getPageContents中打印。

##############################################################码码(词((((x码))#p#的人,#runnersworld,#runnerscommunity,#breezyback,#lightweight,#simple,#runinrabbit,#borntorunfree,#breezyback,#lightweight,#simple,#runinrabbit,#borntorunfree“,#racerollcall,#racetime,#runfast,#goodluck, #RADrabbit,#rabbitELITE,#rabbitELITEtrail,#rabbitPRO,#runinrabbit,#borntorunfree”

0 个答案:

没有答案