Question

我正在尝试使用Beautiful Soup在特定网页中查找所有＃元素。

def getPageContents(source):

    req = requests.get(source)
    print("req : ",req,type(req))
    print("***************************")
    content = Soup(req.text, 'html.parser')
    print("content data",type(content),content)
    return content

就像内容一样，我得到的只是标记值以外的所有内容。

例如，带有标签的字符串（如下所示）未在我的函数getPageContents中打印。

##############################################################码码（词（（（（x码））＃p＃的人，＃runnersworld，＃runnerscommunity，＃breezyback，＃lightweight，＃simple，＃runinrabbit，＃borntorunfree，＃breezyback，＃lightweight，＃simple，＃runinrabbit，＃borntorunfree“，＃racerollcall，＃racetime，＃runfast，＃goodluck，＃RADrabbit，＃rabbitELITE，＃rabbitELITEtrail，＃rabbitPRO，＃runinrabbit，＃borntorunfree”

如何使用美丽的汤铲刮Shopify网站并获取所有标签（＃）

0 个答案: