从网页获取disqus标识符

时间:2012-09-29 20:44:47

标签: python beautifulsoup disqus

我可以从带有disqus的网页获取disqus_identifier吗?在页面上:http://help.disqus.com/customer/portal/articles/472099-what-is-a-disqus-identifier-您可以使用disqus留言。我想编写脚本(也许beautifulsoup会很有用),它将获取页面url作为参数并返回此页面上讨论的disqus_identifier。有可能吗?

1 个答案:

答案 0 :(得分:0)

如果您阅读他们的文档,则thread_id和disqus_identifier不是一回事。但是要获得disqus标识符,我将从以下内容开始:

def get_disqus(soup):
    for script in soup.find_all('script',{'type':'text/javascript'}):
        if 'disqusIidentifier' in script.get_text():
            print script.attrs
            print script.get_text()

url= 'http://lifeandcode.tumblr.com/post/35377038799/talking-to-strangers-a-linked-ballot-how-news'

get_disqus(url)

它只给你实际包含单词“disqus_identifier”的javascript行 - 对我而言,它揭示了值是可选的这一事实。很高兴扩展,如果你可以更具体。