我可以从带有disqus的网页获取disqus_identifier吗?在页面上:http://help.disqus.com/customer/portal/articles/472099-what-is-a-disqus-identifier-您可以使用disqus留言。我想编写脚本(也许beautifulsoup会很有用),它将获取页面url作为参数并返回此页面上讨论的disqus_identifier。有可能吗?
答案 0 :(得分:0)
如果您阅读他们的文档,则thread_id和disqus_identifier不是一回事。但是要获得disqus标识符,我将从以下内容开始:
def get_disqus(soup):
for script in soup.find_all('script',{'type':'text/javascript'}):
if 'disqusIidentifier' in script.get_text():
print script.attrs
print script.get_text()
url= 'http://lifeandcode.tumblr.com/post/35377038799/talking-to-strangers-a-linked-ballot-how-news'
get_disqus(url)
它只给你实际包含单词“disqus_identifier”的javascript行 - 对我而言,它揭示了值是可选的这一事实。很高兴扩展,如果你可以更具体。