使用c#从网页中提取Disqus评论

时间:2013-06-11 17:04:10

标签: c# disqus

我需要在CNN网站的每个新闻页面中获取用户评论,该网站使用评论系统。我使用进行html解析。我是否可以使用任何特定代码来使用提取评论作者和评论。

提前致谢, Dinusha

1 个答案:

答案 0 :(得分:3)

由于Disqus嵌入是javascript嵌入,因此除非网站在那里呈现,否则评论将不会在页面源中提供。如果您正在抓取页面并让javascript渲染,那么第一页(最多50条评论)可以在“postCompatContainer”DIV中的Disqus iFrame中找到。

但是,我建议使用Disqus API来完成此任务。这有两个主要部分:

  1. 从文章中获取主题信息
  2. 特别是在页面源中,您必须找到变量'disqus_shortname'和'disqus_identifier'或'disqus_url'。如果'disqus_identifier'或'disqus_url'不可用,那么您可以尝试使用窗口位置地址,但这不太可靠。

    1. 使用该数据进行API调用。
    2. 具体来说,您将要使用我们的threads/listPosts端点,将'disqus_shortname'作为'forum',将标识符或url分别作为'thread = ident:'或'thread = link:'传递。< / p>

      我不会在这里详细介绍如何使用API​​,但我们在这里有一个很好的入门教程:http://help.disqus.com/customer/portal/articles/1131783-tutorial-get-comment-counts-with-the-api

      以及更多示例:https://github.com/disqus/DISQUS-API-Recipes