用C#读取wordpress RSS - 内容不同

时间:2012-02-17 13:26:20

标签: c# wordpress rss

我正在尝试读取由wordpress生成的RSS,并激活全文。在firefox和IE9上,项数据包含元素content:encoded

<content:encoded><![CDATA[bla bla bla]]></content:encoded>            

但是在C#程序中我请求相同的rss url这个节点不存在。我这样做我的C#请求:

   WebClient client = new WebClient();
   client.Encoding = Encoding.UTF8;
   client.Headers.Add("Accept", "application/xml");
   var xml = client.DownloadString(url)

我是否必须在请求中添加标题才能拥有此特定字段?

2 个答案:

答案 0 :(得分:5)

您不需要WebClient来下载rss。

XDocument wp = XDocument.Load("http://wordpress.org/news/feed/");
XNamespace ns = XNamespace.Get("http://purl.org/rss/1.0/modules/content/");

foreach (var content in wp.Descendants(ns + "encoded"))
{
    Console.WriteLine(System.Net.WebUtility.HtmlDecode(content.Value)+"\n\n");
}

修改

问题与压缩有关。如果客户端不支持压缩,则服务器不会发送内容。

WebClient web = new WebClient();
web.Headers["Accept-Encoding"] = "gzip,deflate,sdch";

var zip = new System.IO.Compression.GZipStream(
    web.OpenRead("http://www.whiskymag.fr/feed/?post_type=sortir"), 
    System.IO.Compression.CompressionMode.Decompress);

string rss = new StreamReader(zip, Encoding.UTF8).ReadToEnd();

答案 1 :(得分:0)

我猜测Wordpress正在根据您的Accept标题选择“错误”的输出格式。使用哪种Feed在/wp-content/feed.php

中决定
$types = array(
    'rss'  => 'application/rss+xml',
    'rss2' => 'application/rss+xml',
    'rss-http'  => 'text/xml',
    'atom' => 'application/atom+xml',
    'rdf'  => 'application/rdf+xml'
);

因此,请尝试接受text/xml

,而不是application/rss+xml