在C#Win8.1应用程序中读取XML ElementExtensions

时间:2014-07-25 16:05:19

标签: c# xml windows-runtime windows-8.1 syndication-feed

我对C#和Windows App开发都很陌生,我的体验主要是在python中,但我试图挑战自己去学习新的东西。

我通过制作Windows应用商店来练习/学习c#,在做了一些WinJS / HTML5教程后,我开始学习本教程:http://msdn.microsoft.com/en-us/library/windows/apps/br211380.aspx

我已经完成了教程(包括修改8.1应用程序的说明,因为教程落后了。我现在正在尝试调整我的应用程序来处理其他类型的数据。

我试图从帖子中的每个项目中提取所有媒体:图片代码,以便我可以显示它们。这是来自RSS提要的XML数据的结构。

        <item>
        <title>Post with photos</title>
        <link>http://website.com/2014/07/23/post-1//</link>
        <comments>http://website.com/2014/07/23/post-1/#comments</comments>
        <pubDate>Wed, 23 Jul 2014 15:45:02 +0000</pubDate>
        <dc:creator><![CDATA[Author]]></dc:creator>
                <category><![CDATA[Post]]></category>

        <guid isPermaLink="false">http://www.website.com/p?1</guid>
        <description><![CDATA[description here]]></description>
        <wfw:commentRss>http://www.website.com/post/1/feed/</wfw:commentRss>
        <slash:comments>0</slash:comments>
        <enclosure type="image/jpeg" length="1" url="http://0.gravatar.com/avatar/" />

        <media:thumbnail url="http://www.website.com/thumbnail_urle1406130272443.jpg?w=500" />
            <media:content url="http://0.gravatar.com/avatar/" medium="image">
            <media:category>author</media:category>
        </media:content>
            <media:content url="http://www.website.com/post/1/233-e1406130272443.jpg" medium="image">
            <media:title>image-23</media:title>
                    </media:content>
            <media:content url="http://www.website.com/post/1/163.jpg" medium="image">
            <media:title>image-16</media:title>
                    </media:content>
            <media:content url="http://www.website.com/post/1/73.jpg" medium="image">
            <media:title>bimage-7</media:title>
                    </media:content>
        </item>

我在HTML5 / JS中实现了这个,当我使用这个方法时:

        var thumb = post.querySelector(
            "thumbnail").attributes.getNamedItem("url").textContent;
        var postImages = post.querySelectorAll("content");

        var ImageList = [];
        for (var imgIndex = 1; imgIndex < postImages.length; imgIndex++) {
            var imgHTML = "<img src='" + postImages[imgIndex].attributes.getNamedItem("url").textContent + "'</img><br/>";
            var ImageList = ImageList += imgHTML;
        }

但自然......在C#中不会做。我在SO中查看了这些帖子:Get media elements from RSS using SyndicationFeed以及内部链接的那些帖子,他们不适合我。当我尝试使用时     var elements = rss.Feed.Items.SelectMany(s =&gt; s.ElementExtensions.Select(x =&gt; x.GetObject()。Value));

当我使用我的代码将所有内容放在一起时,我没有可用的GetObject方法。这是我目前的数据模型。

        private async Task<FeedData> GetFeedAsync(string feedUriString)
        {
            Windows.Web.Syndication.SyndicationClient client = new SyndicationClient();
            Uri feedUri = new Uri(feedUriString);

            try
            {
                SyndicationFeed feed = await client.RetrieveFeedAsync(feedUri);

                // This code is executed after RetrieveFeedAsync returns the SyndicationFeed.
                // Process the feed and copy the data you want into the FeedData and FeedItem classes. 
                FeedData feedData = new FeedData();

                if (feed.Title != null && feed.Title.Text != null)
                {
                    feedData.Title = feed.Title.Text;
                }
                if (feed.Subtitle != null && feed.Subtitle.Text != null)
                {
                    feedData.Description = feed.Subtitle.Text;
                }
                if (feed.Items != null && feed.Items.Count > 0)
                {
                    // Use the date of the latest post as the last updated date.
                    feedData.PubDate = feed.Items[0].PublishedDate.DateTime;

                    foreach (SyndicationItem item in feed.Items)
                    {
                        FeedItem feedItem = new FeedItem();
                        if (item.Title != null && item.Title.Text != null)
                        {
                            feedItem.Title = item.Title.Text;
                        }
                        if (item.PublishedDate != null)
                        {
                            feedItem.PubDate = item.PublishedDate.DateTime;
                        }
                        if (item.Authors != null && item.Authors.Count > 0)
                        {
                            feedItem.Author = item.Authors[0].Name.ToString();
                        }
                        // Handles RSS / Atom Feed differences..
                        if (feed.SourceFormat == SyndicationFormat.Atom10)
                        {
                            if (item.Content != null && item.Content.Text != null)
                            {
                                feedItem.Content = item.Content.Text;
                            }
                            if (item.Id != null)
                            {
                                feedItem.Link = new Uri(item.Id);
                            }
                        }
                        else if (feed.SourceFormat == SyndicationFormat.Rss20)
                        {
                            if (item.Summary != null && item.Summary.Text != null)
                            {
                                feedItem.Content = item.Summary.Text;
                            }
                            if (item.Links != null && item.Links.Count > 0)
                            {
                                feedItem.Link = item.Links[0].Uri;
                            }
                        }
                        feedData.Items.Add(feedItem);
                    }
                }
                return feedData;
            }
            catch (Exception)
            {
                return null;
            }
        }

我尝试过设置断点并查看RSS2.0联合处理程序中的项目数据,我可以看到var media = item.ElementExtensions;我的帖子中有所有元素扩展名及其标题的准确值。 (NodeName&#34; content&#34;,NodeValue是&#34;标题&#34;来自元素。但没有url标记的URI ..)

我正在寻找一些方法来集成一些获取这些媒体的方式:内容,媒体缩略图等,以便我可以组装它们并在我的应用程序中将它们用于HTML内容。

任何建议将不胜感激!

编辑:

我的更多代码..

 public class FeedData
    {
        public string Title { get; set; }
        public string Description { get; set; }
        public DateTime PubDate { get; set; }
        public Uri Image { get; set; }

        private List<FeedItem> _Items = new List<FeedItem>();
        public List<FeedItem> Items
        {
            get
            {
                return this._Items;
            }
        }

    }

    // Holds info for a single blog post
    public class FeedItem
    {
        public string Title { get; set; }
        public string Author { get; set; }
        public string Content { get; set; }
        public DateTime PubDate { get; set; }
        public Uri Link { get; set; }
    }

    // Holds a collection of blog feeds (FeedData), and contains methods needed to retrieve
    // the feeds
    public class FeedDataSource
    {
        private ObservableCollection<FeedData> _Feeds = new ObservableCollection<FeedData>();
        public ObservableCollection<FeedData> Feeds
        {
            get
            {
                return this._Feeds;
            }
        }

        public async Task GetFeedsAsync()
        {
            Task<FeedData> feed1 =
                GetFeedAsync("http://url.com/feed");
            Task<FeedData> feed2 =
                GetFeedAsync("http://url.com/feed");
            ... 
            ...

            this.Feeds.Add(await feed1);
                ...
                ...
                ...
            this.Feeds.Add(await feed15);

        }

2 个答案:

答案 0 :(得分:2)

我不熟悉手机应用程序,但你会将这些数据放入某种转发器,数据网格等, 是?不熟悉Task通用对象我仍然会猜测你可以将C#键值对类与List一起使用,然后直接在Repeater,Grid中使用此对象。我相信任何实现IEnumerable的对象(List应该是)都可以用KeyValuePair迭代

让我更多地了解您想要做的事情。在我看来是

foreach KeyValuePair KVP in ListObject
{
   //Access KVP.key and values with your code here ...
}

更明显的例子是使用KVP迭代字典对象:

    foreach (KeyValuePair<string, string> entry in dictTestEasement)
    {
        builder.RowFormat.Height = 0.2; //force row height by text font by setting height small
        builder.InsertCell();
        builder.Font.Bold = true;
        builder.InsertHtml(entry.Key);
        builder.Font.Bold = false;
        builder.InsertCell();
        builder.InsertHtml(entry.Value);
    }

在这种情况下,构建器是文档构造的全局对象(Aspose Words Object) - 它正在构建Word文档。不要被它抛出。

看起来很简单......我之前使用过这样的解决方案,并且相信这就是你要捕鱼的原因。

答案 1 :(得分:0)

SyndicationItem有一个GetXMLDocument方法,它接受SourceFormat(如Rss20),然后生成一个可以使用GEtElementsByTagName(或ID)解析的XML字符串。完成后,您可以在循环中迭代重复的标记,并使用Attributes.GetNamedItem()来获取XML标记的命名属性。似乎&#39;媒体&#39;在浏览xml for media:Rss20格式的内容标签时,它会被删除,因此所有必要的内容都是要搜索的内容。

var allImages = item.GetXmlDocument(feed.SourceFormat).GetElementsByTagName("content");
foreach (var s in allImages)
{
Debug.WriteLine(s.Attributes.GetNamedItem("url").InnerText;)
}