我正在尝试设计一个从网站上获取新闻的Android或Windows Phone 7应用程序(客户端),该网站不提供api或xml文件。
我的问题是,最好的方法是什么?我应该只下载html文件并解析其内容吗? 很抱歉,如果我的问题有点模糊,但我不是要求代码。我需要一些指导方针或方法来做到这一点。
注意:我不会违反任何版权,只是为我的大学网站创建一个门户网站。
答案 0 :(得分:2)
如果是Windows 7,则有适用于WP7的HtmlAgility Pack版本。
以下是一些示例代码:
public void Hap()
{
HtmlWeb.LoadAsync("http://www.mycollege.edu/news", OnCallback);
}
private void OnCallback(object s, HtmlDocumentLoadCompleted htmlDocumentLoadCompleted)
{
var htmlDocument = htmlDocumentLoadCompleted.Document;
//use agilitypack to parse out news
}
另一种方法是让某种服务实际上对新闻数据进行抓取和管理,然后控制移动设备使用的格式,如XML或JSON。
答案 1 :(得分:0)
查看这个问题,了解有关html解析的一些线索。 Parse HTML in Android
剧透 这里有一些链接,你可以尝试一些java html解析的东西: http://java-source.net/open-source/html-parsers
根据您尝试解析的HTML,您可能会有更好或更差的运气实际获得您想要的内容。