我正在开发一款非常简单的Android RSS阅读器作为学习体验。我决定使用XmlPullParser来解析feed,因为它非常简单并且具有可接受的效率水平(根据我的需要)。我在尝试解析我的测试源(rss.slashdot.org/slashdot/slashdot)时遇到错误,尽管我在网上搜索答案,但我似乎无法解决。错误(来自eclipse)是:
START_TAG <image>@2:1252 in java.io.InputStreamReader@43e7a488
START_TAG (empty) <{http://www.w3.org/2005/Atom}atom10:link rel='self' type='application/rss+xml' href='http://rss.slashdot.org/Slashdot/slashdot'>@2:1517 in java.io.InputStreamReader@43e7a488
DEBUG/JRSS(313): java.net.MalformedURLException: Protocol not found:
有问题的文件是:
<image>
...
</image>
<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://rss.slashdot.org/Slashdot/slashdot" />
<feedburner:info uri="slashdot/slashdot" />
<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" />
...
因此错误似乎发生在feedburner标签上。
最后,我的代码是:
public class XmlHelper
{
private XmlPullParserFactory factory;
private XmlPullParser xpp;
private final int START_TAG = XmlPullParser.START_TAG;
// Debugging Tag
private final String TAG = "JRSS";
// for channels and items
private final String TITLE = "title";
private final String LINK = "link";
private final String DESCRIPTION = "description";
private final String PUBDATE = "pubDate";
// element keys for channel
private final String LANGUAGE = "language";
private final String IMAGE = "image";
private final String ITEM = "item";
// for items
private final String AUTHOR = "author";
// for images
private final String URL = "url";
private final String WIDTH = "width";
private final String HEIGHT = "height";
public XmlHelper(Context context)
{
try
{
factory = XmlPullParserFactory.newInstance();
}
catch (XmlPullParserException e)
{
Log.d(TAG, e.toString());
}
factory.setNamespaceAware(true);
}
public Channel addFeed(URL url) throws XmlPullParserException, IOException
{
Channel c = new Channel();
c.items = new ArrayList<Item>();
xpp = factory.newPullParser();
xpp.setInput(url.openStream(), null);
// move past rss element
xpp.nextTag();
// move past channel element
xpp.nextTag();
while(xpp.nextTag() == START_TAG)
{
Log.d(TAG, xpp.getPositionDescription());
if(xpp.getName().equals(TITLE))
c.title = xpp.nextText();
else if(xpp.getName().equals(LINK))
c.url = new URL(xpp.nextText());
else if(xpp.getName().equals(DESCRIPTION))
c.description = xpp.nextText();
else if(xpp.getName().equals(LANGUAGE))
c.language = xpp.nextText();
else if(xpp.getName().equals(ITEM))
{
Item i = parseItem(xpp);
c.items.add(i);
}
else if(xpp.getName().equals(IMAGE))
{
parseImage(xpp);
}
else
xpp.nextText();
}
return c;
}
public Item parseItem(XmlPullParser xpp) throws MalformedURLException, XmlPullParserException, IOException
{
Item i = new Item();
while(xpp.nextTag() == START_TAG)
{
// do nothing for now
xpp.nextText();
}
return i;
}
private void parseImage(XmlPullParser xpp) throws XmlPullParserException, IOException
{
// do nothing for now
while(xpp.nextTag() == START_TAG)
{
xpp.nextText();
}
}
我真的不知道是否有办法忽略这一点(因为此时我并不关心feedburner标签)或者是否有一些解析器的功能我可以设置为使其工作,或者如果我以错误的方式解决这个问题。任何帮助/建议/指导将不胜感激。
答案 0 :(得分:0)
PullParsing比SAX更有效。但在我看来,它仍然需要做很多工作才能使你的RSS源能够解析任何源。
您需要迎合所有格式RSS 1,RSS 2,Atom等。即使这样,您也必须应对格式不佳的Feed。
我过去遇到过类似的问题所以决定在服务器上进行feed解析,然后获取解析后的内容。这允许我运行更复杂的库和解析器,我可以修改它而不会推出我的应用程序的更新。您应该查看服务器端选项,以便您可以保持应用程序轻量级和简单。
我在AppEngine上运行了以下服务,它允许在您的末尾进行更简单的XML / JSON解析。响应有一个固定而简单的结构。您可以使用它来解析
http://evecal.appspot.com/feedParser
您可以使用以下参数发送POST和GET请求。
feedLink:RSS提要响应的URL:JSON或XML作为响应格式
示例:
对于POST请求
curl --data-urlencode“feedLink = http://feeds.bbci.co.uk/news/world/rss.xml”--data-urlencode“response = json”http://evecal.appspot.com/feedParser
对于GET请求
evecal.appspot.com/feedParser?feedLink=http://feeds.nytimes.com/nyt/rss/HomePage&response=xml
我的Android应用程序“NewsSpeak”也使用它。