无法以字符串格式解析rss内容并将其存储在bean的arrayList中

时间:2013-09-02 21:53:19

标签: java string parsing arraylist rss

我的代码中有RSS字符串,它是从数据库中提取的。我需要解析每个值并存储在Bean的ArrayList中。例如,标题,链接和描述中的所有值都应存储在arraylist中。

这是我的Bean类

public class RssBean {
String title;
String link;
String description;

public RssBean(String title,String link,String description)
{
    this.title=title;
    this.link  = link;
    this.description = description; 
}

public String getTitle(){
    return title;
}

public void setTitle(String title){
    this.title = title;
}

public String getLink(){
    return link;
}

public void setLink(String link){
    this.link = link;
}

public String getDesc(){
    return description;
}

public void setDesc(String  description){
    this.description=description;
} 
}

主程序就是这样 -

import java.util.ArrayList;        
public class RssToList {
public static void main(String args[])
{   ArrayList<RssBean> list = new ArrayList<RssBean>(); 
    RssBean bean = new RssBean(null, null, null);

    String rss = "<rss version="+"\"2.0\"\">" + 
            "<channel>"+
    "<title>W3Schools Home Page</title>"+
    "<link>http://www.w3schools.com</link>"+
    "<description>Free web building tutorials</description>"+  
             "<item> "+
             "<title>RSS Tutorial</title>"+
             "<link>http://www.w3schools.com/rss</link>"+
              "<description>New RSS tutorial on W3Schools</description>"+
             "</item>"+
             "</channel>" +
              "</rss>";

for(int i=0;i<rss.length();i++)
{
    while(rss.startsWith("<item>") && rss.endsWith("</item>"))
    {
    //  bean.setTitle(rss.substring(rss.indexOf("<title>"),rss.lastIndexOf("</title>")));   
    //  bean.setLink(rss.substring(rss.indexOf("<link>"),rss.lastIndexOf("</link>")));
    //  bean.setDesc(rss.substring(rss.indexOf("<description>"),rss.lastIndexOf("</description>"))); 

        String title =  StringUtils.substringBetween(rss, "<title>", "</title>");
        String link = StringUtils.substringBetween(rss, "<link>", "</link>");
        String description = StringUtils.substringBetween(rss, "<description>", "</description>");

        bean.setTitle(title);
        bean.setLink(link);
        bean.setDesc(description);

        System.out.println(bean);
    } //end if

     //add the bean to list 
    list.add(bean);
}//end for   
}
}

我无法得到结果,看起来我的逻辑是完全错误的...我看到程序终止了。有人可以更正上述代码并引导我查看结果吗?

1 个答案:

答案 0 :(得分:1)

如果要解析XML,请使用XML解析器(javax.xml.parsers.DocumentBuilder)。

如果输入已经在字符串中,只需将org.xml.sax.InputSource实例化为String的包装,并将其传递给DocumentBuilder#parse(InputSource is)。假设它是有效的XML,所有的辛苦工作都已完成,你可以挑选你想要的数据。