我正在尝试使用samppipe库在java中进行文章提取

时间:2014-01-16 15:53:44

标签: java boilerpipe

package com.index;

import java.net.URL;

import com.opensymphony.xwork2.ActionSupport;
import de.l3s.boilerpipe.extractors.ArticleExtractor;

public class search_article extends ActionSupport {
/**
 * 
 */
private static final long serialVersionUID = 1L;
String article;

public String getArticle() {
    return article;
}

public void setArticle(String article) {
    this.article = article;
}

@Override
public String execute() throws Exception {

    String content = null;
    URL url = new URL("http://www.nydailynews.com/sports/baseball");
    ArticleExtractor ae = new ArticleExtractor();
    content = ae.getText(url);
    System.out.println(content);
    System.out.println("in execute");
    return SUCCESS;
}
 }

它显示以下错误:HTTP状态500 - java.lang.reflect.InvocationTargetException

1 个答案:

答案 0 :(得分:0)

500到599的HTTP错误(尽管实际使用的数字非常少)与已知的4xx错误不同。

4xx错误表明您作为客户端做错了,您应该修改您的请求,以便服务器可以实现ist - 最突出的错误是找不到404网页(找不到更精确的对象)。 / p>

另一方面,5xx错误表示服务器错误。这意味着,您可能做的一切都正确,但服务器无法处理您的请求。

如果出现4xx错误,您可以继续发出请求直到所有日期结束,这将无效。 有了5xx错误,它可能在某些时候起作用 - 例子包括服务器上的负载很重,通常会导致500(内部服务器错误)。