使用JAVA从浏览器的地址栏中提取URL

时间:2014-04-30 09:13:05

标签: java html

我正在研究情绪分析项目。我正在使用JAVA从给定的产品URL中提取数据(产品评论),同时用户通过浏览网站来选择产品。我需要从浏览器的地址栏中获取URL并将其传递给我的JAVA代码。如何提取URL?如何链接这两个代码?我已经在我的java代码中使用jsoup库从用户在eclipse中指定的链接中提取评论。有没有这样的方式,用户只是选择产品,它会自动从地址栏中提取URL?这是我提取评论的JAVA代码。 任何帮助,将不胜感激。

public class dataextraction {

  public static void main(String[] args) {

    Document doc;
    try {
            String link;
            System.out.println("Enter the link of the product to be reviewed");
        BufferedReader in=new BufferedReader(new InputStreamReader(System.in)); 

            link=in.readLine(); 


            // need http protocol
            doc = Jsoup.connect(link).get();


            // get page title
            String title = doc.title();
            System.out.println("title : " + title);

            Elements p= doc.select("p.line.bmargin10");
            //get all links
            String text = p.text();
            System.out.println("text : " + text);

            BufferedWriter writer = null;
            try {
            writer = new BufferedWriter(new FileWriter("E:/output.txt"));
            writer.write(text);
                } 
            catch (IOException e) {
                System.err.println(e);
                }
            finally {
            if (writer != null) {
                try {
                    writer.close();
                } catch (IOException e) {
                    System.err.println(e);
                }
            }
        }       


    } catch (IOException e) {
        e.printStackTrace();
        System.out.println(e);
    }

  }

}

1 个答案:

答案 0 :(得分:0)

尝试使用jsoup

jsoup是一个用于处理真实HTML的Java库。它提供了一个非常方便的API,用于提取和操作数据,使用最好的DOM,CSS和类似jquery的方法。

点击产品时提取

确定。可能这会有所帮助。可能你的jsp将使用所有产品的超链接。因此,使用jquery将onlcik函数绑定到所有产品href。如果给定的url是相对路径,那么您可以使用HttpServletRequest的getRequestURL()来获取完整路径。所以脚本就像..

$('a').click(function() {
    var relativeUrl = $(this).attr("href");
    var completeLink = "<%= request.getRequestURL() %>" + relativeUrl;

    // you can now pass completeLink to your java program via ajax to get the output

    //If you want to prevent browser from navigating to that url you could return false
    return false;
});