将HTML内容读入java程序

时间:2014-04-02 11:32:34

标签: java url

我正在尝试将服务提供商的充值计划信息放入我的java程序,该网站包含动态数据,当我使用URLConnection获取URL时,我只获取静态内容,我想自动执行充值计划不同的网站进入我的计划。

package com.fs.store.test;
import java.net.*;
import java.io.*;

public class MyURLConnection 
{

    private static final String baseTataUrl = "https://www.tatadocomo/pre-paypacks";`enter code here`

    public MyURLConnection()
    {

    }

    public void getMeData() 
    {
        URLConnection urlConnection = null;
        BufferedReader in = null;
            try
                {
                    URL url = new URL(baseTataUrl);
                    urlConnection = url.openConnection();
                    HttpURLConnection connection = null;
                     connection = (HttpURLConnection) urlConnection;

                         in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()/*,"UTF-8"*/));
                         String currentLine = null;

                    StringBuilder line = new StringBuilder();

                         while((currentLine = in.readLine()) != null)
                         {  
                              System.out.println(currentLine);
                              line = line.append(currentLine.trim());
                         } 
                      }catch(IOException e)
                      {
                         e.printStackTrace();
                      }
                        finally{
                            try{
                                in.close();
                            }
                            catch(Exception e){
                                e.printStackTrace();
                            }
                        }
        } 

    public static void main (String args[])
    {
        MyURLConnection test = new MyURLConnection();
        System.out.println("About to call getMeData()");
        test.getMeData();
    }


}

2 个答案:

答案 0 :(得分:1)

您必须使用HtmlEditorKits之一 在您的浏览器中启用Javascript 然后获取内容。 见例子: oreilly

答案 1 :(得分:0)

检查交通。 Firefox有一个TamperData插件。然后你可以更直接地沟通。

使用apache的HttpClient来促进通信,而不是普通的URL。

如果JSON数据回来,可能会使用一些JSON库。

更多细节,但您现在可以跳过一些加载。