为Meta Data刮刮谷歌App Store

时间:2016-02-14 18:38:33

标签: java file web-scraping google-apps-marketplace

我是Java的noob试图在Java中构建一个可以做以下事情的刮刀。

  1. 能够从CSV文件中读取数据。
  2. 使用该文件中的URI并从Google Play商店中抓取完整的应用信息。
  3. 将已删除的数据和其他元数据从CSV文件导出到XML文件
  4. 任何人都可以指导我如何离开这里吗? 直到现在我已经完成了以下三个课程

    main.java(这是我调用其他两个类的主要方法)

    import java.io.IOException;
    
    
            public class main {
            public static void main(String[] args) throws IOException {
    
                ReadCVS obj = new ReadCVS();
                obj.run();
    
    
                AppInfo obj1 = new AppInfo();
                obj1.readFile();
                }
              }
    

    ReadCVS.java(此文件读取CSV文件并以txt文件形式提供输出)

    import java.io.BufferedReader;
        import java.io.File;
        import java.io.FileNotFoundException;
        import java.io.FileOutputStream;
        import java.io.FileReader;
        import java.io.IOException;
        import java.io.PrintStream;
    
    public class ReadCVS {
    
        public void run() {
    
            // Replace the file path to the appropriate path.
            String csvFile = "\\Desktop\\https---play_google_com-store-apps-details-id=.csv";
            BufferedReader br = null;
            String line = "";
            String cvsSplitBy = ";";
    
            try {
    
                File file = new File("\\Desktop\\output.txt");
                FileOutputStream fos = new FileOutputStream(file);
                PrintStream ps = new PrintStream(fos);
                System.setOut(ps);
    
                br = new BufferedReader(new FileReader(csvFile));
                while ((line = br.readLine()) != null) {
    
                    // use comma as separator
                    String[] country = line.split(cvsSplitBy);
    
                    System.out.println("URL = " + country[0] + " "
    
                    );
    
                }
    
            } catch (FileNotFoundException e) {
                e.printStackTrace();
            } catch (IOException e) {
                e.printStackTrace();
            } finally {
                if (br != null) {
                    try {
                        br.close();
                    } catch (IOException e) {
                        e.printStackTrace();
                    }
                }
            }
    
            System.out.println("Done");
        }
    
        }
    

    AppInfo.java(此文件从已保存的output.txt读取输入并尝试输出控制台。但它目前无法正常工作)

    import java.io.BufferedReader;
    import java.io.FileReader;
    import java.io.IOException;
    
    
    public class AppInfo {
    
    public void readFile(){
    String fileName = "\\Desktop\\output.txt";
    
    //read file into stream, try-with-resources
    try (BufferedReader br = new BufferedReader(new FileReader(fileName))) {
    
        String line;
        while ((line = br.readLine()) != null) {
            System.out.println(line);
        }
    
    } catch (IOException e) {
        e.printStackTrace();
    }
    
    }
    }
    

    问题在于,每当我尝试运行此代码时,程序就会被挂起并且不会终止。

    任何人都可以帮我解决问题吗?

0 个答案:

没有答案