Java - 读取和写入在浏览器窗口内呈现的Pdf

时间:2014-02-09 20:37:26

标签: java pdf selenium adobe-reader

我有一个使用Selenium WebDriver Java自动化的场景:
网页包含一些客户数据。它有一个链接转换为PDF ,以安全的pdf格式转换该客户列表。我必须验证PDF文档中列出的客户列表是否符合网页中显示的列表。

Selenium WebDriver具有与Browser DOM中存在的元素进行交互的功能。因此,要与在浏览器窗口中呈现的PDF文档进行交互,我需要一些其他Java实用程序,它可以检索该PDF文档中存在的数据。如果有人之前遇到类似的事情,请帮助。谢谢你提前。

谢谢,
Sitam

1 个答案:

答案 0 :(得分:1)

要从pdf文件中读取,您可以使用传统的FileReader API。

import java.io.*;    

public class FileRead {


    public static void main(String[] args) throws IOException {


        File f=new File("C:\\Documents and Settings\\abc\\Desktop\\abc.pdf");

        OutputStream oos = new FileOutputStream("test.pdf");

        byte[] buf = new byte[8192];

        InputStream is = new FileInputStream(f);

        int c = 0;

        while ((c = is.read(buf, 0, buf.length)) > 0) {
            oos.write(buf, 0, c);
            oos.flush();
        }

        oos.close();
        System.out.println("stop");
        is.close();

    }
}

您可以将此流传递给UI,也可以直接通过文件路径将文件路径传递给UI,以便访问该文件。 要编写或更新PDF文件,您可以使用itext / pd4ml库。工作得非常好。

链接:

Itext

PD4ML