如何使用TIKA从.png或.gif文件中提取内容?

时间:2017-07-27 11:16:07

标签: png gif apache-tika

这是我的代码:

    Metadata metadata = new Metadata();     
    BodyContentHandler handler = new BodyContentHandler();

    FileInputStream inputstream = new FileInputStream(new File(
            "resources/bed_bath_beyond.gif"));
    ParseContext parseContext = new ParseContext();
    Parser parser = new AutoDetectParser();
    parseContext.set(Parser.class, parser);
    parser.parse(inputstream , handler, metadata, parseContext);
    XHTMLContentHandler xhandler=new XHTMLContentHandler(handler, metadata);
    String text = xhandler.toString();
    System.out.println("Contents of the document:" + text);

上面的代码给出了OUTPUT:

  

文件内容:

我没有在输出中获取文件的内容。

请帮忙。

0 个答案:

没有答案