我有一个java程序,它用Apache POI逐行读取docx文件。我有一个单词列表,如果我在一行中匹配这个单词,我打印docx文件中的行。到目前为止,我没有问题。今天我有这样的输出:
尝试输出未在UTF-8的指定输出编码中表示的整数值0的字符。
这是什么意思?请给我一个解决方案。
谢谢。
我在我的代码中读取docx文件并打印该行。
URL url = new URL(URL.get(y));
File file = new File("E:\\demo\\myfile.docx");
org.apache.commons.io.FileUtils.copyURLToFile(url, file);
POITextExtractor extractor1 = ExtractorFactory.createExtractor(file);
String text = extractor1.getText();
StringReader sr = new StringReader(text);
BufferedReader readme = new BufferedReader(sr);
while ((sCurrentLine3 = readme.readLine()) != null) {
sCurrentLine3= sCurrentLine3.trim().replaceAll("\\s+","").replaceAll("\n", "").replaceAll("\r", "").replaceAll(" ", "");
sCurrentLine3 = "Z:" + sCurrentLine3;
sCurrentLine3 = sCurrentLine3.replace("/", "\\");
System.out.println(ObjectsLine.get(i) + " " + Change.get(y) + " " + sCurrentLine3);