未在UTF-8的指定输出编码中表示

时间:2015-08-21 08:10:41

标签: java utf-8

我有一个java程序,它用Apache POI逐行读取docx文件。我有一个单词列表,如果我在一行中匹配这个单词,我打印docx文件中的行。到目前为止,我没有问题。今天我有这样的输出:

尝试输出未在UTF-8的指定输出编码中表示的整数值0的字符。

这是什么意思?请给我一个解决方案。

谢谢。

我在我的代码中读取docx文件并打印该行。

URL url = new URL(URL.get(y));

File file = new File("E:\\demo\\myfile.docx");

org.apache.commons.io.FileUtils.copyURLToFile(url, file);

POITextExtractor extractor1 = ExtractorFactory.createExtractor(file);     

String text = extractor1.getText();

StringReader sr = new StringReader(text);

BufferedReader readme = new BufferedReader(sr);             

while ((sCurrentLine3 = readme.readLine()) != null) {

sCurrentLine3= sCurrentLine3.trim().replaceAll("\\s+","").replaceAll("\n", "").replaceAll("\r", "").replaceAll(" ", "");

sCurrentLine3 = "Z:" + sCurrentLine3;

sCurrentLine3 = sCurrentLine3.replace("/", "\\");

System.out.println(ObjectsLine.get(i) + " " + Change.get(y) + " " + sCurrentLine3); 

0 个答案:

没有答案