汉字乱码一行

时间:2017-10-06 14:03:11

标签: java encoding character-encoding

我在一个表中有6列,其中一列包含中文字符,我在该表中有200条记录。

我已编写代码将其保存为一个文本文件。问题是在获取所有记录时,我能够在文件中看到中文文本。但是,只读取一条记录,我看到中文文本是乱码。

我正在使用以下代码。

public static void main(String args[]){
String outputFile = fileNameEncode("C:\\a\a.txt");
FileOutputStream os = new FileOutputStream(outputFile);
writeToFile(os);
}

private static String fileNameEncode(String name) {
        String file;
        try {
            byte[] utf_byte = name.getBytes("UTF-8");
            StringBuilder sb = new StringBuilder(1024);

            for (byte b : utf_byte) {
                int integer = b & 0xFF; // drop the minus sign
                sb.append((char) integer);
            }
            file = sb.toString();
        } catch (Exception e) {
            file = name;
        }
        return file;
    }

    public void writeToFile(FileOutputStream os) {
    PrintWriter pw = new PrintWriter(new BufferedWriter(new OutputStreamWriter(ostream, "GBK")));

        for (int rowNum = 0; rowNum < arrayList.size(); rowNum++) {//arrayList contains data from db
                ArrayList list = arrayList.get(rowNum);

                    for(int k = 0; k < list.size(); k++{
                    String[] data = new String[6];
                        for (int colNum = 0; colNum < 6; colNum++) {
                            data[colNum] = list.get(i).toString();
                        }

                        String outLine = composeLine(data, ctlInfo);                    

                        // write the line
                        pw.print(outLine);
                        pw.println();

            }
            }

}
    private static String composeLine(String[] data, ControlInfo ctl) {
        StringBuilder line = new StringBuilder();
        String delim = ","
        int elemCount = data.length;
        for (int i = 0; i < elemCount; i++) {
            if (i > 0)
                line.append(delim);
           if (data[i] != null && (data[i].contains("\n") || data[i].contains("\r") ||
                    data[i].contains("\r\n"))){
                data[i] = data[i].replaceAll("(\\t|\\r?\\n)+", " ");
            }
            else {
                line.append(data[i]);
            }
        }

        return line.toString();
    }
你可以告诉我我错在哪里吗?

1 个答案:

答案 0 :(得分:0)

我发现了问题,代码很好,问题出在记事本++中。如果节点pad ++中的字符集是中文(GB2312),那么我能够看到正确的文本。记事本++自动设置为GB2312两行,但对于一行,它不会自动设置为GB2312。