导出为CSV编码问题

时间:2012-04-20 08:50:41

标签: java gwt encoding jboss export

我有一个listgrid,其中所有项目都使用变音符号正确显示,因为它们在本地和jboss服务器上都在db中。

但是,在jboss服务器上,当我尝试导出为csv时,所有的变音符号字符都被替换,所以我得到的东西就像¿~coala而不是Şcoala,尽管变音符号在listgrid中正确显示。

本地工作正常,无论是在listgrid中显示还是导出。

这是我的导出代码:

private void Export() {
  String exportAs = (String) m_ExportForm.getField("exportType").getValue();  
  FormItem item = m_ExportForm.getField("showInWindow");  
  boolean showInWindow =  item.getValue() == null ? false : (Boolean) item.getValue();  

  // exportAs is either XML or CSV, which we can do with requestProperties
  Map<String,String> params= new java.util.HashMap<String, String>();
  params.put("Accept-Charset","utf-8");

  DSRequest dsRequestProperties = new DSRequest();
  dsRequestProperties.setHttpHeaders(params);
  dsRequestProperties.setExportValueFields(true);
  dsRequestProperties.setExportAs((ExportFormat)EnumUtil.getEnum(ExportFormat.values(), exportAs));  
  dsRequestProperties.setExportDisplay(showInWindow ? ExportDisplay.WINDOW : ExportDisplay.DOWNLOAD);

  // TODO: move in user-config
  dsRequestProperties.setExportTitleSeparatorChar("_");
  dsRequestProperties.setExportDelimiter(";");

  dsRequestProperties.setExportFilename("export." + extensionsValueMap.get(exportAs));
  dsRequestProperties.setContentType("text/csv; charset=UTF-8");
  m_Target.Export(dsRequestProperties);

  Close();
}

另外,在我的jboss 7属性文件中,我有这个:

<system-properties>
  <property name="org.apache.catalina.connector.URI_ENCODING" value="UTF-8"/>
  <property name="org.apache.catalina.connector.USE_BODY_ENCODING_FOR_QUERY_STRING" value="true"/>
</system-properties>

作为listgrids正常显示变音符号。

另外,在我的web.xml中,我有我的servlet

<init-param>
  <param-name>encoding</param-name>
  <param-value>UTF-8</param-value>
</init-param>

也许我走错了路,这是由其他原因造成的。

本地导出的文件和从jboss服务器导出的文件都具有确切的文件大小。

另外,对于我的Jboss jvm,我为java_opts设置了属性

-Dfile.encoding=UTF-8

编辑:由于建议而添加了参数图。仍然没有。

3 个答案:

答案 0 :(得分:2)

听起来这是一个字符编码/解码问题。

您的代码生成了UTF-8编码的CSV文件。但是,您使用什么程序读取 CSV? Windows记事本?如果它是Windows应用程序,则可能假设文本文件采用ISO-8859-1编码。

选项1:

告诉记事本或您的Windows应用程序编码。使用记事本,“文件/打开”对话框中有一个编码下拉列表。将其切换为UTF-8。

选项2:

将源代码中的编码从UTF-8更改为ISO-8859-1,这与Windows的默认编码相匹配。更改行:

dsRequestProperties.setContentType("application/csv; charset=UTF-8");

dsRequestProperties.setContentType("application/csv; charset=ISO-8859-1");

希望能够做到这一点。 org.apache.catalina.connector.URI_ENCODING设置不会影响文件编码,应保持原样。

答案 1 :(得分:1)

我必须承认,在这个星座中我没有看到charset=...。 但是charset对文本更有意义,所以先试试:

dsRequestProperties.setContentType("text/csv; charset=UTF-8");

可能表示二进制数据的原因application会使字符集字节编码变得危险。


已添加:我对错误的解释

也许字符串asExport得到了UTF-8但是给出了一个多字节字符而不是两个字符。那些也在非ASCII范围内,并且您的响应在某种程度上想要提供ISO-8859-1(默认的latin-1),并写入??这是2个错误。

您可以检查asExport。尽管charset = UTF-8 ...

,为什么用UTF-8写成功不成功

答案 2 :(得分:1)

您的JBoss设置中可能还有一些其他FilterServlet干扰了编码。可能与身份验证或压缩有关。