在java中检测给定文件的字符集编码和换行代码

时间:2014-09-04 07:09:03

标签: java character-encoding

我想获取文件编码类型和换行代码。

我正在使用Java 6.

因为我也使用了以下第三方库 但这个库不能给我100%保证的结果。

  1. jmimemagic
  2. 机器人
  3. Apache Tika
  4. 简单的魔法
  5. mime util
  6. 我还测试了以下问题的所有解决方案,但仍然没有给我保证解决方案。

    如何获取换行代码? 因为有不同的换行代码,如

    1. CRLF(Windows)
    2. LF(Unix)
    3. CR(旧Mac)
    4. 所以从上面的代码用于文件中的新行。

1 个答案:

答案 0 :(得分:0)

我找到了解决方案:

我们可以使用" nkf32.dll"使用JNA或JNI检测字符编码。

nkf32.dll是网络汉字过滤器,基本上处理字符编码及其转换

我们还可以转换为不同的换行代码。

参考:        http://www.vector.co.jp/soft/win95/util/se020949.html

还有工具" FCChecker"可以检测到:

 1. Character Encoding
 2. Line Feed code

并执行转换。

参考:http://www.vector.co.jp/soft/dl/winnt/util/se478635.html