Source.fromResource()在本地工作,但在服务器上引发java.nio.charset.MalformedInputException

时间:2019-04-13 12:48:17

标签: java scala character-encoding

我正在使用以下代码读取资源:

  val source = Source.fromResource(pathWithoutSlash)
  val lines:Seq[String] = (for (l <- source.getLines() if ! l.trim.isEmpty) yield l.trim).toList

当我在本地运行该代码时,它工作正常-但在服务器上,它失败并显示:

Exception in thread "main" java.nio.charset.MalformedInputException: Input length = 1
    at java.base/java.nio.charset.CoderResult.throwException(CoderResult.java:274)
    at java.base/sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:339)
    at java.base/sun.nio.cs.StreamDecoder.read(StreamDecoder.java:178)
    at java.base/java.io.InputStreamReader.read(InputStreamReader.java:185)
    at java.base/java.io.BufferedReader.fill(BufferedReader.java:161)
    at java.base/java.io.BufferedReader.readLine(BufferedReader.java:326)
    at java.base/java.io.BufferedReader.readLine(BufferedReader.java:392)
    at scala.io.BufferedSource$BufferedLineIterator.hasNext(BufferedSource.scala:70)

我猜测是因为文件确实包含一些重音字符,例如:éclair's,并且服务器上使用的默认字符集可能与我本地使用的字符集不同。

我的问题是,如何更改服务器上的字符集,使其与本地的字符集匹配(以及如何检查本地的字符集)?

谢谢。

1 个答案:

答案 0 :(得分:4)

我假定您可以通过它看到的隐式Codec

println(implicitly[scala.io.Codec])

在您的服务器上是不同的。如果我正确理解它,它的评估结果应为scala.io.Codec.fallbackSystemCodec。只需显式传递适当的CodecfromResource方法在第二个参数列表中使用隐式Codec),例如:

val source = Source.fromResource(pathWithoutSlash)(Codec.UTF8)