在scala中以UTF-8读取xml

时间:2011-09-25 13:29:55

标签: xml scala encoding

我正在尝试使用以下代码将文件读取到xml:

import scala.xml._

object HebrewToEnglishCityTranslator {

  val data = XML.loadFile("cities_hebrew_utf.xml");

  for(val entry <- data \\ "city") {
    val hebrewName = (entry \\ "hebrew_name").text
    val englishName = (entry \\ "english_name").text
    println(hebrewName + "=" + englishName)   }

但是,我的文件采用UTF-8(希伯来语字符)编码,XML编码为val encoding = "ISO-8859-1"

我该怎么办?

2 个答案:

答案 0 :(得分:13)

您应该使用XML.load(reader: java.io.Reader),它允许您指定文件编码:


XML.load(new java.io.InputStreamReader(new java.io.FileInputStream("cities_hebrew_utf.xml"), "UTF-8")) 

答案 1 :(得分:3)

使用InputStream构造函数而不是String构造函数。在这里阅读Stream与Reader xml的好解释:Producing valid XML with Java and UTF-8 encoding