使用R将日文字符的XML转换为CSV

时间:2018-08-14 04:11:20

标签: r xml csv scripting

我只有几个带有日语字符的XML文件,当我将其更改为csv时,日语字符已更改为代码点,例如<U+FA32>一些这样的字符。 我想保持原样并将其更改为csv或excel格式。 我尝试更改语言环境,尝试更改R studio的设置。什么都没用。 xml包含大量数据,并且某些字段具有电子邮件正文,其中包含带有某些特殊字符的原始数据。 让我向您展示将xml转换为csv的代码如何:-

for(f in file)
{
  doc <- xmlParse(f,useInternalNodes = TRUE , fileEncoding='UTF-8');
  xL <- xmlToList(doc, fileEncoding='UTF-8');
  data <- ldply(xL, data.frame, fileEncoding='UTF-8');
  write.csv(data, concat(f,".csv"), row.names = FALSE, fileEncoding='UTF-8')

}

请协助解决。如果我们可以使用R以外的其他方式将其更改为csv,请提供帮助。

0 个答案:

没有答案