我只有几个带有日语字符的XML文件,当我将其更改为csv时,日语字符已更改为代码点,例如<U+FA32>
一些这样的字符。
我想保持原样并将其更改为csv或excel格式。
我尝试更改语言环境,尝试更改R studio的设置。什么都没用。 xml包含大量数据,并且某些字段具有电子邮件正文,其中包含带有某些特殊字符的原始数据。
让我向您展示将xml转换为csv的代码如何:-
for(f in file)
{
doc <- xmlParse(f,useInternalNodes = TRUE , fileEncoding='UTF-8');
xL <- xmlToList(doc, fileEncoding='UTF-8');
data <- ldply(xL, data.frame, fileEncoding='UTF-8');
write.csv(data, concat(f,".csv"), row.names = FALSE, fileEncoding='UTF-8')
}
请协助解决。如果我们可以使用R以外的其他方式将其更改为csv,请提供帮助。