我正在处理正在使用希腊语文本的文本处理Rscript。问题是我想在转换为数据帧并保存为磁盘时保留字符为csv或excel文件。
greece.letters <- c("Ήρθαν τα για να κερδίζεις κάθε μέρα!",
"Καλώς ήρθατε στην επόμενη τραπεζική εμπειρία",
"Τώρα, κάθε συναλλαγή με τις κάρτες της Τράπεζας Πειραιώς,
μπορεί να κρύβει","Μην αφήσετε τα τέλη κυκλοφορίας να σας τρομάξουν!")
write.csv(as.data.frame(greece.letters), newgreekfile.csv)
#
# but if you take a look everything is now unicode
#
as.data.frame(greece.letters)
<fctr>
<U+0389><U+03C1><U+03B8>a<U+03BD> ta <U+03B3><U+03B9>a <U+03BD>a <U+03BA>e<U+03C1>d<U+03AF><U+03B6>e<U+03B9><U+03C2> <U+03BA><U+03AC><U+03B8>e µ<U+03AD><U+03C1>a!
<U+039A>a<U+03BB><U+03CE><U+03C2> <U+03AE><U+03C1................and so on
保存到磁盘时是否有保留外观或强制保持编码的方法?
使用Windows 7,语言环境ES_es。 iconvlist()给了我近400个选项。
greece.letters
[1] "Ήρθaν ta γιa νa κeρdίζeις κάθe µέρa!" "Κaλώς ήρθate stην epόµeνη tρapeζική eµpeιρίa"
[3] "Τώρa, κάθe sυνaλλaγή µe tις κάρteς tης Τράpeζaς Πeιρaιώς, µpορeί νa κρύßeι" "Μην afήsete ta tέλη κυκλοfορίaς νa saς tροµάξουν!"
原始编码是:
Encoding(greece.letters)
[1] "UTF-8" "UTF-8" "UTF-8" "UTF-8"