人人不承认德国变形金刚

时间:2017-07-12 13:48:20

标签: java r renjin

我有一个广泛使用德国变音符号的文件。我编写了一个脚本来处理文件,该文件在原生R(RStudio)中应该正常工作。不幸的是,在使用Renjin时,所有元音变音都设置为文件字符串中的未知字符。由于文件结构的原因,我使用readLines-command来读取文件。在这种情况下,read.table()命令不是一个合适的解决方案。

我想使用Renjin,因为我在Java团队工作,在Renjin的帮助下,我可以保留我们的工作环境,当然这是基于Java的。

Java正确识别变音符号(使用正确的文件编码)。我还检查过Renjin是否正确打印了变音符号,但它没有。我已经尝试将Renjin中的R语言环境设置为“German_Germany.1252”。因此我使用了以下R命令:

engine.eval("Sys.setlocale(category = 'LC_ALL', locale = 'German_Germany.1252')")

然后正确设置本地。然而,人人根本不承认变形金刚。我在打印文件的一行时检查了它,但是直接传递给Renjin的一个字符(使用:engine.eval("print('äöß')"))。

你知道如何解决这个问题吗?如果没有,我应该在github上打开一个问题吗?

1 个答案:

答案 0 :(得分:1)

我怀疑Renjin尊重非unicode字符集是一个问题。

默认情况下,Renjin在任何地方都使用Unicode,而UTF-8则用于读取和写入流。

如果这不可能,请使用小的测试文件和脚本在GitHub上打开一个问题。