我正在尝试将一些编码为EBCDIC的大型机数据读入R中,并且不知所措。我想避免使用外部程序来转换文件,因为我在企业环境中运行。
您可以找到包含ASCII和EBCDIC版本的示例文件here。请注意,文件的EBCDIC版本中没有换行符 - 相反,我会手动指定每行的宽度。 R在我的环境中可以使用IBM500编码,这对于这些文件应该是正确的。
但是,当我运行以下命令时,R似乎完全失败。
layout <- read.fwf("EBCDIC_LAYOUT", widths = c(80), fileEncoding='ibm500')
data <- read.fwf("EBCDIC_ZIPCODE", widths = c(32), fileEncoding='ibm500')
我可以从哪里离开?
相关 - 我希望使用的一些文件相当大(1 GB左右)。最好是,我想要一个可以很好地扩展的解决方案。 (我尝试过像LaF这样的软件包,但他们没有选择编码的选项。)
非常感谢!