修复了R中的宽度EBCDIC文件

时间:2015-02-05 16:16:53

标签: r ebcdic

我正在尝试将一些编码为EBCDIC的大型机数据读入R中,并且不知所措。我想避免使用外部程序来转换文件,因为我在企业环境中运行。

您可以找到包含ASCII和EBCDIC版本的示例文件here。请注意,文件的EBCDIC版本中没有换行符 - 相反,我会手动指定每行的宽度。 R在我的环境中可以使用IBM500编码,这对于这些文件应该是正确的。

但是,当我运行以下命令时,R似乎完全失败。

layout <- read.fwf("EBCDIC_LAYOUT", widths = c(80), fileEncoding='ibm500')
data   <- read.fwf("EBCDIC_ZIPCODE", widths = c(32), fileEncoding='ibm500')

我可以从哪里离开?

相关 - 我希望使用的一些文件相当大(1 GB左右)。最好是,我想要一个可以很好地扩展的解决方案。 (我尝试过像LaF这样的软件包,但他们没有选择编码的选项。)

非常感谢!

0 个答案:

没有答案