将EBCDIC转换为ASCII文件格式 - 用于配置单元的SerDe。如何克服EBCDIC文件中的分隔符问题

时间:2016-10-27 12:11:20

标签: hadoop hive ascii ebcdic hive-serde

在ebcdic中没有像/ n那样的东西。 ebcdic中不支持新行。 我应该如何转换它。 ebcdic中没有分隔符。所以在转换这个文件时。我怎么知道新线路来了? 建议请。

2 个答案:

答案 0 :(得分:0)

实际上有一个换行符(x'15')。普通ZOS文件不使用换行符。 ZOS是围绕Fixed-Width,VB,VSAM等文件构建的。

选项包括:

  1. 如果是文本文件(不太可能),当文件从大型机传输时,将文件转换为ascii。
  2. 将文件转换为主机上的文本,并在转移大型机时进行转换。
  3. 使用商业包装。 Sync-Sort有 DMX-h ,还有 Datameer
  4. 如果您有Cobol字帖,请查看以下开源软件包:
  5. JRecord可以与Cobol Copybook,Plain Java Code或Xml文件描述一起使用 6。

答案 1 :(得分:0)

EBCDIC中的新行通常由回车符(十六进制0D)和换行符(十六进制25)组成。在ASCII回车中,返回也是十六进制0D,但是换行符需要转换为十六进制0A。 希望这会有所帮助。