顾名思义,我正在寻找一些工具,将现有数据从hadoop序列文件转换为json格式。 我最初的谷歌搜索只显示了与jaql相关的结果,我迫切想要开始工作。
Apache是否有任何工具可用于此目的?
注意: 我已经将hadoop序列文件放在我的本地机器上,并希望以相应的json格式获取数据。
因此,我正在寻找一些工具/实用工具,它将把hadoop序列文件作为输入并以json格式生成输出。
由于
答案 0 :(得分:0)
Apache Hadoop可能是读取序列文件的好工具。
但是,除了开玩笑之外,为什么不编写最简单的Mapper java程序,使用Jackson来序列化它看到的每个键和值对?这将是一个非常容易编写的程序。答案 1 :(得分:0)
我认为必须有一些工具可以做到这一点,因为它有这样的共同要求。是的,它应该很容易编码,但如果你已经拥有了同样的东西,为什么要这样做呢。 无论如何,我想通过jaql做到这一点。样本工作查询对我有用,
read({type:'hdfs',location:'some_hdfs_file',inoptions:{converter:'com.ibm.jaql.io.hadoop.converter.FromJsonTextConverter'}});