我们正在努力将数据从MongoDB迁移到Teradata(DW)。
我们认为有必要对数据进行转换。
您能否帮我回答以下问题,这些问题将指导我们制定迁移解决方案:
转换可能包括从导出的文件中省略行,省略字段,跨字段的聚合(总和/计数)等。
如果开发ETL框架,Java会是一个不错的选择吗?
我们注意到'\ n'[换行符]也是一些记录的一部分。因此,在csv中,我们看到其间有一些空白。
我们需要关注正确的分界符吗?或者出口格式可以在这方面帮助我们吗?
我们在VI编辑器中收到'Line too long'消息。我们的系统中没有备用编辑器。有没有办法处理行截断?
答案 0 :(得分:0)
CSV并没有特别明确 - 在野外有几种变体,具有略微不同的转义行为。我几乎总是喜欢任何东西 - 但是 - csv。