标签: excel schema transformation talend
我的数据包括600万行。没有文件扩展名。想要通过添加“ UPC”列将其导出到csv,该列是4个字段的组合。 输入格式:
the raw file
所需的CSV格式的输出格式
transformed raw file
UPC = SY + GE + VEND + ITEM
使用Excel打开了它,但是因为它有超过600万行,所以它被截断为100万行。 由于没有定界符,我对talend的架构存在疑问。
答案 0 :(得分:0)
首先,手动创建元数据列(如果导入文件,因为它是一个巨大的文件,挂起时挂掉)。因此,在元数据中创建列名称(验证第一个快照)。完成后,将元数据作为tFileInputDelimited拖动,并确保将定界符作为空格提供(验证第二张快照)。在tmap中,创建新端口,并根据需要对列进行SY + GE + VEND + ITEM,并将其传递到tFileOutputDelimited,在其中应将分隔符提供为,。如果您遇到任何问题,请告诉我。
谢谢