csv文件包含多个表,它可能如下所示:
"Table 1"
,
"id","visits","downloads","emailsent"
1, 4324, 23, 2
2, 664, 42, 1
3, 73, 44, 0
4, 914, 8, 0
...
"Table 2"
,
"id_of_2nd_tab","visits_of_2nd_tab","downloads_of_2nd_tab"
1, 524, 3
2, 564, 52
3, 63, 84
4, 814, 8
...
将这些表导入Talend的最佳方法是什么?
答案 0 :(得分:1)
通常,这种多记录格式的CSV格式要解析起来比较复杂。
问题:表格数量是否有限? 问题:每个表都有固定的数字和列顺序吗? 问题:"表"之间的分隔符是什么?在CSV中?
我相信你需要采取多遍方法。你可以这样做。
传递#1 - 使用tFileInputDelimited 使用行分隔符,例如"表",无字段分隔符,抓取1大字段 或者,您可以在此阶段将第一个文件拆分为单独的文件。
在行分隔符" \ r \ n"上传递#2 - 分割行(来自传递#1的结果)等等 将其拆分为多行但只有一列。
传递#3 - 提取分隔字段(来自传递#2的结果) 基于字段分隔符提取 认识一个"表"行 识别"标题行 标题
中每个表/字段集的附加处理答案 1 :(得分:0)
使用a tFileInputExcel组件读取每个工作表。然后,您可以使用tMap将工作表连接到目标列布局,假设您希望对连接的列集进行一些处理。