我想使用Talend创建一个将多个xls文件导入MySQL数据库的作业。 我不知道这些文件的模式(列数和名称),但我可以假设标题行对应于列名。 我的想法是为每个包含xls文件和配置文件的xls架构创建一个文件夹(描述架构和到mySQL表的映射)。 必须将所有xls文件映射到已存在的单个表。 我想知道Talend open Studio是否可行? 任何其他解决方案都非常受欢迎。
答案 0 :(得分:0)
Talend Exchange上有一个组件可供您使用。组件是针对Excel特定的,因为它不是基于固定模式(如Talend用于),而是通过逐行读取来工作,但它是基于单元格并逐个单元地读取。
我要做的是找一份工作来识别架构,并根据它生成不同的插入查询。我不会为每个模式都有工作,但对所有模式都有相同的工作。
1. First job would go cell by cell through the first row (containing the header names) and populate them into a flow. (Row:1, Column:B, Value: "FullName")
2. second part of the job would be to go through cell by cell for the values and get them in a Key-Value way (Row:3, Column:B, Value: "Peter Jackson") into another flow
3. Denormalising the second flow could give you all of the values int the same Excel row.
4. A tMap woud give you the possibility to exchange the Column B with the Fullname attribute and have a concatenation going on that would give you the insert statement.
这就是我接近它的方法。这需要大约一两个小时,但应该可行