在Talend中导入CSV文件 - 如何设置与Excel匹配的选项

时间:2014-05-07 21:08:53

标签: csv talend

我有一个可以在Excel 2012中打开的CSV文件,它完美无缺。当我尝试在Talend中设置此CSV文件的元数据时,字段(列)不会拆分,因为Excel将它们拆分。我怀疑我没有正确设置元数据。

具体问题是我有一个包含字符串数据的列,其中可能包含字符串中的逗号。例如,假设我有一个包含三列的CSV文件:ID,Name和Age,如下所示:

ID,Name,Age
1,Ralph,34 
2,Sue,14
3,"Smith, John", 42

当Excel读取此CSV文件时,它会将第三行的第二个元素(" Smith,John")作为单个标记查看,并将其单独放入单元格中。

在Talend中,它试图将同一个令牌分成两个,因为令牌中有一个逗号。显然Excel忽略带引号的字符串中的所有分隔符,而默认情况下Talend不会。

我的问题是如何让Talend的行为与Excel相同?

1 个答案:

答案 0 :(得分:3)

如果你使用tfileinputdelimited组件来读取这个csv文件,你可以使用delimeter作为“,”并且在这个组件的csv选项属性下你应该启用Text Enclosure“”“选项,或者即使你使用元数据也会有一个选项定义字符串/文本框 - 在这里你应该提到“”来解决你的问题