从Talend中的重复项中识别唯一记录

时间:2015-10-04 09:22:53

标签: excel postgresql duplicates primary-key talend

http://postimg.org/image/89yglfakx/

请参阅上述链接以获取图像作为参考。

我有一个excel文件,每天都会更新,但数据总是每次都不同。 我正在使用Talend 将excel表中的数据拉入表中。我在表格中定义了主键 Company_ID 。 我面临的错误是Excel工作表没有重复的 Company_ID 值。 由于excel Excel文件每天都会更新,因此将来还会获取更多重复值,因此它在 Company_ID 字段中将具有不同的重复值。 我想为公司ID 1 选择唯一的数据记录,该记录在其余列中没有null。 对于 Company_ID 3 ,列的空值为ok,因为它是该company_id的唯一记录。 如何选择最大值为no的唯一行。列值存在,例如在 Talend 公司ID 1 的情况下? 我尝试使用 Tuniqrow ,但它唯一地从重复项中获取第一条记录,因此如果我的第一条记录从重复的公司ID中获得空值,那么它将无效。

0 个答案:

没有答案