使用Pentaho和Python插件,我有一个传入的CSV,它有两个字段Month
和Year
,我需要创建一个Date
。 Month
包含完整的月份名称,例如“1月”,“2月”等。
为此,我创建pandas
脚本(“创建日期”),然后添加Day
字段并设置为1,然后从Month
获取月份数字,然后创建{ {1}}字段并从date_tw
,Year
,Month
创建日期时间。
Day
输出所有字段,新create date
字段输出为date_tw
类型。
python脚本的一个字段输出:
Date
创建一个表格,Data Output
为date_tw
类型。
到目前为止,我们已经:来自python的新创建的Date
,它被提供给date_tw
,该Data Output
已经创建了date_tw
的表,同时也是{ {1}}类型。两者都是Date
类型。
然而我收到了这个错误:
date_tw日期:存在数据类型错误:java.lang.String对象[06/01/2017]的数据类型与值meta [Date]
不对应
看起来我应该在CSV文件输入步骤turn off "Lazy Conversion"。这也做了。
Pentaho的Pandas脚本:
Date
Postgresql表格字段:
数据类型匹配且延迟转换已关闭。我错过了什么?
答案 0 :(得分:0)
Pentaho元数据包含Date类型的每个对象的日期格式。 date_tw
接缝的Python script
格式为dd / mm / yyyy。
您可以右键点击Python script
查看任何字段的类型和格式,然后选择Output fields...
。检查它是否是dd / mm / yyyy而不是你的语言环境。
如果不是,并且Python script
不允许您指定日期格式,请使用最后一行的strftime进行操作。