Ubuntu服务器

时间:2016-07-27 07:52:04

标签: scheduled-tasks kettle gz pdi pentaho-spoon

我想为我的Ubuntu 14.04.4服务器编写两个预定作业。工作需要是顺序的。

第一个作业应该解压缩.gz文件(SQL Dump),然后导入表" myTable"进入MySQL数据库(localhost)。

第二份工作(使用Pentaho数据集成工具编写)从表格中提取数据" myTable" ,转换它并将其加载到一个新的数据库中。

我本可以使用pentaho PDI勺子完成第一项任务,但它没有提供解压缩.gz文件的任何功能。经过一些研究并得出这些帖子:

http://forums.pentaho.com/showthread.php?82566-How-to-use-the-content-of-a-tar-gz-file-in-Kettle

How to uncompress and import a .tar.gz file in kettle?

我已经收集到我应该手动编写一个作业来完成第一个任务,即解压缩.gz文件,然后导入表格" myTable"进入MySQL数据库。

我的问题是如何创建一个执行两个顺序的cron作业,即第一个作业首先完成,然后执行第二个作业。

如果有更好的替代方法,请建议。

1 个答案:

答案 0 :(得分:1)

您可以在PDI作业中使用“SHELL”步骤。在shell步骤中编码代码的解压缩部分,然后依次进行转换。示例图像如下所示:

enter image description here

现在,您可以在CRON或任何其他计划程序中安排此完整作业。不需要单独的脚本。

注意:这仅适用于linux环境。我假设你正在使用它。

希望这会有所帮助:)