SnapLogic Python读取和执行SQL文件

时间:2018-10-22 19:35:35

标签: python sql snaplogic snaplogic-script-snap

我有一个简单的SQL文件,我想使用SnapLogic中的Python脚本快照来读取和执行。我创建了一个表达式库文件来引用Redshift帐户,并将其作为参数包含在管道中。

我在另一则帖子中有下面的代码。有没有办法引用管道参数来连接到Redshift数据库,读取上载的SQL文件并执行命令?

fd = open('shared/PythonExecuteTest.sql', 'r')
sqlFile = fd.read()
fd.close()

sqlCommands = sqlFile.split(';')

for command in sqlCommands:
    try:
        c.execute(command)
    except OperationalError, msg:
        print "Command skipped: ", msg

1 个答案:

答案 0 :(得分:1)

您可以使用$_访问脚本中的管道参数。

比方说,您有一个管道参数executionId。然后,可以在脚本中访问$_executionId

以下是测试管道。

pipeline

具有以下管道参数。

Pipeline parameter

以下是测试数据。

test data

以下是脚本

# Import the interface required by the Script snap.
from com.snaplogic.scripting.language import ScriptHook
import java.util

class TransformScript(ScriptHook):
    def __init__(self, input, output, error, log):
        self.input = input
        self.output = output
        self.error = error
        self.log = log

    # The "execute()" method is called once when the pipeline is started
    # and allowed to process its inputs or just send data to its outputs.
    def execute(self):
        self.log.info("Executing Transform script")
        while self.input.hasNext():
            try:
                # Read the next document, wrap it in a map and write out the wrapper
                in_doc = self.input.next()
                wrapper = java.util.HashMap()
                wrapper['output'] = in_doc
                wrapper['output']['executionId'] = $_executionId

                self.output.write(in_doc, wrapper)
            except Exception as e:
                errWrapper = {
                    'errMsg' : str(e.args)
                }
                self.log.error("Error in python script")
                self.error.write(errWrapper)

        self.log.info("Finished executing the Transform script")

# The Script Snap will look for a ScriptHook object in the "hook"
# variable.  The snap will then call the hook's "execute" method.
hook = TransformScript(input, output, error, log)

输出:

output

在这里,您可以看到从管道参数中读取了executionId

注意:从脚本访问管道参数是一种有效的方案,但是从脚本访问其他外部系统很复杂(因为您需要加载所需的库),因此不建议这样做。使用SnapLogic提供的快照来访问外部系统。另外,如果您想在脚本中使用其他库,请尝试使用Javascript而不是python,因为您可以在脚本中使用很多开源CDN。

此外,您不能直接从脚本访问任何已配置的表达式库。如果您需要脚本中的某些逻辑,则可以将其保留在脚本中,而不要放在其他地方。而且,在脚本(或映射器)中访问帐户名没有任何意义,因为即使知道帐户名,也无法直接使用存储在该帐户中的凭据/配置。由SnapLogic处理。尽可能使用提供的快照和映射器。


更新#1

  • 您无法直接访问该帐户。帐户由快照内部管理和使用。您只能通过相关快照的“帐户”标签创建和设置帐户。
  • 尽可能避免使用脚本捕捉;特别是如果您可以使用普通的快照执行相同的操作。

更新#2

对此要求最简单的解决方案如下。

  • 使用文件读取器读取文件
  • 基于;
  • 拆分
  • 使用通用JDBC execute Snap执行每个SQL命令