我正在尝试使用pygrametl,尝试将数据从数据库(源)中的一个表中获取到目标数据库中的另一个表中。
源表具有以下架构:
CREATE TABLE `sdata` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`fname` varchar(255) DEFAULT NULL,
`descr` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT=' ';
目标表使用以下架构:
CREATE TABLE `dtable` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`dname` varchar(255) DEFAULT NULL,
`ddescr` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
在python中我有以下代码:
import pygrametl
from pygrametl.datasources import SQLSource, CSVSource
from pygrametl.tables import Dimension, FactTable, SlowlyChangingDimension
import pymysql
sourceDatabase = pymysql.connect(host='localhost', user='root', password='pass', database='source')
destDatabase = pymysql.connect(host='localhost', user='root', password='pass', database='dest')
dw_conn_wrapper = pygrametl.ConnectionWrapper(connection=destDatabase)
sql = "SELECT fname, descr from sdata"
name_mapping = 'fname', 'descr'
source = SQLSource(connection=sourceDatabase, query=sql, names=name_mapping)
destDimension = Dimension(
name='dtable',
key='id',
attributes=['dname', 'ddescr'])
for row in source:
print(row)
destDimension.insert(row)
dw_conn_wrapper.commit()
dw_conn_wrapper.close()
sourceDatabase.close()
我得到的错误如下:
回溯(最近一次调用最后一次):文件“。\ testex.py”,第35行,中 sourceDimension.insert(row)文件“Python \ Python36-32 \ lib \ site-packages \ pygrametl \ tables.py”,第357行, 在插入 self.targetconnection.execute(self.insertsql,row,namemapping)文件“Python \ Python36-32 \ lib \ site-packages \ pygrametl__init __。py”, 第663行,执行中 self .__ cursor.execute(stmt,arguments)文件“Python \ Python36-32 \ lib \ site-packages \ pymysql \ cursors.py”,第164行, 执行中 query = self.mogrify(query,args)文件“Python \ Python36-32 \ lib \ site-packages \ pymysql \ cursors.py”,第143行, 在mogrify query = query%self._escape_args(args,conn)KeyError:'dname'
答案 0 :(得分:1)
您的属性应该位于查询产生的数据中。你使用:
name_mapping = 'dname', 'ddescr'
attributes=['dname', 'ddescr'])
或:
name_mapping = 'fname', 'descr'
attributes=['fname', 'descr'])