我正在尝试将数据从csv加载到我的postgres数据库。我正在使用sqlalchemy(和连接/原始sql数据方法而不是ORM方法)。但是,我使用相应的字段成功创建了我的表。使用副本时没有任何反应:我没有收到错误,但我的表也是空的。
conn = eng.connect()
trans = conn.begin()
try:
conn.execute("""CREATE TABLE IF NOT EXISTS table_name(var1 numeric, date date, time time, datetime timestamp primary key,....);""")
trans.commit()
except:
trans.rollback()
raise
try:
# File 1 bid
conn.execute("""COPY table_name FROM '/home/user/csvfile.csv'
WITH CSV HEADER DELIMITER as ','""")
trans.commit()
except:
trans.rollback()
raise
Jupyter笔记本没有报告错误消息。
我做错了什么?
此外,我真的不明白:
file = "/home/user/csvfile.csv"
conn.execute("""COPY table_name FROM file
WITH CSV HEADER DELIMITER as ','""")
在“file”中产生错误。
答案 0 :(得分:1)
尝试添加";"复制命令。 ...分隔符',' CSV;" : - )
答案 1 :(得分:1)
交易不可重复使用:
>>> trans = conn.begin()
2018-03-29 09:14:33,001 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
>>> trans.commit()
2018-03-29 09:14:35,449 INFO sqlalchemy.engine.base.Engine COMMIT
>>> trans.commit()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/home/u/sqlalchemy/lib/sqlalchemy/engine/base.py", line 1642, in commit
raise exc.InvalidRequestError("This transaction is inactive")
sqlalchemy.exc.InvalidRequestError: This transaction is inactive
>>> trans.rollback()
>>>
您必须在第一个事务之后开始新事务,或者在同一事务中执行所有操作。
另一方面,这并不能解释为什么COPY失败。在前一个显式事务结束后,连接将回退到autocommit。换句话说,如果没有正在进行的事务,则引擎或连接提交。但这里有一个问题:自动提交是基于检测数据更改操作,由matching the given statement针对
完成AUTOCOMMIT_REGEXP = re.compile(
r'\s*(?:UPDATE|INSERT|CREATE|DELETE|DROP|ALTER|GRANT|REVOKE|'
'IMPORT FOREIGN SCHEMA|REFRESH MATERIALIZED VIEW|TRUNCATE)',
re.I | re.UNICODE)
正如您可能注意到的那样,COPY不是该正则表达式的一部分。如前所述,您最好的选择是启动另一个显式事务,或者在同一事务中执行这两个操作。但是如果您希望将来使用COPO使用自动提交,请指示SQLAlchemy它应该自动提交:
conn.execute(text("COPY ...").execution_options(autocommit=True))
对于后一个错误,FROM file
不会神奇地访问Python变量,并且是语法错误。将文件名作为参数传递给查询:
copy_stmt = text("COPY table_name FROM :file WITH CSV HEADER")
copy_stmt = copy_stmt.execution_options(autocommit=True)
conn.execute(copy_stmt, {"file": file})
请注意,COPY from a file需要可能不应具有的权限:
COPY命名文件或命令只允许数据库超级用户使用,因为它允许读取或写入服务器有权访问的任何文件。
解决方案是使用COPY ... FROM STDIN
,但要使用you have to use a raw DB-API connection:
file = "/home/user/csvfile.csv"
stmt = "COPY table_name FROM STDIN CSV HEADER"
raw_conn = eng.raw_connection()
# Uses the actual psycopg2 connection as a context manager
# for transaction handling.
with open(file) as f, \
raw_conn.connection, \
raw_conn.cursor() as cur:
cur.copy_expert(stmt, f)
raw_conn.close()