在python connection.execute中的COPY-FROM:csv到postgres - 没有错误但也没有数据

时间:2018-03-28 19:39:24

标签: python postgresql csv sqlalchemy connection

我正在尝试将数据从csv加载到我的postgres数据库。我正在使用sqlalchemy(和连接/原始sql数据方法而不是ORM方法)。但是,我使用相应的字段成功创建了我的表。使用副本时没有任何反应:我没有收到错误,但我的表也是空的。

conn = eng.connect()
trans = conn.begin()

try: 
    conn.execute("""CREATE TABLE IF NOT EXISTS table_name(var1 numeric, date date, time time, datetime timestamp primary key,....);""")
    trans.commit()
except:
    trans.rollback()
    raise

try: 
    # File 1 bid
    conn.execute("""COPY table_name FROM '/home/user/csvfile.csv' 
    WITH CSV HEADER DELIMITER as ','""")
    trans.commit()
except:
    trans.rollback()
    raise

Jupyter笔记本没有报告错误消息。

我做错了什么?

此外,我真的不明白:

file = "/home/user/csvfile.csv"
  conn.execute("""COPY table_name FROM file 
        WITH CSV HEADER DELIMITER as ','""")

在“file”中产生错误。

2 个答案:

答案 0 :(得分:1)

尝试添加";"复制命令。 ...分隔符',' CSV;" : - )

答案 1 :(得分:1)

交易不可重复使用:

>>> trans = conn.begin()
2018-03-29 09:14:33,001 INFO sqlalchemy.engine.base.Engine BEGIN (implicit)
>>> trans.commit()
2018-03-29 09:14:35,449 INFO sqlalchemy.engine.base.Engine COMMIT
>>> trans.commit()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/u/sqlalchemy/lib/sqlalchemy/engine/base.py", line 1642, in commit
    raise exc.InvalidRequestError("This transaction is inactive")
sqlalchemy.exc.InvalidRequestError: This transaction is inactive
>>> trans.rollback()
>>> 

您必须在第一个事务之后开始新事务,或者在同一事务中执行所有操作。

另一方面,这并不能解释为什么COPY失败。在前一个显式事务结束后,连接将回退到autocommit。换句话说,如果没有正在进行的事务,则引擎或连接提交。但这里有一个问题:自动提交是基于检测数据更改操作,由matching the given statement针对

完成
AUTOCOMMIT_REGEXP = re.compile(
    r'\s*(?:UPDATE|INSERT|CREATE|DELETE|DROP|ALTER|GRANT|REVOKE|'
    'IMPORT FOREIGN SCHEMA|REFRESH MATERIALIZED VIEW|TRUNCATE)',
    re.I | re.UNICODE)

正如您可能注意到的那样,COPY不是该正则表达式的一部分。如前所述,您最好的选择是启动另一个显式事务,或者在同一事务中执行这两个操作。但是如果您希望将来使用COPO使用自动提交,请指示SQLAlchemy它应该自动提交:

conn.execute(text("COPY ...").execution_options(autocommit=True))

对于后一个错误,FROM file不会神奇地访问Python变量,并且是语法错误。将文件名作为参数传递给查询:

copy_stmt = text("COPY table_name FROM :file WITH CSV HEADER")
copy_stmt = copy_stmt.execution_options(autocommit=True)
conn.execute(copy_stmt, {"file": file})

请注意,COPY from a file需要可能不应具有的权限:

  

COPY命名文件或命令只允许数据库超级用户使用,因为它允许读取或写入服务器有权访问的任何文件。

解决方案是使用COPY ... FROM STDIN,但要使用you have to use a raw DB-API connection

file = "/home/user/csvfile.csv"
stmt = "COPY table_name FROM STDIN CSV HEADER"

raw_conn = eng.raw_connection()

# Uses the actual psycopg2 connection as a context manager
# for transaction handling.
with open(file) as f, \
        raw_conn.connection, \
        raw_conn.cursor() as cur:
    cur.copy_expert(stmt, f)

raw_conn.close()