我创建了一个具有类似于以下内容的表:
create table some_table (
id serial,
numbers int []
);
我想以一种有效的方式复制熊猫数据框,所以我不想使用慢速的to_sql
方法,因此,在https://stackoverflow.com/a/41876462/754176和https://stackoverflow.com/a/29125940/754176之后,我尝试了以下方法:
import pandas as pd
import psycopg2
# Create the connection, and the cursor (ommited)
# Function from the second link
def lst2pgarr(alist):
return '{' + ','.join(alist) + '}'
df = pd.DataFrame({'numbers': [[1,2,3], [4,5,6], [7,8,9]]})
df['numbers'] = df.numbers.apply(lambda x: lst2pgarr([str(y) for y in x]))
import io
f = io.StringIO()
df.to_csv(f, index=False, header=False, sep="|")
f.seek(0)
cursor.copy_from(f, 'some_table', columns=["numbers"], sep='|')
cursor.close()
此代码不会引发错误,但是不会向表中写入任何内容。
所以,我将代码修改为
import csv
df = pd.DataFrame({'numbers': [[1,2,3], [4,5,6], [7,8,9]]})
df['numbers'] = df.numbers.apply(lambda x: lst2pgarr([str(y) for y in x]))
f = io.StringIO()
df.to_csv(f, index=False, header=False, sep="|", quoting=csv.QUOTE_ALL, quotechar="'"))
f.seek(0)
cursor.copy_from(f, 'some_table', columns=["numbers"], sep='|')
cursor.close()
此代码引发以下错误:
---------------------------------------------------------------------------
DataError Traceback (most recent call last)
<ipython-input-40-3c58c4a64abc> in <module>
----> 1 cursor.copy_from(f, 'some_table', columns=["numbers"], sep='|')
DataError: malformed array literal: "'{1,2,3}'"
DETAIL: Array value must start with "{" or dimension information.
CONTEXT: COPY some_table, line 1, column numbers: "'{1,2,3}'"
我该怎么办?
另外,很有趣的是,为什么第一个代码不会引发错误。
答案 0 :(得分:3)
此代码不会引发错误,但是不会向表中写入任何内容。
如果您提交事务,代码将运行良好:
cursor.close()
connection.commit()