我正在使用read_sql_query函数将SQL(Postgres)数据收集到一个数据框中。一些SQL数据列是数组类型的数据:character changes []。
我注意到性能很差,有什么方法可以提高性能?例如,预先指定数据类型?
q = """select a, b, c from table;"""
df = pd.read_sql_query(q,con=conn)
其中b是character varying[]
Pandas将列分配为数据类型“对象”:
df.b.dtype
dtype('O')