嗨,我正在尝试使用胶水作业将AWS Redshift中的表查询到熊猫数据框。我正在使用pg8000进行连接(因为aws胶不支持sqlalchemy)。
当我使用熊猫的read_sql或read_sql_query函数查询表时,我在数据帧中得到了额外的字符,我猜这是pg8000 dbapi的问题
conn = pg8000.connect(user = 'postgres', password = '*****', host =127.0.0.1, port = 5439, database = 'lifungdb')
cursor = conn.cursor()
df=pd.read_sql("select * from Customer",conn)
print(df)
print(df)返回的列中包含exta char b。如何剥离多余的字符
b'id' b'Name' b'Address' b'Contact
1 Sam Texas na
答案 0 :(得分:0)
使用list-comprehension
解码utf-8
字符串:
import pandas as pd
a = [['1', 'sam', 'Texas', 'na']]
df = pd.DataFrame(a, columns=[b'id', b'Name', b'Address', b'Contact'])
df.columns = [x.decode('utf-8') for x in df.columns]
print(df)
输出:
id Name Address Contact
0 1 sam Texas na