Python Cassandra驱动程序:插入期间的编码问题

时间:2018-02-23 14:17:44

标签: python cassandra datastax datastax-python-driver

我正在开发一个简单的python模块,它从tsv文件中读取数据并将它们加载到Cassandra键空间表中。

我从查看Datastax给出的示例开始,一切似乎都没问题,所以在那时我开始编码。

程序正确读取tsv文件中的数据,将它们转换为行列表,并验证每行的每个元素都具有正确的目标列类型。但当我尝试将原始数据插入表格时,终端说:

  

AttributeError:'float'对象没有属性'encode'

这是代码:

#Upload data to Cassandra DB (cassandra_df is a Pandas dataframe)
session.set_keyspace(data_ks)
cassandra_df_list = cassandra_df.values.tolist()

query = "INSERT INTO table_str (rowid,a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,aa,ab,ac,ad,ae,af,ag,ah,ai,aj,ak,al,am,an,ao,ap,aq,ar,as,at,au,av,aw,ax,ay,az,ba,bb,bc,bd) VALUES (uuid(),?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?)"
prepared = session.prepare(query)

for row in cassandra_df_list:

    prepared.bind(row)
    session.execute(prepared)

cluster.shutdown()
为了解决这个问题,我做了很多改动,但是我得到了新的问题,或者用'int'代替'float'。我也在这里阅读其他问题,并尝试在prepared.bind()中使用str(row)和repr(row),但我还有其他错误。

我是Python新手,我无法找到其他解决方案,你会做什么?

提前致谢!

修改 对不起,我忘了提供有关数据库表的详细信息。这是创建声明:

CREATE TABLE prova.table_str (
rowid uuid PRIMARY KEY,
a text,
aa text,
ab text,
ac text,
ad text,
ae text,
af text,
ag text,
ah text,
ai text,
aj double,
ak double,
al double,
am text,
an double,
ao double,
ap double,
aq double,
ar double,
as double,
at double,
au double,
av double,
aw double,
ax double,
ay double,
az double,
b text,
ba double,
bb text,
bc text,
bd text,
c text,
d text,
e int,
f text,
g text,
h text,
i text,
j text,
k double,
l int,
m text,
n double,
o int,
p int,
q text,
r text,
s text,
t text,
u text,
v int,
w text,
x text,
y text,
z text

1 个答案:

答案 0 :(得分:0)

您没有共享您的架构或堆栈跟踪,但我猜测数据框有数字类型,而您的Cassandra表有一堆字符串列。我将概述三种可能的解决方案:

1。)使表格类型与您的数据匹配,以便绑定编码有效。

2。)将参数转换为与架构相同的类型。例如,如果它们都是字符串:

prepared.bind(str(c) for c in row)

3。)使用简单的陈述而不是准备。在这种情况下,您将?绑定标记替换为%s,并让驱动程序使用参数的字符串插值。

query = "INSERT INTO table_str (rowid,a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,aa,ab,ac,ad,ae,af,ag,ah,ai,aj,ak,al,am,an,ao,ap,aq,ar,as,at,au,av,aw,ax,ay,az,ba,bb,bc,bd) VALUES (uuid(),%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"
for row in cassandra_df_list:
    session.execute(query, row)