Question

我正在开发一个简单的python模块，它从tsv文件中读取数据并将它们加载到Cassandra键空间表中。

我从查看Datastax给出的示例开始，一切似乎都没问题，所以在那时我开始编码。

程序正确读取tsv文件中的数据，将它们转换为行列表，并验证每行的每个元素都具有正确的目标列类型。但当我尝试将原始数据插入表格时，终端说：

AttributeError：'float'对象没有属性'encode'

这是代码：

#Upload data to Cassandra DB (cassandra_df is a Pandas dataframe)
session.set_keyspace(data_ks)
cassandra_df_list = cassandra_df.values.tolist()

query = "INSERT INTO table_str (rowid,a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,aa,ab,ac,ad,ae,af,ag,ah,ai,aj,ak,al,am,an,ao,ap,aq,ar,as,at,au,av,aw,ax,ay,az,ba,bb,bc,bd) VALUES (uuid(),?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?)"
prepared = session.prepare(query)

for row in cassandra_df_list:

    prepared.bind(row)
    session.execute(prepared)

cluster.shutdown()

为了解决这个问题，我做了很多改动，但是我得到了新的问题，或者用'int'代替'float'。我也在这里阅读其他问题，并尝试在prepared.bind（）中使用str（row）和repr（row），但我还有其他错误。

我是Python新手，我无法找到其他解决方案，你会做什么？

提前致谢！

修改对不起，我忘了提供有关数据库表的详细信息。这是创建声明：

CREATE TABLE prova.table_str (
rowid uuid PRIMARY KEY,
a text,
aa text,
ab text,
ac text,
ad text,
ae text,
af text,
ag text,
ah text,
ai text,
aj double,
ak double,
al double,
am text,
an double,
ao double,
ap double,
aq double,
ar double,
as double,
at double,
au double,
av double,
aw double,
ax double,
ay double,
az double,
b text,
ba double,
bb text,
bc text,
bd text,
c text,
d text,
e int,
f text,
g text,
h text,
i text,
j text,
k double,
l int,
m text,
n double,
o int,
p int,
q text,
r text,
s text,
t text,
u text,
v int,
w text,
x text,
y text,
z text

）

Answer 1

您没有共享您的架构或堆栈跟踪，但我猜测数据框有数字类型，而您的Cassandra表有一堆字符串列。我将概述三种可能的解决方案：

1。）使表格类型与您的数据匹配，以便绑定编码有效。

2。）将参数转换为与架构相同的类型。例如，如果它们都是字符串：

prepared.bind(str(c) for c in row)

3。）使用简单的陈述而不是准备。在这种情况下，您将?绑定标记替换为%s，并让驱动程序使用参数的字符串插值。

query = "INSERT INTO table_str (rowid,a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,aa,ab,ac,ad,ae,af,ag,ah,ai,aj,ak,al,am,an,ao,ap,aq,ar,as,at,au,av,aw,ax,ay,az,ba,bb,bc,bd) VALUES (uuid(),%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"
for row in cassandra_df_list:
    session.execute(query, row)

Python Cassandra驱动程序：插入期间的编码问题

1 个答案: