我只是尝试将RethinkDB表中的所有选定字段读入内存,以便从中构建pandas DataFrame。 该表由整数主键索引,并且数据库仅运行一台计算机。 读取数据的代码是:
res = []
for doc in r.db(db_name).table(table).pluck(keys).run(conn):
res.append(doc)
return pd.DataFrame(res).set_index(pk).sort_index()
该表只有150k文档,每个文档大约有250个值,10列,一列是240个值的数组。
数据库似乎停滞不前,几分钟内没有任何事情发生,然后#34;爆发"读取发生。
出了什么问题?