正如我前段时间在this问题中所述,我在从Python访问sqlite数据库时遇到了性能问题。为了再次明确这一点,使用apsw相同的代码运行速度提高了20多倍。我最近并行安装了不同版本的Python,并为此安装了新版本的apsw。这个版本运行缓慢。我使用pythons built-int sqlite3
在不同的计算机上尝试了相同的代码,并且运行速度很快(但是使用apsw很慢)。我还尝试在我的计算机上安装最新版本的pysqlite,但速度很慢。
我绝对肯定这不是架构的问题。
我现在的问题是,我该如何继续诊断错误?
答案 0 :(得分:1)
万一您可能忽略了这一点,请确保您正在使用the latest versions of both the pysqlite2 data base adapter and the sqlite3 library。链接的答案还显示了如何准确确定您使用的每个版本,以及您可能想要添加到问题中的数据。
答案 1 :(得分:0)
我可以提供类似经验的经验,但使用不同的平台,即J。
有一些缓慢,我将它指向sqlite3_get_table
功能。此函数返回每个列的指针,每个指针指向一个指针数组,其中每个指针都指向一个以空字符结尾的字符串。如果函数的结果为null,则指针也可以为null(例如,空数据集上的Max,它将返回空指针,而不是指向null的指针。我讨厌它。)J然后将地址形成为可读(形成一个大的地址矩阵,后跟0表示偏移量,-1表示长度,表示最多为第一个空值)并循环遍历每个地址,最后在预期的列和行中重新整形表格。
因此,有一个内存传输方面,以及实际读取方面,从SQLite获取数据到另一个平台。我发现J这个常常很大的数据集并不容易处理,这意味着它像所有字符串一样笨重。还有那个令人讨厌的空指针的东西。
我能够限制矩阵修改以优化功能。最后的优化是使用原始代码来读取内存地址(15!:1
),而不是正确命名的函数(memr
),因为使用memr意味着J必须解释memr
的含义每次读取内存时 。
总之,如果python允许一些修改,也许你可以调整数据库访问以更好地满足你的需求。我希望这会有所帮助,但我没有很大的希望......