PostgreSQL序列化插入交织序列号

时间:2018-09-20 19:59:53

标签: postgresql

我使用SERIALIZED隔离级别将多个进程插入到Postgres(10.3)表中。

我们系统的另一部分需要读取这些记录,并确保它按顺序接收所有记录。例如,在下面的图片中,消费者需要

select * from table where sequanceNum > 2309 limit 5

,然后接收序列号2310、2311、2312、2313和2314。

读取查询正在使用READCOMMITTED隔离级别。

虽然我看到的是阅读查询仅接收到我以黄色突出显示的行。看着xmin,我猜测事务334250已经开始但尚未完成,然后事务334251、334252等在我的阅读查询开始之前就已经开始和完成。

我的问题是,它们如何获得与334250交错的序列号?为什么这些交易没有被所有序列化的书面交易的优点所阻止?

关于如何实现自我追求的任何建议?那是什么保证不同事务不会生成交织序列号? (如果有间隙,可以。...但是它们不能交错)。

非常感谢您的帮助。我要为此失去头发!

PS-我刚刚注意到334250的xmax不为零。这也许是我缺少的线索吗?

enter image description here

1 个答案:

答案 0 :(得分:2)

SQL标准通常简洁地将SERIALIZABLE定义为:

  

保证在隔离级别SERIALIZABLE上执行并发SQL事务是可序列化的。   可序列化的执行被定义为同时执行SQL事务的操作的执行   与那些相同的SQL事务的某些串行执行产生相同的效果。串行执行   是每个SQL事务在下一个SQL事务开始之前执行完成的程序。

根据此定义,我了解您希望序列号与“产生相同效果”的“串行执行”的顺序相同。

不幸的是,在事务开始时还不清楚等效的串行顺序,因为事务中稍后的语句可以确定事务的“逻辑”顺序。

另一方面,序列号是根据请求该序列号的挂墙时间排序的。

从某种意义上说,您将需要由在事务提交之前不确定的东西确定的序列号,这在术语上是矛盾的。

因此,我认为不可能获得想要的东西,除非您实际序列化执行,例如通过在插入数据之前将表锁定为SHARE ROW EXCLUSIVE模式。

我的问题是为什么。我想不出很好的理由。