我使用SERIALIZED隔离级别将多个进程插入到Postgres(10.3)表中。
我们系统的另一部分需要读取这些记录,并确保它按顺序接收所有记录。例如,在下面的图片中,消费者需要
select * from table where sequanceNum > 2309 limit 5
,然后接收序列号2310、2311、2312、2313和2314。
读取查询正在使用READCOMMITTED隔离级别。
虽然我看到的是阅读查询仅接收到我以黄色突出显示的行。看着xmin,我猜测事务334250已经开始但尚未完成,然后事务334251、334252等在我的阅读查询开始之前就已经开始和完成。
我的问题是,它们如何获得与334250交错的序列号?为什么这些交易没有被所有序列化的书面交易的优点所阻止?
关于如何实现自我追求的任何建议?那是什么保证不同事务不会生成交织序列号? (如果有间隙,可以。...但是它们不能交错)。
非常感谢您的帮助。我要为此失去头发!
PS-我刚刚注意到334250的xmax不为零。这也许是我缺少的线索吗?
答案 0 :(得分:2)
SQL标准通常简洁地将SERIALIZABLE
定义为:
保证在隔离级别
SERIALIZABLE
上执行并发SQL事务是可序列化的。 可序列化的执行被定义为同时执行SQL事务的操作的执行 与那些相同的SQL事务的某些串行执行产生相同的效果。串行执行 是每个SQL事务在下一个SQL事务开始之前执行完成的程序。
根据此定义,我了解您希望序列号与“产生相同效果”的“串行执行”的顺序相同。
不幸的是,在事务开始时还不清楚等效的串行顺序,因为事务中稍后的语句可以确定事务的“逻辑”顺序。
另一方面,序列号是根据请求该序列号的挂墙时间排序的。
从某种意义上说,您将需要由在事务提交之前不确定的东西确定的序列号,这在术语上是矛盾的。
因此,我认为不可能获得想要的东西,除非您实际序列化执行,例如通过在插入数据之前将表锁定为SHARE ROW EXCLUSIVE
模式。
我的问题是为什么。我想不出很好的理由。