规范化和不可变数据模型

时间:2016-12-17 17:10:58

标签: scala haskell normalization immutability database-normalization

Haskell如何解决“规范化的不可变数据结构”问题?

例如,让我们考虑代表前女友/男朋友的数据结构:

data Man = Man {name ::String, exes::[Woman]}

data Woman = Woman {name :: String, exes::[Man]}

如果一个女人改变了她的名字并且她和13个男人在一起,会发生什么?然后所有13个人都应该“更新”(在Haskell意义上)?需要某种规范化来避免这些“更新”。

这是一个非常简单的例子,但想象一个具有20个实体的模型,以及它们之间的任意关系,该怎么做呢?

用不可变语言表示复杂的规范化数据的推荐方法是什么?

例如,可以找到Scala解决方案here(参见下面的代码),它使用引用。在Haskell可以做些什么?

class RefTo[V](val target: ModelRO[V], val updated: V => AnyRef) {
  def apply() = target()
}

我想知道,如果像上面那些(在Scala中)更通用的解决方案在Haskell中不起作用或者它们不是必需的吗?如果它们不起作用,为什么不呢?我试图搜索在Haskell中执行此操作的库,但它们似乎不存在。

换句话说,如果我想在Haskell中建模规范化的SQL数据库(例如与acid-state一起使用),是否有一种描述外键的通用方法?一般来说,我的意思是,不要按照以下评论中chepner的建议手工编码ID。

编辑:

然而换句话说,是否存在一个库(用于Haskell或Scala)在内存中实现SQL /关系数据库(可能还使用事件源来实现持久性),这样数据库是不可变的和大多数SQL操作(查询) / join / insert / delete / etc.)是否已实现并且是类型安全的?如果没有这样的图书馆,为什么不呢?这似乎是个不错的主意。我该如何创建这样的库?

编辑2:

一些相关链接:

2 个答案:

答案 0 :(得分:9)

问题是您以相同的类型存储数据和关系。要标准化,您需要分开。关系数据库101。

newtype Id a = Id Int -- Type-safe ID.
data Person = Person { id :: Id Person, name :: String }
data Ex = Ex { personId :: Id Person, exId :: Id Person }

现在,如果某人更改了姓名,则只会影响一个Person值。 Ex条目不关心人们的姓名。

答案 1 :(得分:0)

项目M63非常close正如我所寻找的那样。它是用Haskell编写的。

Gabriel Gonzalez的帖子" A very general API for relational joins"概述了一个更轻量级的Haskell解决方案。