是什么让“数据代数”成为数据处理的更好选择?

时间:2016-01-18 20:42:36

标签: algebraixlib

我读过“数据代数:数据经济基础”一书和白皮书“隐藏在平原视野中的数据代数”。 我想知道人们对以下问题的“数据代数”的评论 是什么让“数据代数”成为定义数据对象和数据处理的不错选择? 使用“数据代数”相对于其他数据存储和处理应用程序(特别是SQL数据库)的主要好处是什么? 使用“数据代数”的一般好处是什么?

1 个答案:

答案 0 :(得分:1)

(我是本书的作者之一。)回应:什么使得#34;数据的代数"定义数据对象和数据处理的好选择:

实际上,目前,使用数据代数的开发人员数量相对较少。如果我正确了解Algebraix Data Corp的情况,他们正在使用它为Spark环境构建SQL加速器。除了该活动之外,还为程序员创建了一组Python库(参见http://algebraixdata.github.io/algebraixlib/),以便以编程方式试验代数。因此,目前用于实现数据代数的软件工具并不多。

实际上,数据代数的存在只是刚刚公开,因此它是早期的。我不可能知道它被采用的速度有多快,但它已经存在,任何希望构建使用它的软件的人都可以这样做。

使用数据代数的主要好处就是数学应用于任何领域的好处。数学代数可以帮助的许多问题已经由程序员很好地处理,通常很久以前。你可能能够改进已完成的工作,例如PC数据库,但可能很难获得。 (我无法确定,但似乎很可能)。

然而,数学几乎无限期地扩展 - 并且准确无误。因此,问题越大(数据量,数据速度,数据可变性等),它就越有用。因此,我希望这是它初步影响的地方。

在某些时候,需要定义代数查询语言(可能是SQL的专业化和扩展)但是现在我不认为有人正在研究它。如果考虑数据的关系模型 - 这是对数据代数的尝试失败,那么SQL需要花费很长时间才能从中进行开发,并且模型才能普遍使用。

我希望这会有所帮助