Stata的速度有多快:操纵平面数据库(即Excel)或关系数据库中的数据?

时间:2015-06-02 17:03:15

标签: excel relational-database stata data-manipulation

我是一家公司的入门级优化分析师,该公司为各公司发布风险评级数据。我们有大量的数据(目前我们的历史记录仅限于Excel中可能的行数)。

我们目前在Stata中使用许多.do文件来执行所有操作和统计分析(我们运行的最大生产需要9个小时,一个小册子需要半分钟)。我试图说服该公司从使用平面数据库转向使用关系数据库,但一直无法在线查找关于Stata中平坦或关系是否更好的信息。那么 - 哪个更好,为什么?

1 个答案:

答案 0 :(得分:1)

我认为您通过强调Excel的限制会阻止您充分利用数据的全部潜力来回答您自己的问题。 Excel 不是正确的分析工具或数据仓库解决方案,因此在分析项目中使用它没有任何意义,涉及比为小型企业/家庭需求做一些基本总和更复杂的事情。

回答你的问题:

  1. 平面文件数据库是一种可以追溯到计算机科学起源的古老技术:它们从未被设计用于满足使用大数据,实时数据流等的现代分析需求。

  2. 关系数据库

    • 帮助避免数据重复
    • 帮助避免记录不一致
    • 更改数据格式时
    • 更容易