我是SAS编程的新手。但是,我有兴趣使用该数据来开发算法。但是,我不会总是连接到互联网,因此通过网络访问数据库将不是一个选项。
相反,我想知道:
复制超大型SAS数据库(3 TB)的最佳方法是什么?
我是否可以使用我的PC(而不是专用硬件)来运行本地SAS服务器并执行SAS脚本?
答案 0 :(得分:3)
您当然可以在本地运行SAS,但桌面许可证价格昂贵(取决于您许可的产品,第一年可能是2000美元)。你当然也可以用MYSQL格式(或其他任何东西)存储文件; MYSQL可以轻松读取逗号分隔文件(CSV),您可以很快从SAS生成创建表脚本。
我会注意到,您通常不会将SAS文件称为“数据库”,尽管它并没有完全不准确;然而,他们更接近表格'而不是整个数据库(通常是许多表的数据和元数据的一个独立单元)。 SAS文件通常被称为“数据集”,SAS数据集和元数据(格式目录等)的集合称为“图书馆”。
复制3TB SAS数据集(如果它是单个数据集)可以通过常规文件传输方法(FTP,HTTP,Windows或UNIX副本等)完成.SAS数据集通常压缩得非常好(即3TB)未压缩的SAS数据集可能很容易压缩到2-3GB,具体取决于具体细节)。您可能需要获取SAS格式目录以及数据集(存储值标签);另外,这是操作系统和特定位数(因此Windows 32位不能使用Unix甚至Windows 64位格式目录);有一些方法可以在适当的版本中获取格式目录(或者更常见的是,获取目录的数据集转储以在本地重新创建)。
答案 1 :(得分:2)
是的,您可以为PC许可SAS。
您是否打算将3tb数据集下载到本地环境?哇。如果您是SAS的新手,并且想要开发算法,那么为什么不从一些较小的数据集开始,例如那些随SAS本身或您自己创建的数据集?然后,一旦你确定了一个好的算法,也许保证在3tb数据集上运行它的挑战。
或者可能首先获得完整数据集的子集。