作为最近一个编程项目的一部分,我编译了一个数据库,其中的内容有一天可能会被其他人使用。我正在寻找“开源”数据的最佳方式。
我可以(也可能会)将SQL上传到GitHub上,但是想知道是否有人找到了更“以数据为中心”的共享方式 - 也许是一个让用户可以轻松浏览/查询/可视化的网站改进数据集,而不仅仅是给他们一大堆SQL。
为了澄清,我正在寻找一个可以共享数据的地方,而不是分享数据的格式 - 理想情况下是与GitHub / Sourceforge相当的数据集。
数据相对较小(几千行SQL),因此音量不应成为障碍。
答案 0 :(得分:2)
对于像这样的事情,我是Amazon's S3的忠实粉丝。如果您的数据集足够有趣,也许您可以使用InfoChimps发布它。
答案 1 :(得分:1)
我使用过来自不同公司的大量数据。大多数情况下,这些数据采用文本分隔的数据格式。最流行的当然是逗号分隔或制表符。使用逗号通常是一个不错的选择,因为MySQL也可以导出和导入CSV。这是一个例子:
id, first_name, last_name, address
1, John, Smith, 11222 Stree Name
答案 2 :(得分:1)
Google Fusion Tables勾选其中的一些方框,虽然重点似乎是可视化(我没有使用它,所以这可能是不公平的)。我现在也不愿意过任何二线谷歌产品,因为他们有消失的习惯。
答案 3 :(得分:0)
您可以将其导出为XML,这可能是最兼容的数据格式,尽管它相当冗长。另一个解决方案是OData,但这意味着托管数据和提供数据的平台,这可能是不可取的。
答案 4 :(得分:0)
Sparkfun是另一种可能性,它似乎主要针对实时数据源,但它们提供免费存储,平台是开源的,因此您可以托管自己的服务器。