出于教育目的,我正在寻找大量数据。来自社交网络的数据可能很有趣但很难获得。来自科学实验的数据可能导致编写非常困难的算法以获得有趣的结果。有没有人知道我如何/在哪里可以生成/找到一个有趣的数据集?
答案 0 :(得分:15)
以下是我随时间收集的一些公共数据集
http://wiki.gephi.org/index.php/Datasets
Download large data for Hadoop
http://datamob.org/datasets
http://konect.uni-koblenz.de/
http://snap.stanford.edu/data/
http://archive.ics.uci.edu/ml/
https://bitly.com/bundles/hmason/1
http://www.inside-r.org/howto/finding-data-internet
http://goo.gl/Jecp6
http://ftp3.ncdc.noaa.gov/pub/data/noaa/1990/
http://data.cityofsantacruz.com/
http://bitly.com/bundles/hmason/1
答案 1 :(得分:3)
在这里,亚马逊有一些您可能会尝试的大型公共数据集列表: http://aws.amazon.com/publicdatasets/