我是新来的,所以请保持温柔。
我目前正在尝试使用内核方法应用一些结构化预测算法。我缺少的是一个很好的数据库,可以对其进行测试。我目前正在搜索(并继续搜索)一些免费的数据库,但直到现在才发现任何东西(有用)。
正因为如此,我更明确地说明了我的观点,你可以将本文作为参考:
http://www-kd.iai.uni-bonn.de/pubattachments/402/GaertnerV09ECML.pdf
目前我正在此链接上搜索数据库,如果找到合适的内容,我会更新此主题: http://www.quora.com/Data/Where-can-I-get-large-datasets-open-to-the-public?q=large+datase
答案 0 :(得分:0)
如果你想要一个体面大小的数据集的好集合,试试世界银行的数据库: http://data.worldbank.org/
有足够的数据变量和预编译的数据集,您应该能够找到数据挖掘/预测算法的东西。此外,这些数据集涵盖了大约40年 - 这意味着您可以交叉比较时间跨度或数十年,以防您希望采用该方法进行预测构建。