要“实践”的公共数据集

时间:2010-11-04 18:57:26

标签: dataset

我最近在我的Java编程类中收到了一个用于分析(我猜的是一个非常小的)数据集的任务。我非常喜欢这项任务和使用'tokenizer'等,这对我来说是一个新概念。我们使用的数据集非常无聊,因为它只包含日期。

我正在寻找的是:

实践分析的公共数据集(XML,txt或类似)

这可以是真正的(最好非常简单),因为我主要是打印出统计数据,模式和图表。

3 个答案:

答案 0 :(得分:4)

尝试Stackoverflow data dump

答案 1 :(得分:3)

UC Irvine Machine Learning Repository是这类事情的重要资源。

答案 2 :(得分:2)

nos提到的原始数据转储外,请参阅其随附的Stack Exchange Data Explorer。在那里,您可以运行SQL查询并下载结果集。 (如果您正在寻找小于所有内容的东西,则非常有用。)