我最近在我的Java编程类中收到了一个用于分析(我猜的是一个非常小的)数据集的任务。我非常喜欢这项任务和使用'tokenizer'等,这对我来说是一个新概念。我们使用的数据集非常无聊,因为它只包含日期。
我正在寻找的是:
这可以是真正的(最好非常简单),因为我主要是打印出统计数据,模式和图表。
答案 0 :(得分:4)
尝试Stackoverflow data dump。
答案 1 :(得分:3)
UC Irvine Machine Learning Repository是这类事情的重要资源。
答案 2 :(得分:2)
除nos提到的原始数据转储外,请参阅其随附的Stack Exchange Data Explorer。在那里,您可以运行SQL查询并下载结果集。 (如果您正在寻找小于所有内容的东西,则非常有用。)