大型数据集的来源

时间:2012-04-08 18:41:29

标签: dataset large-data-volumes large-data

我一直在尝试和编写多线程和多进程代码。我意识到任何有趣的实现/算法都与数据的丰富性和广泛性密切相关。所以,我正在寻找庞大的数据集。

一个非常好的例子是Google N-Gram数据 http://googleresearch.blogspot.com/2006/08/all-our-n-gram-are-belong-to-you.html

如果我能找到更多这样的东西,那将会很棒。请建议指向如此庞大的数据来源。

0 个答案:

没有答案