标签: dataset large-data-volumes large-data
我一直在尝试和编写多线程和多进程代码。我意识到任何有趣的实现/算法都与数据的丰富性和广泛性密切相关。所以,我正在寻找庞大的数据集。
一个非常好的例子是Google N-Gram数据 http://googleresearch.blogspot.com/2006/08/all-our-n-gram-are-belong-to-you.html
如果我能找到更多这样的东西,那将会很棒。请建议指向如此庞大的数据来源。