我想使用apache hadoop处理Web服务器日志。但我无法找到样本数据集。有人可以帮我链接吗?
此致 巴瓦尼
答案 0 :(得分:0)
部分网站。
http://stackoverflow.com/questions/381806/large-public-datasets
http://aws.amazon.com/datasets
http://commoncrawl.org/
http://stackoverflow.com/questions/2674421/free-large-datasets-to-experiment-with-hadoop
http://stackoverflow.com/questions/10843892/download-large-data-for-hadoop
all the best..