我即将编写一些示例应用程序和附带的文档,比较访问存储在关系数据库中的信息的方法。为了展示现实生活中的需求,我需要包含一个包含数十万个事实的真实数据集。
是否有人了解具有人类差异的人名的数据集的公开可用免费数据集,或者 的分层数据集组织层次结构,或大型分层,分类,产品目录?
如果你是的话,请指出正确的方向。
第1部分,人名:http://timecenter.cs.aau.dk/software.htm
第2部分,分层数据:还没有答案
答案 0 :(得分:3)
维基百科转储非常庞大:obligatory wikipedia link。
答案 1 :(得分:2)
答案 2 :(得分:2)
您自己的PC目录树是一个包含大量事实的大型层次结构。您可能有几千个“事实”,即文件名,修改日期,大小,额外的操作系统信息等等。
如果这还不够大,请找一个可以登录的服务器。那会更大。
不够大?获取网络爬虫并开始抓取大型网站。这可能与您耐心爬行一样大。