我有兴趣找到一些需要进行拓扑排序的真实世界海量数据集(> = 1M)。也许与生物信息学有关的东西?
答案 0 :(得分:1)
你看过Stanford Large Network Dataset Collection了吗?有很多真实世界的数据集,也有大量的数据集,其中很多是针对的。
答案 1 :(得分:1)
Linux git历史中有650k commits;在单独的提交上执行拓扑排序将具有重新发现分支的合理目的(合并或不合并)。
通过包含其他Git对象类型(标记,树和blob),您可以将其扩展到超过一百万个对象:然后拓扑排序将重建目录层次结构以及提交历史记录。