标签: security dataset apache-spark-dataset
有些网站免费提供数据集,但是我需要向这些网站验证身份;获取数据集。另一方面,我想将我的发现和个人项目放在公共存储库中。这里有两件事:
如果我还在存储库中添加数据集,会不会有问题?
如果我无权在存储库中添加数据集,那么我的代码和测试数据如何?我的意思是,代码的类结构可以清楚地显示数据集的结构;这会是一个问题吗?
任何解决此问题的方法?如果我想展示我的存储库,我该如何解决丢失的数据集?