应用错误收集

如何使用Deepchem从大型在线数据集中下载数据集的一小部分？

时间：2019-12-10 02:34:56

标签： python database deep-learning

我正在尝试使用数据子集进行一些模型训练。完整的下载方式是：

deepchem.utils.download_url(
        'http://deepchem.io.s3-website-us-west-1.amazonaws.com/datasets/' +
        "pdbbind_v2015.tar.gz",
        dest_dir=data_dir)

这个数据库很大（2GB），我只需要大约400个样本。有没有一种方法可以下载此数据的随机部分而无需下载全部数据集？我似乎找不到如何执行此操作的线索，因此即使只是一个开始寻找答案的地方也会有所帮助

0 个答案:

没有答案