更新本地包中的数据集

时间:2018-11-22 12:42:23

标签: python-3.x dataset package local

我正在构建一个本地包,该包不断使用相同的数据集与输入数据进行比较。该软件包将与其他人共享,这意味着数据集应与软件包一起安装(就像sci-kit学习数据集中的数据集一样)。问题在于数据集需要每月更新,我不确定如何更新已安装的软件包中的数据集。有任何想法吗?这是我的代码/伪代码的框架。

class myClass():
    def __init__ (self):
        self.dataset = dataset in the package
        self.input = pd.DataFrame()
        self.output = pd.DataFrame()
    def somefuntion(self):
        self.check_date_dataset()
        if checked_date < Today - 30 days:
            self.update_dataset()
        do_something_with_self.input()
    def check_date(self):
        checks date of dataset in day and returns the age
    def update_dateset(self)
        update the data set in the package  # (IS THIS POSSIBLE)?

是否可以在已安装的软件包中更新数据集?

1 个答案:

答案 0 :(得分:0)

看看uszipcode软件包。 它在用户的主目录(包dir之外)中维护了最新的缓存,并根据需要下载新副本。 您可能希望采用类似的方法。