我正在构建一个本地包,该包不断使用相同的数据集与输入数据进行比较。该软件包将与其他人共享,这意味着数据集应与软件包一起安装(就像sci-kit学习数据集中的数据集一样)。问题在于数据集需要每月更新,我不确定如何更新已安装的软件包中的数据集。有任何想法吗?这是我的代码/伪代码的框架。
class myClass():
def __init__ (self):
self.dataset = dataset in the package
self.input = pd.DataFrame()
self.output = pd.DataFrame()
def somefuntion(self):
self.check_date_dataset()
if checked_date < Today - 30 days:
self.update_dataset()
do_something_with_self.input()
def check_date(self):
checks date of dataset in day and returns the age
def update_dateset(self)
update the data set in the package # (IS THIS POSSIBLE)?
是否可以在已安装的软件包中更新数据集?