为了解释我的意思,我将使用一个比喻简单的类比。
上下文:假设StackOverflow的每个人都拥有一家在线销售体育用品的公司。您的商品具有高度的针对性:您销售纪念本赛季每场比赛的帽子,并且出售每种帽子的不同版本以出售给两支球队的支持者。例如,如果西雅图Scalas乐队明天在玩伦敦Lisps,则您将全部出售这两个
(a)“斯卡拉人队在2018年7月17日的比赛中击败了Lisps”帽子和
(b)“ The Lisps在2018年7月17日的比赛中击败了Scalas”。
您在游戏开始甚至很久之前就开始出售这些帽子(,但不一定同时),并且您的在线商店非常受欢迎,因此您的商品总是在游戏开始之前就被抢购一空( ,但不一定同时)。在您的在线商店中,针对每种游戏,您都报告(实时)有多少人购买了每种帽子。 但是,一旦任何一种帽子售罄,该游戏的所有帽子版本(以及购买数量)都会从您的网站上消失。
我想做的事情:每5分钟,我将访问您每个商店的网站,并抓取该页面,为即将到来的游戏提取每种帽子的购买数量。换句话说,每个Game
都带有Vendors
的列表,对于每个供应商,对于Team1
和{{1 }}。
我的问题:如果我想实时执行此操作而不保存时间序列,则只需创建Team2
个对象,它们保存每个{{1 }}。但是在这里,我想保存数据,以便以后可以以多种方式使用它。什么是存储此数据的最佳方法,以便以后可以模拟所有时间序列?如果重要的话,我使用Python。
我以前从未做过任何与数据结构有关的编程,所以请原谅我。