有一个python sqlite3蜘蛛爬过一个网站,基本上得到一个地址,它出售的日期以及它出售的相应价格。第一个数据库用于地址,邮政编码,卧室数量,第二个数据库是出售的时间点我正在考虑安排第二个数据库,其价格如下:
(Unique_id, date_1, sale_price_1, date_2, sale_price_2...etc..etc)
但这似乎不是很有效,例如,我可能会放下五个日期和销售列,但爬虫可能会遇到卖出七次的房子...是否有更有效的方式来组织第二个销售数据库价格?
提前谢谢
答案 0 :(得分:1)
我会创建两个表:一个用于houses
,另一个用于transactions
,并通过外键链接它们。
每个house
在houses
表中只有一行,但在transactions
表中可能有任意数量的行。
transactions
表格将包含已售出的house
的外键,以及有关销售的列,例如日期和促销价格。