我正在开展个人项目,分析来自三个不同地点的房地产数据。我想对数据进行一些统计分析(Python,numpy,pandas,scikit)数据可视化,以识别趋势,异常值,市场变化,机会,识别集群等。
要存储的部分信息:
物业总数为250.000,00。最初,我每天都会下载信息,以了解数据的特征。在此之后,我将改变数据的刷新率,可能每周两次。
我正考虑将关系(PostgreSQL)数据库用于非时间相关数据,并考虑使用时间序列(Influxdb或graphite)数据库来计算价格。
你怎么看?我选择了正确的筹码?