应用错误收集

分析存储在Amazon RDS中的批量数据

时间：2017-04-05 09:12:05

标签： amazon-web-services psql bigdata

我有大量数据集存储在PSQL中。

我的表Schema包括：

id，location_id，hotel_id - ＆gt; INT
check_in_date，checkout_date - ＆gt;日期
成年人，货币 - ＆gt; ENUM
room_type，sub_room_type - ＆gt; ENUM
min_price，max_price - ＆gt; INT

首先，我需要分配所有酒店的价格（0,10,25,50,75,100百分位数）

我想执行此任务进行分析，因此速度不是问题。起初，我将所有数据传输到AWS Redshift，执行任务并关闭它，但我无法估算成本。

我想探索具有成本效益的多种解决方案。

正在使用的机器：具有200 GB分配空间的AWS db.t2.micro

存储估计数据和行数的表每个表都具有与字段类型相同的模式： 1个主要ID，3个日期字段，4个枚举，4个价格，4个整数

0 个答案:

没有答案