我第一次和Cassandra一起工作,我有些疑惑。我的数据源是csv文件。我有三个:航班,飞机和机场。我将把每个csv文件的结构放在我的问题的上下文中。
机场
ID_airport |机场|城市|州|国家|纬度|经度
飞行
ID_airplane | type | manufacturer | issue_date | model | engine_type | aircraft_type
航班
ID_flight |日期| Flight_Numb | ID_airplane | ID_airport_origin | ID_airport_dest
DepartureTime | Arrival_time | airline | distance | DepDelay | ArrivalDelay。
航班文件是主要文件,拥有数百万条记录。另外两个是补充数据。
根据我读到的关于Cassandra的内容,首先应该定义必要的查询,然后创建满足我们需求的列族。但是Cassandra不支持JOIN的。如何将csv文件中的数据与另一个文件相关联,以便创建具有不同csv文件字段的列族?
例如,如果我想知道哪个飞机模型在航班中注册更多延误。在关系模型中,这可能是JOIN的,但在Cassandra,我认为这是不可能的。
在卡萨德拉有什么办法吗?如何使用具有不同csv文件字段的列族?