我有2个CSV格式的数据集。两者都包含Unix时间戳。一个包含业务相关数据,另一个包含天气数据。
我想要做的是通过最接近的时间戳导入业务相关数据中的天气数据。由于没有任何时间戳完全匹配,我希望每个企业都拥有最接近天气记录的数据。
我需要找到每个记录的两个时间戳之间的最小差异,并插入该案例的数据。
答案 0 :(得分:1)
据我所知,最好的方法是
将您的商家数据的主键更新为密切相关的天气数据。示例如下所示
更新weather_data set weather_data.id = (来自business_data的SELECT id,其中business_data.timestamp_column< = weather_data.timestamp_column ORDER BY business_data.timestamp_column DESC LIMIT 1);
这将为您提供天气数据的业务数据主键,使您可以轻松加入。
祝你好运!