这可能是一个模糊的问题。每天给我4个CSV文件,每个文件大约有500k行。我需要在它们上执行'join'和'where'等效的RDMS操作来创建每日报告。例如,工作流程可以是:
- 根据ID为
的列加入2个CSV文件
- 根据日期列过滤数据集
- 根据某些条件
将新过滤的数据集加入另一个CSV文件
- 根据更多标准进一步过滤掉它们
- .... //重复
- 将最终数据集输出为CSV文件
醇>
我在考虑编写一个PHP脚本:
- 将每个CSV文件加载到MySQL等关系数据库中
- 使用SQL
执行连接和where条件
- 将结果加载到临时表中
- 重复2和3
- 将最终数据加载到表格中
- 将表格导出为CSV文件。
醇>
您认为最好的方法是什么?