我最近设置了我的第一个“etl”流来从远程服务获取数据,修改它以适合我的本地模型,然后保存它。现在我已经完成了,但由于一些原因,它感觉相当怪诞
我的source
是来自远程服务的JSON
我的transform
根据原始row
model
source
替换为新定义的本地row
transform
还会查看各种值并定义其他本地关系
destination
然后在新替换的.save
上调用rows
,这些版本现在是ORM中的模型。
row
条目是对的吗?row
的值,那么我认为我应该将每个后续操作拆分为该新行(现在是模型)的transform
? 总之,我的.etl看起来像
pre_process do
@some = <Go To DB and fetch data>
@variables = <Setup More Information>
end
source MyRemoteSource
transform DoABunchOfWork,@some,@variables
destination CallSaveOnModels
DoABunchOfWork类有大约6种方法process
将调用以各种方式操纵或设置关系