我要从源中获取数据并对其进行一些计算,然后我必须以表形式写入该数据。该表将包含约20列,我将从变量中传递的每一列的值,因此,我想创建一个类,但是我在scala中的普通类和case类之间感到困惑-我应该在此使用哪个类情况。
例如,我正在获取具有以下变量的“客户”数据:
11,111,111
对于每个客户,我必须以HDFS中的表格形式推送此数据。
因此在Scala中,我需要为它创建一个数据类型。
所以我应该使它像
Customer(ID, OrderNo,TIMESTAMP, Quantity, OrderType )
然后传递值,例如
class Customer(ID : Int, OrderNo : Int ,TIMESTAMP : DateTime, Quantity : Short, OrderType : String )
然后我应该将此x值写入表中,或者还有其他方法可以做到吗?