假设我们在有理db(表)中有用于测量特征的列:A,B,C,D,...,Z。它们每个都有3列:名称,值,错误。样本为行,一个样本的每个特征的测量值为零或零。 A和B列的数据填充了90%,但是C,D,...,Z很少见-稀疏列(大约10%的像元中每个都不包含空值)。
使用JSON在PostgreSQL中存储这些数据的最佳方法是什么?
我的变体(新表具有2列:序列号和JSON)
将示例的JSON数组存储在一个单元格中(一个原始行匹配一个新行)。
将示例的JSON数组拆分为几行(一行中包含一个数组元素;因此,一个原始行与一些新行匹配)。
使用有理数列:)
示例:2个原始行提供了这些JSON字符串:
----------row 1----------
[
{
"name" : "A",
"value" : 3.300000,
"err" : 1.200000,
},
{
"name" : "B",
"value" : 730.000000,
"err" : 112.000000,
},
{
"name" : "E",
"value" : 22.600000,
"err" : 4.700000,
},
{
"name" : "H",
"value" : 58.300000,
"err" : 11.100000,
}
]
----------row 2----------
[
{
"name" : "A",
"value" : 2.100000,
"err" : 1.400000,
},
{
"name" : "J",
"value" : 266.000000,
"err" : 65.000000,
},
{
"name" : "K",
"value" : 14.700000,
"err" : 3.800000,
}
]
我应该使用哪个?
如果我有示例中提到的带有记录的文本文件(原始表的每一行都为JSON数组),又如何将该数据集导入PostgreSQL?