我刚收到一个随机数的大数据数组。每行20个数字,CSV文件中600,000行。数字由空格而不是逗号分隔,因此postgresql将其读取为每行一个长字符串,我无法为数据插入正确的数据属性。
每组数字都有唯一的ID。每个数字长2位。我希望能够计算输入某个数字的次数。获取某些ID之间的每个数字的频率。
我的问题:
目前正在运行Postgres 9.6,PgAdmin 4。 如果在PgAdmin中也提供答案,则可获得奖励。
此处还有一个示例
Excel中 编号
06 18 20 21 24 32 36 40 44 47 50 52 55 57 60 61 62 68 72 79
03 05 12 13 14 16 17 18 24 28 33 34 35 39 44 55 62 63 64 67
09 10 12 13 15 25 30 31 36 42 43 44 46 48 51 57 65 69 75 79
08 12 15 20 27 33 34 37 41 43 44 45 54 55 60 61 66 70 72 76
CSV文件
Numbers06 18 20 21 24 32 36 40 44 47 50 52 55 57 60 61 62 68 72 79 03 05 12 13 14 16 17 18 24 28 33 34 35 39 44 55 62 63 64 67 09 10 12 13 15 25 30 31 36 42 43 44 46 48 51 57 65 69 75 79 08 12 15 20 27 33 34 37 41 43 44 45 54 55 60 61 66 70 72 76
或带有ID号的文件 CSV ID,数字 1253842,06 18 20 21 24 32 36 40 44 47 50 52 55 57 60 61 62 68 72 79 1253843,03 05 12 13 14 16 17 18 24 28 33 34 35 39 44 55 62 63 64 67 1253844,09 10 12 13 15 25 30 31 36 42 43 44 46 48 51 57 65 69 75 79 1253845,08 12 15 20 27 33 34 37 41 43 44 45 54 55 60 61 66 70 72 76 1253846,04 06 07 09 11 12 13 14 18 20 21 26 30 36 37 41 43 48 74 79 1253847,01 11 14 15 35 37 38 43 46 48 49 51 53 57 64 65 66 70 76 77 1253848,01 03 14 17 20 22 24 25 38 42 46 54 56 57 60 61 66 72 78 80
这是错误消息 >
错误:格式错误:“06 18 20 21 24 32 36 40 44 47 50 52 55 57 60 61 62 68 72 79” DETAIL:数组值必须以“{”或维度信息开头。 背景:复制快速编号,第2行,列号:“06 18 20 21 24 32 36 40> 44 47 50 52 55 57 60 61 62 68 72 79”