我正在处理从键盘侦听器收集的JSON数组数据,但是挑战是我希望对其进行规范化,以便可以将其提供给机器学习算法。
sampleData = ['{"event_type": "down", "scan_code": 35, "name": "h", "time": 1565259203.8081546, "is_keypad": false}', '{"event_type": "down", "scan_code": 30, "name": "a", "time": 1565259203.8479707, "is_keypad": false}', '{"event_type": "down", "scan_code": 31, "name": "s", "time": 1565259203.8499615 ]
当我运行下面的方法时,我得到下面的输出。
[ event_type scan_code name time is_keypad
0 down 35 h 1.565259e+09 False, event_type scan_code name time is_keypad
0 down 30 a 1.565259e+09 False, event_type scan_code name time is_keypad
0 down 31 s 1.565259e+09 False, event_type scan_code name time is_keypad
]
在此处输入代码
def loadData(data):
newdata = []
for i in data:
obj = json.loads(i)
newdata.append(json_normalize(obj))
return newdata
但是我很喜欢这个输出。
event_type scan_code name time is_keypad
0 down 33 s 3456.0 False
1 up 1 x 445.9 False
答案 0 :(得分:0)
逻辑是首先将样本数据中的所有字符串dict转换为dict并将它们附加到数组中。然后将数组传递给json_normalize函数,一切完成。