我有一个Json格式的销售数据来制作时间序列的VEC或VAR

时间:2019-03-26 19:24:30

标签: r python-3.x pandas

我有一个来自电子商务的每日销售数量数据集,可以在其上应用VEC和VAR模型。

csv只有两列,分别是“ data.event”和“ data.lastUpdate”。

  • “ data.lastUpdate”列是日期。但是格式为

“ 2017-04-10T06:22:33.230Z”。首先,我需要将其转换为YMD格式。我做到了用字符串切片。欢迎您提出所有建议,如果您知道更好的方法。

  • 但是真正的问题在于第一列“ data.event”。该列有标题,但在该列中,有每个平台(Android,iOS,Rest,Total)的销售数量。我想根据平台以及总数将所有这些划分为新的列。示例行如下。如何将行转换为单独的列?

0-{“ ANDROID”:6106,“ REST”:3322,“ IOS”:3974,“ TOTAL” ... 2017-04-10T06:22:33.230Z

10-{“ ANDROID”:9,“ TOTAL”:9} 2017-03-31T05:28:23.081Z

我想要获得的输出就像:

日期总计Android Ios

25/6/2018 35757 12247 9065

2018年6月24日18821 7582 5693

因为这是我第一次使用stackoverflow为身体不好而感到遗憾。

谢谢。

1 个答案:

答案 0 :(得分:0)

  

将其转换为YMD格式...如果您知道更好的方法

通常的strptime / loads习惯用法是:

$ python
>>> import datetime as dt
>>> stamp = '2017-04-10T06:22:33.230Z'
>>> dt.datetime.strptime(stamp, '%Y-%m-%dT%H:%M:%S.%fZ')
datetime.datetime(2017, 4, 10, 6, 22, 33, 230000)
>>>

>>> import json
>>> csv_event = '{"ANDROID":9,"TOTAL":9}'
>>> d = json.loads(csv_event)
>>> d['ANDROID']
9
>>> d['TOTAL']
9
>>>