如何有效读取熊猫中的json类型列

时间:2020-04-26 17:41:27

标签: python json pandas

我有一个数据列,其列如下,

   id       output  week         country                                    activity_counts  duration   age 
0  1528220       0    80   United States  {\STAGE_CHANGE\": 2, \"OUTGOING_CALL\": 3, \"E...         0   1.305327 
3  1528220       0    81   United States        {\STAGE_CHANGE\": 1, \"EMAIL_REPLIED\": 1}"         0   2.305327 
1  1528220       0    82   United States                             {\EMAIL_REPLIED\": 2}"         0   3.305327 
2  1528220       0    83   United States                                                NaN         0   4.305327 

activity_counts列包含json格式的数据。我从一个由Apache Spark在其他程序中使用“;”创建的csv文件中读取了此数据帧。作为分隔符。

但是当我使用pd.read_csv(file_name,sep =“;”)读取此数据帧时,我看不到正确的数据。例如,如上所示,第二行在理想情况下应该是

'{"STAGE_CHANGE": 1, "EMAIL_REPLIED": 1}'

我需要在其中使用某种字符编码吗?请让我知道如何以正确的方式在熊猫中读取json数据列。

0 个答案:

没有答案