Question

我有一个数据列，其列如下，

   id       output  week         country                                    activity_counts  duration   age 
0  1528220       0    80   United States  {\STAGE_CHANGE\": 2, \"OUTGOING_CALL\": 3, \"E...         0   1.305327 
3  1528220       0    81   United States        {\STAGE_CHANGE\": 1, \"EMAIL_REPLIED\": 1}"         0   2.305327 
1  1528220       0    82   United States                             {\EMAIL_REPLIED\": 2}"         0   3.305327 
2  1528220       0    83   United States                                                NaN         0   4.305327

activity_counts列包含json格式的数据。我从一个由Apache Spark在其他程序中使用“;”创建的csv文件中读取了此数据帧。作为分隔符。

但是当我使用pd.read_csv（file_name，sep =“;”）读取此数据帧时，我看不到正确的数据。例如，如上所示，第二行在理想情况下应该是

'{"STAGE_CHANGE": 1, "EMAIL_REPLIED": 1}'

我需要在其中使用某种字符编码吗？请让我知道如何以正确的方式在熊猫中读取json数据列。

如何有效读取熊猫中的json类型列

0 个答案: