如何用字典存储熊猫数据框

时间:2020-02-27 11:36:52

标签: python pandas

我有很大的数据集,并以pickle格式(4 GB)存储,并且花了很多时间来读取文件。我使用pickle的原因是我有2列带有字典的列,并且在加载文件后有必要保持这种类型。

所以我的问题是如何优化读取,存储和操作我的数据?

我的数据框看起来像这样 以及在加载数据后保存dict类型的必要条件:

   0  1  2  3    4      5
0  1  2  3  4  {2:1}  {1:2}
1  2  4  6  8  {2:1}  {1:2}

1 个答案:

答案 0 :(得分:0)

您可以做的是在保存之前将字典转换为字符串,并在加载后转换回字符串。这样,您可以将其另存为csv文本,避免使用pickle,在这种情况下可以加快任务的执行速度。

[FunctionName("AddToQueue")]
    [return: Queue("queue")]
    public async Task<HttpResponseMessage> AddToQueue(
        [HttpTrigger(AuthorizationLevel.Function, "post", Route = "")] HttpRequest req,
        ILogger log)
    {
        if (!_accessRights.HasInternalAccess(req))
        {
            //return 403
            return new HttpResponseMessage(HttpStatusCode.Forbidden);
        }

        return new Message()
        {
           Title = "Hello"  
        };
    }
相关问题