为什么将Dask数据框转换为pandas数据框真的很慢?

时间:2018-09-28 12:16:50

标签: python pandas dataframe dask

我正在使用dask从dask获取数据框

#Find bounce report.
$curl = curl_init();

curl_setopt_array($curl, 
array(
    CURLOPT_RETURNTRANSFER => 1,
    CURLAUTH_ANY,
    CURLOPT_URL => 'https://api.sendgrid.com/v3/suppression/bounces/'.$bouncemail.'/',
    CURLOPT_HEADER => 'Authorization: Bearer SG.XPP2Vu0BQ6qpJLAPLvnVRQ.jlrvJDevGENsaKXvRbx7ruJEHmuQtEefC_xxxx'
));

$bounce_report = curl_exec($curl);
curl_close($curl);

但这真的很慢... 有替代方法吗?

1 个答案:

答案 0 :(得分:1)

Dask数据帧是惰性的,所有操作都是免费的,直到您调用compute为止,此时它们都将发生。