我有一个简单的任务:在luigi中,使用dropbox-python sdk将pandas数据帧存储为dropbox中的csv
通常(例如,使用S3),您可以将StringIO用作类似文件的内存中对象。它也适用于pandas df.to_csv()
不幸的是,dropbox sdk需要二进制类型,我无法理解如何将StringIO转换为二进制文件:
with io.StringIO() as f:
DF.to_csv(f, index=None)
self.client.files_upload(f, path=path, mode=wmode)
TypeError: expected request_binary as binary type, got <class '_io.StringIO'>
ByteIO无法使用df.to_csv()
...
答案 0 :(得分:4)
如this回答所示,dropbox需要一个字节对象,而不是文件,因此转换为BytesIO
无济于事。但是,解决方案比这更简单。您需要做的就是将字符串编码为二进制文件:
csv_str = DF.to_csv(index=None) # get string, rather than StringIO object
self.client.files_upload(csv_str.encode(), path=path, mode=wmode)