从S3读取csv文件,然后使用Python将其转换为xlsx

时间:2018-07-09 17:03:30

标签: python pandas amazon-s3 aws-lambda xlsx

我在S3中有一个很大的csv文件,并在S3中将其与另一个csv文件连接在一起。我在python中使用pandas dataframe在AWS lambda中执行此操作。我还必须使用相同的lambda将连接的数据帧保存为S3中的xlsx格式。有办法吗?

import pandas as pd
import os
import boto3

df1 =pd.read_csv("file1.csv",header=None,lineterminator='\n',sep='\t', error_bad_lines=False, encoding='ISO-8859-1') # file is in s3.

df2 = pd.read_csv("file2.csv",sep='\t',header=None)

df3 = pd.concat([df2,df1]) 

我想将结果保存在df3对象中,作为s3中的excel文件。

注意:我已经尝试过df.to_excel()。但是由于我需要将其直接保存到s3,所以无法正常工作。

2 个答案:

答案 0 :(得分:0)

尝试df3.to_excel('filename.xlsx')

答案 1 :(得分:0)

您可以通过以下代码进行操作:

writer = pd.ExcelWriter('test.xlsx')
df_new.to_excel(writer)