我在S3中有一个很大的csv文件,并在S3中将其与另一个csv文件连接在一起。我在python中使用pandas dataframe在AWS lambda中执行此操作。我还必须使用相同的lambda将连接的数据帧保存为S3中的xlsx格式。有办法吗?
import pandas as pd
import os
import boto3
df1 =pd.read_csv("file1.csv",header=None,lineterminator='\n',sep='\t', error_bad_lines=False, encoding='ISO-8859-1') # file is in s3.
df2 = pd.read_csv("file2.csv",sep='\t',header=None)
df3 = pd.concat([df2,df1])
我想将结果保存在df3对象中,作为s3中的excel文件。
注意:我已经尝试过df.to_excel()。但是由于我需要将其直接保存到s3,所以无法正常工作。
答案 0 :(得分:0)
尝试df3.to_excel('filename.xlsx')
答案 1 :(得分:0)
您可以通过以下代码进行操作:
writer = pd.ExcelWriter('test.xlsx')
df_new.to_excel(writer)