Question

我在S3中有一个很大的csv文件，并在S3中将其与另一个csv文件连接在一起。我在python中使用pandas dataframe在AWS lambda中执行此操作。我还必须使用相同的lambda将连接的数据帧保存为S3中的xlsx格式。有办法吗？

import pandas as pd
import os
import boto3

df1 =pd.read_csv("file1.csv",header=None,lineterminator='\n',sep='\t', error_bad_lines=False, encoding='ISO-8859-1') # file is in s3.

df2 = pd.read_csv("file2.csv",sep='\t',header=None)

df3 = pd.concat([df2,df1])

我想将结果保存在df3对象中，作为s3中的excel文件。

注意：我已经尝试过df.to_excel（）。但是由于我需要将其直接保存到s3，所以无法正常工作。

Answer 1

尝试df3.to_excel('filename.xlsx')

Answer 2

您可以通过以下代码进行操作：

writer = pd.ExcelWriter('test.xlsx')
df_new.to_excel(writer)

从S3读取csv文件，然后使用Python将其转换为xlsx

2 个答案: