我尝试使用(http://jupyter.org/)将数据从Python导出到Excel
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime
df = pd.read_csv('rr.csv')
df['COLLISION_DATE'] = pd.to_datetime(df['COLLISION_DATE'],format='%Y%m%d')
df['week'], df['month'], df['year'],df['day'] = df['COLLISION_DATE'].dt.week, df['COLLISION_DATE'].dt.month, df['COLLISION_DATE'].dt.year,df['COLLISION_DATE'].dt.day
df = df.groupby('month').size().to_frame('Number of Accidents')
df.plot.line()
plt.show()
df
df.to_excel('m.xlsx')
我收到错误
ModuleNotFoundError: `No module named 'openpyxl'
这是我使用Python Any Idea的第一个项目是错误的还是我可以使用的任何其他代码?
答案 0 :(得分:0)
我使用的是在线Jupyter笔记本中的Azure笔记本(https://notebooks.azure.com)。我尝试了一个我的数据框,我从Kaggle下载到导出,看起来它正在工作,下面是代码。
import pandas as pd
df = pd.read_csv('/home/nbuser/armenian_pubs.csv')
df.to_excel('data_set_2.xlsx')
请注意,您需要通过数据>上传任意数据集(CSV)文件。从本地系统上传菜单,然后我使用DF to_excel的Panda方法创建只有文件名的Excel。这会在/library
文件夹中创建文件名,然后您可以使用Data>下载下载文件。
希望这对您的方案有所帮助。