我试图创建一个包含2列[Publisher和Frequency]的Excel文件,但只有频率数据在我的Excel文件中
doaj_2015 = pd.read_csv('doaj_20151015_1800_utf8.csv')
publishers = doaj_2015['Publisher'].value_counts()
DataFrame(publishers, columns=['Frequency'])
publishers.to_excel('publisher.xlsx',
sheet_name = 'publisher frequencies',
index = False)
预期结果
答案 0 :(得分:1)
有关重命名列的信息,请参阅此question。
一旦你进行了值计数,并强制作为一个框架,你的索引就成了你正在计算的项目。重置:
publishers.reset_index()
然后,您应该像这样重命名列:
publishers.columns = ['Publisher', 'Frequency']
答案 1 :(得分:1)
publishers
是一个系列。您可以重置索引,将结果分配给数据帧,重命名列,然后导出到excel(不指定索引)。
df = publishers.reset_index()
df.columns = ['Publisher', 'Frequency']
df.to_excel('publisher.xlsx',
sheet_name='publisher frequencies',
index=False)