使用Python Pandas写入to_csv:选择要插入新数据的列索引

时间:2015-07-28 14:21:38

标签: python parsing csv pandas

我的程序中有一组数据输出,我想写入.csv文件。我能够使用旧的输入数据创建一个新文件,然后在右边的最后一列中创建新数据。如何操作输出数据所在的列?另外,如何在新文件中选择不包含旧输入数据?我是熊猫的新手。

谢谢!

1 个答案:

答案 0 :(得分:1)

从文件加载:

import pandas as pd
df = pd.read_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Data\\train.csv', header = 0)

一些操纵:

df['Gender'] = df.Sex.map(lambda x: 0 if x=='female' else 1)
df['FamilySize'] = df.SibSp + df.Parch

将某些字段复制到新字段:

result = df[['Sex', 'Survived', 'Age']]

删除不需要的字段:

del result['Sex']

保存到文件:

result.to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)

或者,如果您只想保存某些字段或按特定顺序保存:

df[['Sex', 'Survived', 'Age']].to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)