我的程序中有一组数据输出,我想写入.csv文件。我能够使用旧的输入数据创建一个新文件,然后在右边的最后一列中创建新数据。如何操作输出数据所在的列?另外,如何在新文件中选择不包含旧输入数据?我是熊猫的新手。
谢谢!
答案 0 :(得分:1)
从文件加载:
import pandas as pd
df = pd.read_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Data\\train.csv', header = 0)
一些操纵:
df['Gender'] = df.Sex.map(lambda x: 0 if x=='female' else 1)
df['FamilySize'] = df.SibSp + df.Parch
将某些字段复制到新字段:
result = df[['Sex', 'Survived', 'Age']]
删除不需要的字段:
del result['Sex']
保存到文件:
result.to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)
或者,如果您只想保存某些字段或按特定顺序保存:
df[['Sex', 'Survived', 'Age']].to_csv('D:\\Apps\\Coursera\\Kaggle-Titanic\\Swm\\result.csv', index=False)