在python中更新数据集文件

时间:2018-06-21 16:35:01

标签: python pandas

我想用Data.csvx的新值更新y的值。如何更新该数据集?

import numpy as np  
import matplotlib.pyplot as plt  
import pandas as pd  
dataset= pd.read_csv('Data.csv')  
x=dataset.iloc[: , :-1].values  
y=dataset.iloc[:, 3].values  
from sklearn.preprocessing import Imputer  
imputer = Imputer(missing_values='NaN', strategy='mean', axis=0)  
imputer = imputer.fit(x[ : , 1:3])  
x[:, 1:3]= imputer.transform(x[:, 1:3])

1 个答案:

答案 0 :(得分:0)

文件和内存中的数据结构之间没有固有的联系。如果您更改了数据,并想用新数据覆盖文件,只需将新数据写回磁盘并使用相同的文件名:

dataset = pd.concat([x, y], axis=1)
dataset.to_csv('Data.csv')