整理和清理数据

时间:2018-07-22 20:32:20

标签: python-3.x data-cleaning columnsorting

我是该小组的新手,并且是一名崭新的python程序员。我被困在一个必须完成的小任务上。以下是我面临的问题。还请参阅我编写的代码。

import pandas as pd
import numpy as np
data = pd.read_csv("/Users/nancy/Desktop/sample.csv")
a = data["A"]
b = a.str.replace("First year"," ")
c = b.str.replace("First year"," ")
print (c)
data.to_csv("/Users/nancy/Desktop/sample1.csv")

我想按字母顺序对名为X和Y的列进行排序,其中Y列在A,B,C,D列中具有相同的对应值。 我想用空格替换A列和C列中的“第一年”。

我可以用空格替换它。但是,我无法将新数据写入新的csv文件。 我想用空格替换A列和C列中的“第一年和当前年份”,并在B列和D列中重现相同的数据

关于, 南希

enter image description here

1 个答案:

答案 0 :(得分:0)

您可以使用data.sort_values("your_column")

import pandas as pd
import numpy as np
data = pd.read_csv("sample.csv")
data["A"] = data["A"].str.replace("First year and current year"," ")
data["A"] = data["A"].str.replace("First year"," ")
data["C"] = data["C"].str.replace("First year and current year"," ")
data["C"] = data["C"].str.replace("First year"," ")
#print (data)
#print("---------------------------------------------------------------------------")
sorted_data = data.sort_values('Y')
#print(sorted_data)
sorted_data.to_csv("sample1.csv",index = False)

您可以选中此http://cmdlinetips.com/2018/02/how-to-sort-pandas-dataframe-by-columns-and-row/以查看更多示例。