我正在制作一个可以占用任何csv文件的通用工具。我有一个看起来像这样的csv文件。第一行是列名,第二行是变量类型。
Time,M1,M2,M3,CityName
temp,num,num,num,city
20-May-13,19,20,0,aligarh
20-May-13,25,42,7,agra
20-May-13,23,35,4,aligarh
20-May-13,21,32,3,allahabad
20-May-13,17,27,1,aligarh
20-May-13,16,40,5,aligarh
我想在列中找到唯一值,其中变量的类型是" city",即第二行。我已经能够搜索类型为" city"的列名。并试图找到唯一的值,但由于它给出错误而无法进一步成功。
filename = 'sam.csv'
data_date = pd.read_csv(filename)
column_name = data_date.ix[:, data_date.loc[0] == "city"]
column_work = column_name.iloc[1:]
name = column_work.dtypes.index
column_unique = data_date.column_work.unique()
print(column_unique)
我想要列表中的唯一值,例如
[aligarh,agra,allahabad]
答案 0 :(得分:1)
unique
+ tolist
column_work.CityName.unique().tolist()
Out[87]: ['aligarh', 'agra', 'allahabad']