Question

我正在制作一个可以占用任何csv文件的通用工具。我有一个看起来像这样的csv文件。第一行是列名，第二行是变量类型。

Time,M1,M2,M3,CityName
temp,num,num,num,city
20-May-13,19,20,0,aligarh
20-May-13,25,42,7,agra
20-May-13,23,35,4,aligarh
20-May-13,21,32,3,allahabad
20-May-13,17,27,1,aligarh
20-May-13,16,40,5,aligarh

我想在列中找到唯一值，其中变量的类型是＆＃34; city＆＃34;，即第二行。我已经能够搜索类型为＆＃34; city＆＃34;的列名。并试图找到唯一的值，但由于它给出错误而无法进一步成功。

filename = 'sam.csv'
data_date = pd.read_csv(filename)
column_name = data_date.ix[:, data_date.loc[0] == "city"]
column_work = column_name.iloc[1:]
name = column_work.dtypes.index
column_unique = data_date.column_work.unique()
print(column_unique)

我想要列表中的唯一值，例如

[aligarh,agra,allahabad]

Answer 1

unique + tolist

column_work.CityName.unique().tolist()
Out[87]: ['aligarh', 'agra', 'allahabad']

如何在列中查找唯一值？属性错误：＆＃34; DataFrame＆＃34;对象没有属性

1 个答案: