我有一个包含多个列的csv文件。这是给学生的。我想只展示男学生和他们的名字。我使用1表示男生,0表示女生。我的代码是:
import pandas as pd
data = pd.read_csv('normalizedDataset.csv')
results = pd.concat([data['name'], ['students']==1])
print results
我收到了这个错误:
TypeError:无法连接非NDFrame对象
任何人都可以帮忙。感谢。
答案 0 :(得分:1)
您可以指定在加载csv时只读取数据的某些列名称。然后使用loc
找到students
等于1的所有值。
data = pd.read_csv('normalizedDataset.csv', usecols=['name', 'students'])
data = data.loc[data.students == 1, :]
BTW,您的原始错误是因为您尝试将数据框连接到False。
>>> ['students']==1
False
答案 1 :(得分:0)
不需要连接,你要剥离东西,而不是建造。
尝试:
data[data['friends']==1]['name']
答案 2 :(得分:0)
清楚说明您收到错误的原因:
你试图连接的第二件事是:
['students']==1
哪个不是NDFrame
对象。你想用它替换它。
data[data['students']==1]['students']