所以我有2个数据集:1.数据数组(称为x),2.具有n列的pandas数据框
我正在尝试编写一个for循环,该循环遍历dataframe
中的每一列,并针对我的第一个数据数组x计算该列的相关系数。
x = [1.2, 1.9, 2.2, 4.1]
y = {'col1': [1, 2, 3, 4], 'col2': [10, 20, 30, 40]}
example_df = pd.DataFrame(data = y)
for i in example_df.columns:
print(np.corrcoef(x, example_df.i)[0, 1])
但是,我收到一个错误
“'DataFrame'对象没有属性'i'”
我想知道是否有人对如何访问和使用'i'
来访问我的dataframe
中的列的建议。
答案 0 :(得分:1)
当您写这篇文章时:
example_df.i
…要求一个字面名称为i
的列。当然,您没有一个。
您有一个名为col1
的列,而i
是一个包含字符串'col1'
的变量。为此,请执行以下操作:
example_df[i]