请原谅非常简单/愚蠢的问题,但是......
说我有以下内容(在matlab中):
x_A = rand(1,30);
y_A = rand(1,30);
x_B = rand(1,40);
y_B = rand(1,40);
scatter(x_A,y_A,'r')
hold on
scatter(x_B,y_B,'b')
我想知道红点和蓝点之间是否存在任何相关性,例如蓝色如何才能成为红色的预测者?它们有多强关联?鉴于数据集A和B的长度不相等,我不能简单地进行线性回归(可以吗?)。请帮忙!
答案 0 :(得分:0)
通常我会在两个数据集中应用Pearson correlation来表示相似性(在问题中给出的示例中,维度为1)
Pearson相关系数反映了两个变量之间的线性相关程度,其值在[-1,1]之间。当两个变量之间的线性关系增加时,相关系数趋于1或-1;当其他变量增加时,一个变量增加,表明它们之间呈正相关,相关系数大于0;如果变量增益大,但另一个变量减小,表明它们之间呈负相关,相关系数小于0;如果相关系数等于0,则表明它们之间没有线性相关。