我使用SAS 9.4,我目前正在分析有关根的一些数据。 但是我在分析这些图表时遇到了问题:
该图表反映了与根的起源的(eucl =欧几里德)距离(原点未包括在图中,我关注的是植物后期的生长,它更加线性)随着时间的推移( DegDay) 我们可以看到,似乎有5个根线性增长,我的目标是将这些点重新组合在一起。对于每个点,我有额外的数据:位置X和Y
所以我尝试了X Y和时间(degday)的一些聚类方法:
ods graphics on;
proc cluster data=tmp method=fle ccc pseudo print=15 outtree = tree
plots( maxpoints=300)=den(height=rsq) STANDARD ;
BY exp ID;
var x y degday ;
copy eucl ;
run;
ods graphics off;
PROC TREE DATA = tree OUT = tree2 HEIGHT= RSQ LEVEL = 0.99 ;
RUN;
PROC SORT DATA = tree (KEEP = _NAME_ x y diameter degday eucl) OUT = trees;
BY _NAME_;
RUN;
PROC SORT DATA = tree2;
BY _NAME_;
RUN;
DATA tree3;
MERGE trees tree2 (IN = b);
BY _NAME_;
IF b;
RUN;
PROC SGPLOT DATA = tree3;
SCATTER X = degday Y = eucl / GROUP = cluster;
RUN;
然后对于每个聚类(有4个或更多点),我用相同的方法计算斜率和截距并重新进行聚类,得到更好的东西
更好,但仍然不行。为了增加挑战,我有2000种根系统的那些类型的数据。 所以我的问题是: 对于某些类似的线性数据,是否有比聚类更好的方法? 或者聚类方法很好但是我没有以正确的方式做到这一点?
我知道我可能不会完全理解我的解释,而且我的英语不是最好的,所以不要犹豫,要求提供任何其他信息或澄清。