我正在开发一个使用R进行高级分析任务的QlikView项目。 该示例来自https://community.qlik.com/docs/DOC-18787,包括从着名的Iris数据库中读取数据,并根据其花瓣和萼片尺寸对每朵花进行分类。
特别是,我想在脚本中加载花数据,然后将我加载的列发送到R,为每条记录计算它所属的集群。
IrisLoad:
LOAD observation,
[sepal length] as sepLen,
[sepal width] as sepWid,
[petal length] as petLen,
[petal width] as petWid,
[iris species]
FROM
Data\Iris.csv
(txt, codepage is 1252, embedded labels, delimiter is ',', msq);
SSELoad:
Load
observation,
R.ScriptEval('kmeans(cbind(q$petLen, q$petWid, q$sepLen, q$sepWid), 3, nstart=20)$cluster', petLen, petWid, sepLen, sepWid) as IrisCluster
Resident IrisLoad;
问题是我想向R发送整个列sepLen,sep Wid,petLen,petWid和每次不是一条记录,这就是SSELoad会发生的事情。 根据在整个列sepLen,sep Wid,petLen,petWid之前检索到的计算,我对SSELoad的意图是得到2列,一个代表观察结果,另一个对应于它们的聚类组。来自csv文件。
任何人都可以给我一个关于我如何实施它的提示?
谢谢。