我想知道有没有办法确定某个要素(矢量)是否包含离散数据或连续数据?
喜欢feature1 = [红色,蓝色,绿色] feature2 = [1.1,1.2,1.5,1.8]
如何判断feautre1是离散的,feature2是连续的?
非常感谢。
答案 0 :(得分:1)
您基本上可以检查您感兴趣的变量中有多少个不同的值。如果不同值的数量低于实例数量的百分比阈值,则可以将变量视为分类。百分比阈值取决于您拥有的实例数。例如,如果您有100个实例并将阈值设置为5%,那么如果这些实例采用低于5个不同的值,则可以将该变量视为分类。如果您有1,000,000个实例
从交叉验证中查看此答案。
https://stats.stackexchange.com/questions/12273/how-to-test-if-my-data-is-discrete-or-continuous
请注意,这个答案是指R,但是相同的原则适用于任何编程环境,并且将其转换为matlab并不难。
答案 1 :(得分:0)
计算机中表示的每个数据都是离散的,但这可能不是您正在寻找的答案。
有什么价值?特征1似乎是离散的,因为它描述了有限集中颜色的一些名称。但只要允许任何混合物(例如"23%red_42%blue_0.11%green_34.89%white"
,这就变成了对连续人工制品的一种非常奇怪的描述。
特征2:不知道,一些没有任何意义的任意数字。
答案 2 :(得分:0)
这可能会有所帮助:class(feature)
,其中feature
是任何对象,它会告诉您对象的类名。例如:
feature1 = {'red','blue', 'green'};
feature2 = [1.1 1.2 1.5 1.8]
>> class(feature1)
ans =
cell
>> class(feature1{1})
ans =
char
>> class(feature2)
ans =
double
>> class(feature2(1))
ans =
double