数字转换的因素 - 典型的解决方案不起作用

时间:2017-06-07 17:30:41

标签: r types type-conversion

目前我有一个数据集,当我尝试将其转换为数字数据时,列中的每个观察都被记录为一个因子。 Test.dup是数据集,RightID是不转换的列。

截至目前,我已经尝试过......

1.  as.numeric(levels(test.dup$RightID))
2.  as.numeric(as.character(test.dup$RightID))
3.  as.numeric(test.dup$RightID)
4.  Tried assigning RightID as its own vector 
and using method 1 with the vector name instead of test.dup$RightID.

但是is.factor将始终返回TRUE并且is.numeric将始终返回FALSE。上述方法似乎是我的问题的常用解决方案。但是我的问题不会消失。

RightID列的示例(所有权利ID旁边都有重复项):

RightID 10012 10012 10012 10012 10013 10013 10014 10014 10014 .. and so on

我正在使用的原始数据集有大约300K的观察值(这是大约160K的子集)是值得的,所以我没有滚动并检查是否有任何非数字字符。如果有一个快速功能来检查是否存在我不知道的任何非数字字符,那将会有很大的帮助!元数据说这个字符是“一个独特的计算机生成的ID”,所以我无法想象在向量中会有一个非数字,但你永远不会知道。

0 个答案:

没有答案