目前我有一个数据集,当我尝试将其转换为数字数据时,列中的每个观察都被记录为一个因子。 Test.dup是数据集,RightID是不转换的列。
截至目前,我已经尝试过......
1. as.numeric(levels(test.dup$RightID))
2. as.numeric(as.character(test.dup$RightID))
3. as.numeric(test.dup$RightID)
4. Tried assigning RightID as its own vector
and using method 1 with the vector name instead of test.dup$RightID.
但是is.factor将始终返回TRUE并且is.numeric将始终返回FALSE。上述方法似乎是我的问题的常用解决方案。但是我的问题不会消失。
RightID列的示例(所有权利ID旁边都有重复项):
RightID
10012
10012
10012
10012
10013
10013
10014
10014
10014
.. and so on
我正在使用的原始数据集有大约300K的观察值(这是大约160K的子集)是值得的,所以我没有滚动并检查是否有任何非数字字符。如果有一个快速功能来检查是否存在我不知道的任何非数字字符,那将会有很大的帮助!元数据说这个字符是“一个独特的计算机生成的ID”,所以我无法想象在向量中会有一个非数字,但你永远不会知道。