我收到了一个数据集,并要求我根据特定的列值执行分箱。当我尝试转换为数字时,列值是因素我得到NA强制或得到因子值而不是表格中的数据。
data$imdbVotes <- as.numeric(as.character(data$imdbVotes))
当我尝试使用此代码时出现错误:
警告讯息: 强制引入的NA
这是提供的表格,我必须根据IMDB投票执行分箱。
答案 0 :(得分:0)
你很高兴见到了Edwisor。你在做什么是完全正确的。文件中必须有一些NA。
例如,如果您尝试<% if @video.any? %>
,您将看到缺少电影Venky的imdbVotes值。现在我们有两个选择。获取此项目的数据。或者保持为NA。
在数据至关重要的理想情况下,我会再次提取数据,以便没有缺失值。在这种情况下,我将把它保留为NA,因此它不会弄乱计算。