$ date(fctr)01-07-14 02:30,01-07-14 02:30,01-07-14 02:30,01-07
$ author(fctr)techkennels,PreDraX,SeattleGOP,MrP。
$ body(fctr)@ AC360 @JohnBerman @arwaCNN @Ali_H_Soufan @CNN,“@ cn。
$ doclang(fctr),en,en,en,en,en,en,en,en,en,en,en,en ,.
$ docgeolocation(fctr),,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
$ authorgeolocation(fctr),,,位于华盛顿州西雅图的Nymaverse的LexopleX,
$ listoflinks(fctr),http://cnn.it/1f7kFn ,, http://bit.y/1r9hKj,
$ tags(fctr),,,,,,,,,,,,,繁荣,,,,,,,,,
$ retweet(lgl)FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,
我是Rstudio的新手,我遵循Datacamp和varianceexplained的教程。但目前还不清楚我如何绘制我的数据集。如何在Rstudio中绘制这些数据?我试过hist(tweets_english)但我得到的错误x必须是数字。那么如何在Rstudio中绘制这些数据呢?我该如何删除缺失的值?例如,在docgeolocation,有很多缺失值。
非常感谢!如果你有一个有用的网站来了解更多Rstudio,这将是伟大的!
答案 0 :(得分:1)
我会尽力帮助你。你问,
如何在Rstudio中绘制此数据?我试过hist(tweets_english)但是我 得到错误x必须是数字。那么我该如何绘制这些数据呢? Rstudio?
如果要尝试直方图,则必须在数据中指定要计算的列。因此,如果您有一个数据框tweets_english
,并且想知道retweets
的计数,您可以尝试:
hist(tweets_english$retweets)
如何删除缺失的值?例如在 docgeolocation有很多缺失的值。
处理缺失值本身就是一个主题,但为了简单起见,您可以使用na.omit()
从R数据框中删除所有缺少值的行。同样,这将删除包含缺失值的整个行,这可能不是您想要的。
tweets_english <- na.omit(tweets_english)
如果你想以不同的方式对待你的遗失值,或者不想丢失整行,我建议谷歌搜索一些关于如何估算缺失值的讲座或文章。
Roger Peng的This video教会了我很多。 YouTube上有很多东西,只需浏览一下。