可视化数据R

时间:2016-05-02 15:06:14

标签: r

$ date(fctr)01-07-14 02:30,01-07-14 02:30,01-07-14 02:30,01-07

$ author(fctr)techkennels,PreDraX,SeattleGOP,MrP。

$ body(fctr)@ AC360 @JohnBerman @arwaCNN @Ali_H_Soufan @CNN,“@ cn。

$ doclang(fctr),en,en,en,en,en,en,en,en,en,en,en,en ,.

$ docgeolocation(fctr),,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,

$ authorgeolocation(fctr),,,位于华盛顿州西雅图的Nymaverse的LexopleX,

$ listoflinks(fctr),http://cnn.it/1f7kFn ,, http://bit.y/1r9hKj

$ tags(fctr),,,,,,,,,,,,,繁荣,,,,,,,,,

$ retweet(lgl)FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,

我是Rstudio的新手,我遵循Datacamp和varianceexplained的教程。但目前还不清楚我如何绘制我的数据集。如何在Rstudio中绘制这些数据?我试过hist(tweets_english)但我得到的错误x必须是数字。那么如何在Rstudio中绘制这些数据呢?我该如何删除缺失的值?例如,在docgeolocation,有很多缺失值。

非常感谢!如果你有一个有用的网站来了解更多Rstudio,这将是伟大的!

1 个答案:

答案 0 :(得分:1)

我会尽力帮助你。你问,

  

如何在Rstudio中绘制此数据?我试过hist(tweets_english)但是我   得到错误x必须是数字。那么我该如何绘制这些数据呢?   Rstudio?

如果要尝试直方图,则必须在数据中指定要计算的列。因此,如果您有一个数据框tweets_english,并且想知道retweets的计数,您可以尝试:

hist(tweets_english$retweets)
  

如何删除缺失的值?例如在   docgeolocation有很多缺失的值。

处理缺失值本身就是一个主题,但为了简单起见,您可以使用na.omit()从R数据框中删除所有缺少值的行。同样,这将删除包含缺失值的整个行,这可能不是您想要的。

tweets_english <- na.omit(tweets_english)

如果你想以不同的方式对待你的遗失值,或者不想丢失整行,我建议谷歌搜索一些关于如何估算缺失值的讲座或文章。

Roger Peng的

This video教会了我很多。 YouTube上有很多东西,只需浏览一下。