R阅读推文问题:Created_At是NA

时间:2017-02-12 21:14:43

标签: r date datetime twitter

我有推特的CSV文件,其中包含以下列:

created_at | text | lon | lat 

我正在使用以下内容阅读:

tweets_df <- read.csv("mytweets.csv", header=TRUE, StringsAsFactors=FALSE)

但是,当我输入:

tweets_df$created_at

一切都只是NA。

这是相同“created_at”条目的示例:

Thu Sep 15 23:59:16 +0000 2016

后来我打算使用其中一种方法将其转换为更易于管理的格式,但我甚至无法正确阅读...我在这里做错了什么?

time_format <- "%a %b %d %H:%M:%S %z %Y"
tweet_df$created_at <- as.POSIXct(striptime(tweet_df$created_at, time_format, tz="GMT"), tz="GMT)

但是,是否可以帮助我弄清楚为什么他们只是以NA身份阅读?

编辑:修正了它;需要做以下事情:

tweets_df <- read.csv("myweets.csv", header=TRUE, StringsAsFactors=FALSE, fileEncoding="latin1")

fileEncoding =“latin1”修复了它!

1 个答案:

答案 0 :(得分:0)

需要使用fileEncoding =&#34; latin1&#34;在read.csv中。修好了!