我有推特的CSV文件,其中包含以下列:
created_at | text | lon | lat
我正在使用以下内容阅读:
tweets_df <- read.csv("mytweets.csv", header=TRUE, StringsAsFactors=FALSE)
但是,当我输入:
tweets_df$created_at
一切都只是NA。
这是相同“created_at”条目的示例:
Thu Sep 15 23:59:16 +0000 2016
后来我打算使用其中一种方法将其转换为更易于管理的格式,但我甚至无法正确阅读...我在这里做错了什么?
time_format <- "%a %b %d %H:%M:%S %z %Y"
tweet_df$created_at <- as.POSIXct(striptime(tweet_df$created_at, time_format, tz="GMT"), tz="GMT)
但是,是否可以帮助我弄清楚为什么他们只是以NA身份阅读?
编辑:修正了它;需要做以下事情:tweets_df <- read.csv("myweets.csv", header=TRUE, StringsAsFactors=FALSE, fileEncoding="latin1")
fileEncoding =“latin1”修复了它!
答案 0 :(得分:0)
需要使用fileEncoding =&#34; latin1&#34;在read.csv中。修好了!