我目前正在尝试分析通过Python收集的Twitter数据,该数据另存为制表符分隔的CSV文件。但是,当我尝试将其读入R时会出现问题。 数据由8列组成(例如,col1:Twitter ID,col2:推文日期,... col4:推文消息。col9:位置信息)。
因此,我希望每一行包含所有数据点的那八列信息。但是,出于某种原因,在col4中,只需要发送tweet消息,就可以在该特定单元格中显示多个字段(即,从col1到8的其他行的信息)。
下面是我尝试运行的代码。这很奇怪,因为当我在python中读取此CSV文件时未出现此问题。我只是不知道发生了什么事。有人遇到过类似的问题吗?
data <- read.csv("Blacklives.csv", header = F, sep = '\t')
data <- read.csv2("Blacklives.csv", header = F, sep = '\t')
data <- read.delim2("Blacklives.csv", header = F, sep = '\t')
data <- read.delim2("Blacklives.csv", header = F, sep = '\t')
因此,我将尝试为我的错误提供更多信息。 python生成的初始数据看起来像.csv格式。看起来有点怪异,但数据以制表符分隔.csv file from Python。但是,当我将这些数据读入R中时(我将其读入R中并将其重新保存为.csv,以便向您显示存在问题的单元格的行),某些单元格(即,应包含一个人发来的推文的单元格)具有其中包含大量信息。请参阅下面的单元格中包含的信息示例。 .csv file from R