Question

我目前正在尝试分析通过Python收集的Twitter数据，该数据另存为制表符分隔的CSV文件。但是，当我尝试将其读入R时会出现问题。数据由8列组成（例如，col1：Twitter ID，col2：推文日期，... col4：推文消息。col9：位置信息）。

因此，我希望每一行包含所有数据点的那八列信息。但是，出于某种原因，在col4中，只需要发送tweet消息，就可以在该特定单元格中显示多个字段（即，从col1到8的其他行的信息）。

下面是我尝试运行的代码。这很奇怪，因为当我在python中读取此CSV文件时未出现此问题。我只是不知道发生了什么事。有人遇到过类似的问题吗？

data <- read.csv("Blacklives.csv", header = F, sep = '\t')

data <- read.csv2("Blacklives.csv", header = F, sep = '\t')

data <- read.delim2("Blacklives.csv", header = F, sep = '\t')

data <- read.delim2("Blacklives.csv", header = F, sep = '\t')

因此，我将尝试为我的错误提供更多信息。 python生成的初始数据看起来像.csv格式。看起来有点怪异，但数据以制表符分隔.csv file from Python。但是，当我将这些数据读入R中时（我将其读入R中并将其重新保存为.csv，以便向您显示存在问题的单元格的行），某些单元格（即，应包含一个人发来的推文的单元格）具有其中包含大量信息。请参阅下面的单元格中包含的信息示例。 .csv file from R

将Python创建的CSV（制表符分隔）文件读取到R

0 个答案: