将CSV文件的不同部分分开?

时间:2019-11-29 17:35:41

标签: python pandas csv

我是新手,我有一个csv文件,其中包含reddit,subreddit,时间和消息的帐户名。

我的阅读方式是:

train_data = pd.read_csv("addres/train_data.csv", encoding="utf8")

如果我写: train_data.head()我看到

documentation

您知道一种可以使用[author,body]创建数组的方法吗?

首先,我尝试以这种方式创建两个数组(作者和消息):

train=open("addres/train_data.csv")
train.readline()
author=[]
message=[]
for line in train:
    autore,categoria,ora, messaggio=line.split(",")
    author.append(autore)
    message.append(messaggio)

但是消息中包含“,”,因此无法正常工作。

谢谢您,为这个愚蠢的问题感到抱歉。

1 个答案:

答案 0 :(得分:1)

df_tmp = train_data[['author', 'body']] # allows you to select subset by column name
content_array = [list(x) for x in df_tmp.values] # a list of lists ([ith_author, ith_body])

请记住,df_tmp只是train_data的view,您可能想根据自己的意愿制作一个copy。如果您需要数据不可变,则可以使用tuples