如何在python上编辑CSV文件以进行情感分析

时间:2018-03-24 14:30:33

标签: python csv dataset

我有一个用于情绪分析的CSV文件数据集。 文件的组织方式是第一列是索引,第二列是“情感”。标签和第三个是情感文本'。

  , Sentiment   ,SentimentText
0 ,      0          "...."
1 ,      1          "...."
2 ,      0          "...."

我想编辑这个文件,以便所有带有标签0的句子都会出现在标签为1的所有句子之后。 我怎么能用python做到这一点?

1 个答案:

答案 0 :(得分:0)

首先使用pandas将csv文件作为Dataframe对象加载到Python中,并确保将文件的第一列作为索引而不是列:

import pandas as pd
df = pd.read_csv('path/to/file.csv', index_col=0)

然后按照'Sentiment列'对列进行排序,使用方法.sort_values():

df = df.sort_values(by=['Sentiment'], ascending=False)

更多信息:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_values.html