Question

我有一个用于情绪分析的CSV文件数据集。文件的组织方式是第一列是索引，第二列是“情感”。标签和第三个是情感文本＆＃39;。

  , Sentiment   ,SentimentText
0 ,      0          "...."
1 ,      1          "...."
2 ,      0          "...."

我想编辑这个文件，以便所有带有标签0的句子都会出现在标签为1的所有句子之后。我怎么能用python做到这一点？

Answer 1

首先使用pandas将csv文件作为Dataframe对象加载到Python中，并确保将文件的第一列作为索引而不是列：

import pandas as pd
df = pd.read_csv('path/to/file.csv', index_col=0)

然后按照'Sentiment列'对列进行排序，使用方法.sort_values（）：

df = df.sort_values(by=['Sentiment'], ascending=False)