我有一个用于情绪分析的CSV文件数据集。 文件的组织方式是第一列是索引,第二列是“情感”。标签和第三个是情感文本'。
, Sentiment ,SentimentText
0 , 0 "...."
1 , 1 "...."
2 , 0 "...."
我想编辑这个文件,以便所有带有标签0的句子都会出现在标签为1的所有句子之后。 我怎么能用python做到这一点?
答案 0 :(得分:0)
首先使用pandas将csv文件作为Dataframe对象加载到Python中,并确保将文件的第一列作为索引而不是列:
import pandas as pd
df = pd.read_csv('path/to/file.csv', index_col=0)
然后按照'Sentiment列'对列进行排序,使用方法.sort_values():
df = df.sort_values(by=['Sentiment'], ascending=False)
更多信息:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_values.html