在python中阅读中文csvfile

时间:2016-05-24 02:33:41

标签: python nlp

我正在尝试使用以下代码读取csv文件,但仍无法打印中文

#!/usr/bin/python
# -*- coding: utf-8 -*-

import pandas as pd 

df = pd.read_csv ('weibo_status.csv') status = df[1:]
#print (df.head)

我认为这可能是字符在数据框中的问题,因为以下代码在我的系统中工作正常(python 2.7,editor:pycharm)

#!/usr/bin/python
# -*- coding: utf-8 -*-

import jieba

seg_list = jieba.cut("我来到北京清华大学", cut_all=True) print("Full Mode: " + "/ ".join(seg_list))

weibo_status.csv

userid     status
1          我今天吃饭了
2          吃了水果
3          今天感冒了

2 个答案:

答案 0 :(得分:1)

尝试直接打印df,您可能会获得数据帧。 你可以尝试这样的事情:

import pandas as pd
df = pd.DataFrame(pd.read_csv('weibo_results.csv',encoding='utf-8'))  
print df['userid']
#or may be you can print to see the entire dataFrame like This (uncomment below)
#print df

对于你的python版本,这应该没问题。

答案 1 :(得分:0)

我发现了我的问题。我应该在用python

读取之前将csv文件转换为utf-8