如何阅读使用熊猫引号的文本文件

时间:2019-02-28 08:46:24

标签: python pandas dataframe

我有一个包含长文本的文件,每个文本都用双引号引起来,如下所示:

"blah1 balah1 ..... "
"blah2 blah2 ......."
"blah3 blah3 ......."
"...."

我想用这些项目中的一栏(“文字”)制作一个dataFrame。我尝试过:

data = pd.read_csv(data_path+'/test.csv')
data.head(10)

输出类似于:

blah1 blah1....
0 blah2 blah2
1 blah3 blah3
....

似乎除了第一行,它可以检索其他行。我如何能像其他人一样拥有第一行?

1 个答案:

答案 0 :(得分:1)

使用参数names来指定列,则不需要header=None

import pandas as pd

temp=u'''"blah1 balah1"
"blah2 blah2"
"blah3 blah3"'''
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), names=['text1'])
print (df)
          text1
0  blah1 balah1
1   blah2 blah2
2   blah3 blah3