Question

我有一个包含长文本的文件，每个文本都用双引号引起来，如下所示：

"blah1 balah1 ..... "
"blah2 blah2 ......."
"blah3 blah3 ......."
"...."

我想用这些项目中的一栏（“文字”）制作一个dataFrame。我尝试过：

data = pd.read_csv(data_path+'/test.csv')
data.head(10)

输出类似于：

blah1 blah1....
0 blah2 blah2
1 blah3 blah3
....

似乎除了第一行，它可以检索其他行。我如何能像其他人一样拥有第一行？

Answer 1

使用参数names来指定列，则不需要header=None：

import pandas as pd

temp=u'''"blah1 balah1"
"blah2 blah2"
"blah3 blah3"'''
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), names=['text1'])
print (df)
          text1
0  blah1 balah1
1   blah2 blah2
2   blah3 blah3

如何阅读使用熊猫引号的文本文件

1 个答案: