我有一个包含长文本的文件,每个文本都用双引号引起来,如下所示:
"blah1 balah1 ..... "
"blah2 blah2 ......."
"blah3 blah3 ......."
"...."
我想用这些项目中的一栏(“文字”)制作一个dataFrame
。我尝试过:
data = pd.read_csv(data_path+'/test.csv')
data.head(10)
输出类似于:
blah1 blah1....
0 blah2 blah2
1 blah3 blah3
....
似乎除了第一行,它可以检索其他行。我如何能像其他人一样拥有第一行?
答案 0 :(得分:1)
使用参数names
来指定列,则不需要header=None
:
import pandas as pd
temp=u'''"blah1 balah1"
"blah2 blah2"
"blah3 blah3"'''
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), names=['text1'])
print (df)
text1
0 blah1 balah1
1 blah2 blah2
2 blah3 blah3