Pandas pd.DataFrame转换为元组而不是Dataframe

时间:2016-09-05 23:26:46

标签: python pandas dataframe

我首先使用BeautifulSoup:

mydivs = soup.findAll('div', {"class": "content"})

以便mydiv中的每个mydivs看起来像这样:

<div class="content">A number of hats by me <br/><br/>three now though ... </div>

然后我想将每个div中的每个文本块存储为数据帧中的行。我希望数据框看起来像:

index posts
0     <div class="content">A number of  <br/><br/>three  ... </div>
1     <div class="content">Stack ... <br/><br/>overflow  ... </div>
...

这是我试过的代码

A=[]
indices=[]
j=0

for div in mydivs:
    A.append(div)
    indices.append(j)
    j+=1

DF = pd.DataFrame({'index': indices, "posts": A})

当我打印出shape我得到

print DF.shape()
TypeError: 'tuple' object is not callable

但是,我希望DF是数据框,而不是tuple。我该如何解决这个问题?

1 个答案:

答案 0 :(得分:4)

shape是DF的属性。该属性为tuple。您试图使用引发错误的()来调用它。如果您想要形状,请执行DF.shape

print DF.shape

<强>

print DF.shape()