我首先使用BeautifulSoup:
mydivs = soup.findAll('div', {"class": "content"})
以便mydiv
中的每个mydivs
看起来像这样:
<div class="content">A number of hats by me <br/><br/>three now though ... </div>
然后我想将每个div
中的每个文本块存储为数据帧中的行。我希望数据框看起来像:
index posts
0 <div class="content">A number of <br/><br/>three ... </div>
1 <div class="content">Stack ... <br/><br/>overflow ... </div>
...
这是我试过的代码
A=[]
indices=[]
j=0
for div in mydivs:
A.append(div)
indices.append(j)
j+=1
DF = pd.DataFrame({'index': indices, "posts": A})
当我打印出shape
我得到
print DF.shape()
TypeError: 'tuple' object is not callable
但是,我希望DF
是数据框,而不是tuple
。我该如何解决这个问题?
答案 0 :(得分:4)
shape是DF
的属性。该属性为tuple
。您试图使用引发错误的()
来调用它。如果您想要形状,请执行DF.shape
print DF.shape
<强> 不 强>
print DF.shape()