任何人都知道如何消除报废文本中的这些差距,因为它很难将它们存储在csv文件中。 html在“用户名”类中有很多空白,如下图所示。
for i in range(0,2):
link = (df.link.iloc[i])
source1 = urllib.request.urlopen(link).read()
soup1 = bs.BeautifulSoup(source1,'lxml')
for username in soup1.find_all('div', class_="user-name"):
print (username.get_text())
# for time in soup1.find_all('div',class_="thread-ago"):
example = open('generalinfo.csv','w')
wr = csv.writer(example,quoting = csv.QUOTE_ALL)
wr.writerows(lists)
example.close()
答案 0 :(得分:0)
使用
username.get_text().strip()
剥离空白。