Question

任何人都知道如何消除报废文本中的这些差距，因为它很难将它们存储在csv文件中。 html在“用户名”类中有很多空白，如下图所示。

for i in range(0,2):
    link = (df.link.iloc[i])
    source1 = urllib.request.urlopen(link).read()
    soup1 = bs.BeautifulSoup(source1,'lxml')
    for username in soup1.find_all('div', class_="user-name"):
        print (username.get_text())
#    for time in soup1.find_all('div',class_="thread-ago"):

example = open('generalinfo.csv','w')
wr = csv.writer(example,quoting = csv.QUOTE_ALL)        
wr.writerows(lists)    
example.close()

Answer 1

使用

username.get_text().strip()

剥离空白。

报废后我的文字中仍然存在一些空白

1 个答案: