如何处理<br/> <br/>就好像是/ p

时间:2019-04-09 22:28:49

标签: python beautifulsoup

一个表格单元格(第x行,第y列)有3个项目。当每个都是段落时,它们显示为3个项目{len(table [x] [y])= 3}。当它们由两个换行符分隔时,它们显示为9个项目{len(table [x] [y])= 9}。 我应该将它们更改为HTML文件中的段落还是使用汤库以某种方式处理?

    Plist = ''
    for u in range(len(table[x][8])):
        Plist = Plist+table[x][8][u]+', '
    Plist = Plist[:-2] # remove the last 2 characters, ', '
    test.write(table[x][1][0]+': '+ Plist+'\n')

错误是

   Plist = Plist+table[x][8][u]+', '

TypeError: must be str, not Tag

单元格中的项目为段落时没有问题。

我不确定是否与它有任何关系,但是对于具有一个项目或多个项目为段落的单元格,项目数(len)是正确的;当遇到一个单元格时,项目数(len)是正确的;当单元格为3时,行号分隔休息。

Ambient<br>
  <br>
  Cold<br>
  <br>
  Hot</span></p>

0 个答案:

没有答案