当我使用此功能时:
soup = BeautifulSoup(sock,'html.parser')
for string in soup.stripped_strings:
if string == "$":
pass
else:
print string
它打印出以下值,跳过$:
the
cat
has
nine
lives
如果我想将此信息保存到数据库中,这是最好的方法吗?
最后我想要的是一个包含| | cat | has | nine | lives |
的表答案 0 :(得分:0)
您可以将字符串索引为数组,因此您可以使用字符串[0] =='$'或string.startswith()。 e.g。
strings = ['$', 'the', '$big', 'cat']
for s in strings:
if s[0] != '$':
print(s)
for s in strings:
if not s.startswith('$'):
print(s)
您还可以使用以下列表推导直接制作已过滤的列表:
nodollarstrings = [s for s in strings if not s.startswith('$')]