协助清洁数据收集输出

时间:2019-07-09 01:01:24

标签: python python-3.x beautifulsoup

我是Python的新手,我想知道什么是清除代码输出的最佳方法。这是我到目前为止的内容:

# DNH KDR Checker

import time
import urllib.request
import csv
from datetime import datetime
from bs4 import BeautifulSoup

print("Please Enter SteamID64")
player = input()

dnh = 'https://pug.districtnine.host/profile?id=' + str(player)
page = urllib.request.urlopen(dnh)
soup = BeautifulSoup(page, 'html.parser')

kdr_value = soup.find(class_="col-md-3")

print(kdr_value.prettify())

当我输入Steam64ID时(在本例中为76561198802827420),输出如下所示:

<div class="col-md-3">
 <h4>
  <i class="fas fa-crosshairs">
  </i>
  Kills: 1717
 </h4>
 <h4>
  <i class="fas fa-skull">
  </i>
  deaths:
  <strong>
   1462
  </strong>
  <br/>
 </h4>
 <h4>
  <i class="fas fa-dot-circle">
  </i>
  kdr: 1.17
  <br/>
 </h4>
</div>

但是我希望它像这样出来:

Kills: 1717
Deaths: 1462
KDR: 1.17

1 个答案:

答案 0 :(得分:0)

这很简单。要删除HTML标记,请使用BeautifulSoup的{​​{3}}函数。

在最后一行中,将打印语句替换为:

print(kdr_value.get_text())

现在,您将获得以下输出:

Kills: 1717
deaths: 1462
kdr: 1.17