防止美丽汤关闭我的标签

时间:2018-08-17 16:44:56

标签: php python html parsing beautifulsoup

我用PHP导入页眉和页脚,在其中我关闭了头部,开始并关闭了正文,并关闭了html。像这样:

<html>
<head>
<?php include ('Header.php');?>
CODE
<?php include ('Footer.php');?>

美丽的汤试图通过插入标签来修复我的“残破”标签来解决此问题。

<html>
<head>
<?php include ('Header.php');?>
</head><body> <-------------------------
CODE
<?php include ('Footer.php');?>
</body></html>  <-------------------------

我知道Beautiful Soup可以按预期工作,但是如何删除添加的标签,或者使Beautiful Soup不添加它们。我已经尝试了lxml解析器,但确实做了同样的事情。谢谢。

1 个答案:

答案 0 :(得分:-1)

致电BeautifulSoup时,您要选择哪种解析器?

尝试使用Python默认解析器:

soup = BeautifulSoup(your_html, 'html.parser')