我用PHP导入页眉和页脚,在其中我关闭了头部,开始并关闭了正文,并关闭了html。像这样:
<html>
<head>
<?php include ('Header.php');?>
CODE
<?php include ('Footer.php');?>
美丽的汤试图通过插入标签来修复我的“残破”标签来解决此问题。
<html>
<head>
<?php include ('Header.php');?>
</head><body> <-------------------------
CODE
<?php include ('Footer.php');?>
</body></html> <-------------------------
我知道Beautiful Soup可以按预期工作,但是如何删除添加的标签,或者使Beautiful Soup不添加它们。我已经尝试了lxml解析器,但确实做了同样的事情。谢谢。
答案 0 :(得分:-1)
致电BeautifulSoup时,您要选择哪种解析器?
尝试使用Python默认解析器:
soup = BeautifulSoup(your_html, 'html.parser')