找到没有美丽汤汁的html身体?

时间:2019-09-06 00:50:03

标签: python regex recompile

我一直试图用美丽的汤来找到食物
但是现在我很好奇地找到了没有beautifulsoup的

使用重新编译方法我应该如何找到

  

重新导入

</head>  
<body>
<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&

</body>

我尝试了

re.findall('<body>(.*?)</body>', html, re.DOTALL)

但找不到任何东西

1 个答案:

答案 0 :(得分:0)

如果必须的话,似乎可能只是缺少r

import re

exp = """

</head>  
<body>
<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&

</body>
"""

print(re.findall(r"<body>(.*?)</body>", exp ,re.DOTALL))

输出

['\n<a href="https://programmers.co.kr/learn/courses/4673"></a>#!MuziMuzi!)jayg07con&&\n\n']