我正在将HTML代码抓取到R中,我遇到的问题之一是,有时许多HTML代码任务都写在一行上,如下所示。
我正在尝试解析行,以便其整洁和所有任务都按行格式设置,如下所示。
<html>
<head>
<!-- Document created using Wdesk 1 -->
<!-- Copyright 2018 Workiva -->
<title>Document</title>
</head>
<body style="font-family:Times New Roman;font-size:10pt;">
<div> Stuff_1 info in here </div></div> <div> Stuff_2 info in here </div></div>
</body>
</html>
对此
<html>
<head>
<!-- Document created using Wdesk 1 -->
<!-- Copyright 2018 Workiva -->
<title>Document</title>
</head>
<body style="font-family:Times New Roman;font-size:10pt;">
<div> Stuff_1 info in here </div></div>
<div> Stuff_2 info in here </div></div>
</body>
</html>
如何解析多任务HTML代码,写在一行上?谢谢。