我正在寻找一种方法,根据标题层次结构将HTML转换为文本和数组的数据对象,如下所示:
<h1>Title 1</h1>
<p>Lorem Ipsum 1</p>
<p>Lorem Ipsum 2</p>
<h2>Title 1.1</h2>
<p>Lorem Ipsum 3</p>
<p>Lorem Ipsum 4</p>
<p>Lorem Ipsum 5</p>
<h3>Title 1.1.1</h3>
<p>Lorem Ipsum 6</p>
<p>Lorem Ipsum 7</p>
<h2>Title 1.2</h2>
<p>Lorem Ipsum 8</p>
要翻译成这样的东西:
{
"Title 1": [
"Lorem Ipsum 1",
"Lorem Ipsum 2", {
"Title 1.1": [
"Lorem Ipsum 3",
"Lorem Ipsum 4",
"Lorem Ipsum 5",
{
"Title 1.1.1": [
"Lorem Ipsum 6",
"Lorem Ipsum 7"
]
}
]
},
{
"Title 1.2": [
"Lorem Ipsum 8"
]
}
]
}
&#13;
关于库或方法的任何想法,我可以有效地进行此操作吗?