Question

我有一个带有数百个<li>标签的HTML文件。我想要的是将每个标签的内容复制到一个新文件中。文件名不重要。目的是使用HTML Import for wordpress将其添加为帖子。那我该怎么办呢？

Answer 1

假设您使用php编写代码，则在带有替换替换的文本编辑器中，可以将那些li转换为php数组，然后循环并创建新文件。

Answer 2

复制带有所有<li>标签的零件并将其粘贴到名为list.html的文件中。

然后使用jQuery将list.html包含到您的主要html文件中。您可以将其粘贴到您的主要html文件中：

<html> 
  <head> 
    <script src="jquery.js"></script> 
    <script> 
    $(function(){
      $("#includedContent").load("list.html"); 
    });
    </script> 
  </head> 

  <body> 
     <div id="includedContent"></div>
  </body> 
</html>

Answer 3

如果您只是想从标记之间获取数据，则可以使用此正则表达式(?<=<li\>)(.*?)(?=<\/li>)，该正则表达式应该仅与<li>标记匹配，而在它们之外不匹配任何内容。

Answer 4

我的解决方法是，首先将每个crlf替换为空格，然后将每个<li>标签替换为crlf，然后使用此vbscript将每一行拆分为一个新文件：

Set FileSystem = CreateObject("Scripting.FileSystemObject")
strFile = "index.html"
Set input = FileSystem.OpenTextFile(strFile)
cnt = 0
Do Until input.AtEndOfStream
  strLine = input.ReadLine
  Set output = FileSystem.CreateTextFile("part" & Right("000" & cnt, 3) & ".html", 2, False)
  output.WriteLine(strLine)
  output.Close
  cnt = cnt + 1
Loop
input.Close

将一个大的html文件拆分为较小的文件

4 个答案: