将一个大的html文件拆分为较小的文件

时间:2019-01-24 18:05:37

标签: html wordpress file import

我有一个带有数百个<li>标签的HTML文件。我想要的是将每个标签的内容复制到一个新文件中。文件名不重要。目的是使用HTML Import for wordpress将其添加为帖子。那我该怎么办呢?

4 个答案:

答案 0 :(得分:1)

假设您使用php编写代码,则在带有替换替换的文本编辑器中,可以将那些li转换为php数组,然后循环并创建新文件。

答案 1 :(得分:0)

复制带有所有<li>标签的零件并将其粘贴到名为list.html的文件中。

然后使用jQuery将list.html包含到您的主要html文件中。您可以将其粘贴到您的主要html文件中:

<html> 
  <head> 
    <script src="jquery.js"></script> 
    <script> 
    $(function(){
      $("#includedContent").load("list.html"); 
    });
    </script> 
  </head> 

  <body> 
     <div id="includedContent"></div>
  </body> 
</html>

答案 2 :(得分:0)

如果您只是想从标记之间获取数据,则可以使用此正则表达式(?<=<li\>)(.*?)(?=<\/li>),该正则表达式应该仅与<li>标记匹配,而在它们之外不匹配任何内容。

答案 3 :(得分:0)

我的解决方法是,首先将每个crlf替换为空格,然后将每个<li>标签替换为crlf,然后使用此vbscript将每一行拆分为一个新文件:

Set FileSystem = CreateObject("Scripting.FileSystemObject")
strFile = "index.html"
Set input = FileSystem.OpenTextFile(strFile)
cnt = 0
Do Until input.AtEndOfStream
  strLine = input.ReadLine
  Set output = FileSystem.CreateTextFile("part" & Right("000" & cnt, 3) & ".html", 2, False)
  output.WriteLine(strLine)
  output.Close
  cnt = cnt + 1
Loop
input.Close