我几乎没有html文件,每个文件中都有8-10个合并的html页面。所有这些都由页面/文件名和<!DOCTYPE html ...标记分隔。
如何分隔这些单独的页面/文件并用各自的名称保存?
答案 0 :(得分:1)
我编写了nodejs程序来解决您的问题:
const fs = require('fs')
const fileName = process.argv.slice(-1)[0]
const file = fs.readFileSync(fileName, 'utf-8')
let fileRest = file
const htmlEndTag = '</html>'
while (true) {
const end = fileRest.indexOf(htmlEndTag)
if (end === -1) {
break
}
const oneFile = fileRest.slice(0, end + htmlEndTag.length)
const match = oneFile.match(/\(([a-zA-Z0-9_-]+)\)/)
const name = match[1]
const content = oneFile.slice(match[0].length + match.index)
fileRest = fileRest.slice(oneFile.length)
fs.writeFile(name + '.html', content, () => {
console.log('Done writing', name)
})
}