我有一个很大的html文件,我想用kotlin或java解析它,我正在尝试
首先匹配<body
和</body>
之间的所有内容
使用像
<body(.|\n)+</body>
但是我肯定会遇到stackOverFlow错误, 这是Kotlin中的代码
//original html
val file= File("""/home/yazan/Documents/books.xml""")
//empty file
val file2= File("""/home/yazan/Documents/books2.xml""")
val reg="""<body(.|\n)+</body>""".toRegex()
val text= reg.find(file.readText())
text?.value?.let { file2.writeText(it) }
如何以内存有效的方式对大文件进行正则表达式?