正则表达式在jvm中的大文件

时间:2019-06-24 10:40:17

标签: java regex kotlin stack-overflow

我有一个很大的html文件,我想用kotlin或java解析它,我正在尝试  首先匹配<body</body>之间的所有内容 使用像

这样的简单正则表达式
<body(.|\n)+</body>

但是我肯定会遇到stackOverFlow错误, 这是Kotlin中的代码

//original html
val file= File("""/home/yazan/Documents/books.xml""")

//empty file
val file2= File("""/home/yazan/Documents/books2.xml""")

val reg="""<body(.|\n)+</body>""".toRegex()
val text= reg.find(file.readText())
text?.value?.let { file2.writeText(it) }

如何以内存有效的方式对大文件进行正则表达式?

0 个答案:

没有答案