我正在尝试使用JavaScript解析HTML文件(非严格的)
我的输出应该是相同的HTML文件,但我需要处理任何<script></script>
标记的内部内容。我有一个方法processScript(script)
来做那个..
我可以假设没有<script/>
标签。
我非常清楚如何使用split()
,但我想知道我是否可以使用正则表达式做得更好?
答案 0 :(得分:2)
使用Regex解析HTML通常不是最好的方法。相反,使用getElementsByName('script')
之类的方法来研究DOM解析。我还建议查看HTML DOM Objects上的w3schools示例,以帮助您开始朝着正确的方向前进。
为什么这是一个更好的方法有很多原因,其中一些是1)Javascript已经有这个DOM对象支持,并且它比使用Regex容易得多,2)匹配打开/关闭的语言标签(类似于匹配的parens / bracket / etc)不是常规语言。