我有一个巨大的HTML文件,我正在尝试格式化,以便能够将内容导入到其他应用程序中。剩下的一件事是我需要完全从HTML中删除所有alt属性。它们都有不同的价值,其中大约有5000个,所以很明显是一个直接的发现和替换不是一种选择。也许有一种方法可以在Visual Web开发人员中找到并替换正则表达式?
我可用的工具/技能是:HTML,Javascript,ASP(经典),一点点.NET,Visual Web Developer Express 2010,但我能找到的唯一类似的东西是基于PHP的,他们不会我完整地解释了我是否可以设置解决方案并将HTML提供给它。
我发现了这样的东西:Regular expression to replace several html attributes,它提供了类似的东西的正则表达式函数的建议,但我甚至不确定如何在直接的HTML文件上运行正则表达式函数(我的浏览器是努力克服HTML文件的大小,所以我不认为javascript会削减它。)
有人能建议最好的方法吗?
谢谢大家......
答案 0 :(得分:1)
由于您使用Visual Studio,您可以尝试使用Regex搜索&替换选项,尽管Visual Studio中的正则表达式的实现与其他正则表达式引擎完全不同。
这是一篇关于它的简短文章: http://www.codinghorror.com/blog/2006/07/the-visual-studio-ide-and-regular-expressions.html
正如文章中所说,内置的正则表达式引擎并不理想。他们提到了一个带有实现标准正则表达式的插件: http://www.codeproject.com/Articles/9125/Standard-Regular-Expression-Searcher-Addin-For-VS