我有一个项目,我已导出一个html文件进行清理,以准备语言翻译。问题是内部链接没有“.html”扩展名。我已经解决了擦除长文件路径的问题,但附加剩余文件是问题所在。
原始文件路径为:
HREF =“https://oldsite.com/folder1/folder2/folder3/actualpage
我使用此正则表达式查找“https://oldsite.com”和子文件夹的所有实例,并根据我拥有的子文件夹数量进行调整: (https://oldsite.com)+/[a-zA-Z0-9]+/[a-zA-Z0-9] \ W + / [A-ZA-Z0-9] \ W + / [A-ZA-Z0-9] \ W + / [A-ZA-Z0-9] \ W +
留下“href =”actualpage“
理想的结果应该是: HREF = “actualpage.html”
我已经研究了几个小时了,无法弄清楚如何在页面上附加“.html”。
我甚至对可以自动完成此过程的应用程序或脚本持开放态度。
提前致谢。
答案 0 :(得分:0)
经过一些研究和一些教程后,我发现了一个正则表达式。在将文件路径缩短到一个级别后,我使用了以下内容:
在Dreamweaver中:
<强>查找强>:
href="(.*)" title=
<强>替换强>
href="$1.html" title=
我执行了大量的查找/替换,并且能够在几分钟内修复1500个文件。正则表达是我的果酱!
我希望这有助于像我一样的其他正则表达式。