我有一个html文件,其中包含以下内容:
<li>
<a href="../index.html" name="" title="title1">title1</a>
</li>
<li>
<a href="level1/level1.html" name="" title="title2">title2</a>
</li>
<li>
<a href="levl1/level2/level2.html" name="" title="title3">title3</a>
</li>
我希望他们看起来像这样:
<li>
<a href="../" name="" title="title1">title1</a>
</li>
<li>
<a href="level1/" name="" title="title2">title2</a>
</li>
<li>
<a href="level1/level2/" name="" title="title3">title3</a>
</li>
我在Powershell中编写了一个脚本来操纵这些如下所示的href链接:
(Get-Content $i) -replace '/*.html', '/' | Set-Content $i
但是不知何故输出不会达到预期。知道我在做什么错吗?
答案 0 :(得分:2)
我会用这样的东西:
(Get-Content in.html) -replace '\/[a-zA-Z0-9_-]+\.html', '/' | Set-Content out.html
答案 1 :(得分:1)
我希望从标记的开头开始寻找更广泛的上下文,因为正则表达式可能会发现其他一些意外的模式
( Get-Content $i ) -ireplace '(<a\s+href="[^"]*/).*?(?=")','$1' | Set-Content $i
希望在第8行中有一个错字,否则您也可以在整个文件中从“ levl1 /”中创建“ level1 /”
( Get-Content $i ) -ireplace '(<a\s+href="[^"]*/).*?(?=")','$1' -ireplace 'levl1/','level1/' | Set-Content $i