替换div中的文本

时间:2012-05-27 20:09:28

标签: c#-4.0 replace

我有很多html文件,我想为所有属于特定div的href标签添加一个rel =“nofollow”。

我认为c#代码可以做到。但是我如何只关联部分代码..?

有什么建议吗?我也不知道

1 个答案:

答案 0 :(得分:0)

以下是我的想法:

  1. 逐行解析HTML
  2. 寻找“阻止开始你需要找到”/ div>“的方法。
  3. 将“”之间的所有内容存储到字符串
  4. 检查是否找到“href =”以及有多少
  5. 现在再次解析此字符串以搜索所有“”并与“href =”counter
  6. 匹配
  7. #5将为您提供一系列基于“href =”标签的行
  8. 现在您可以假设每个“href =”标记都必须包含“>”在“结束时”

最后这就是你可以做的事情:

 string s1 = "<a href=\"mylink\"> this is link </a>";
 string s2 = s1.Insert(s1.IndexOf(">"), " rel=\"nofollow\"");