C#字符串解析问题

时间:2010-07-28 19:43:04

标签: c#

我有一个用大量线条导出的文件。我希望能够将文件解析成一个我可以轻松使用的简洁顺序。

我在这里有一个示例字符串:

<a href="http://www.foxnews.com/us/2010/07/28/cemetery-allows-father-war-veteran-fly-flag-grave/?test=latestnews">deal reached on cemetery flags</a>
| <a href="#" onclick="foxgrabplayer('4295654','','grave insult to grieving family');return false;"><img src="/i/redes/icon-video.gif"></a><br>
- <a href="http://www.foxnews.com/politics/2010/07/27/obama-missing-historic-boy-scout-jamboree-fundraisers-view-taping/">obama skips out on scouts for 'the view'</a><br>
- <strong class="em">you decide: </strong><a href="http://www.foxnews.com/opinion/2010/07/27/decide-right-obama-miss-boy-scout-jamboree/">right call?</a></li>"

所有这一切都是1行。我希望它输出如下:

http://www.foxnews.com/us/2010/07/28/cemetery-allows-father-war-veteran-fly-flag-grave|Deal reached on cemetery flags  
http://www.foxnews.com/politics/2010/07/27/obama-missing-historic-boy-scout-jamboree-fundraisers-view-taping|obama skips out on scouts for 'the view

对行中每个href的www |描述。希望这是有道理的!

2 个答案:

答案 0 :(得分:1)

我真的不想这样说。使用正则表达式。 href="(.*?)"应该为你提供所有的href。可能需要一些调整来消除你不想要的东西。这是一篇关于实施http://oreilly.com/windows/archive/csharp-regular-expressions.html

的文章

答案 1 :(得分:0)

看一下Html Agility Pack。第一个示例处理hrefs:http://htmlagilitypack.codeplex.com/wikipage?title=Examples&referringTitle=Home