我有一个用大量线条导出的文件。我希望能够将文件解析成一个我可以轻松使用的简洁顺序。
我在这里有一个示例字符串:
<a href="http://www.foxnews.com/us/2010/07/28/cemetery-allows-father-war-veteran-fly-flag-grave/?test=latestnews">deal reached on cemetery flags</a>
| <a href="#" onclick="foxgrabplayer('4295654','','grave insult to grieving family');return false;"><img src="/i/redes/icon-video.gif"></a><br>
- <a href="http://www.foxnews.com/politics/2010/07/27/obama-missing-historic-boy-scout-jamboree-fundraisers-view-taping/">obama skips out on scouts for 'the view'</a><br>
- <strong class="em">you decide: </strong><a href="http://www.foxnews.com/opinion/2010/07/27/decide-right-obama-miss-boy-scout-jamboree/">right call?</a></li>"
所有这一切都是1行。我希望它输出如下:
http://www.foxnews.com/us/2010/07/28/cemetery-allows-father-war-veteran-fly-flag-grave|Deal reached on cemetery flags
http://www.foxnews.com/politics/2010/07/27/obama-missing-historic-boy-scout-jamboree-fundraisers-view-taping|obama skips out on scouts for 'the view
对行中每个href的www |描述。希望这是有道理的!
答案 0 :(得分:1)
我真的不想这样说。使用正则表达式。 href="(.*?)"
应该为你提供所有的href。可能需要一些调整来消除你不想要的东西。这是一篇关于实施http://oreilly.com/windows/archive/csharp-regular-expressions.html
答案 1 :(得分:0)
看一下Html Agility Pack。第一个示例处理hrefs:http://htmlagilitypack.codeplex.com/wikipage?title=Examples&referringTitle=Home。