我想创建一个机器人来查找我定义的网站中的新闻,所以我的机器人从网站上获取html代码,我应该找到html代码的新闻部分。例如,我应该找到的模式之一是这样的:
<li><a href="/news?p_p_id=56_INSTANCE_tVzMoLp4zfGh&_56_INSTANCE_tVzMoLp4zfGh_mode=news&_56_INSTANCE_tVzMoLp4zfGh_newsId=3206056&p_p_state=maximized">بازدید رئیس هیئت عامل صندوق نوآوری و شکوفایی از خبرگزاری مهر</a></li>
我想知道如何在C#的html代码中找到这些模式。我用Google搜索了一下,发现了类似regular expression
的内容。
但在正则表达式中,我无法定义模式。我可以定义这样的模式吗?有这种复杂性吗?