我在匹配文本时遇到了一些问题,无法从HTML页面中提取数据。这是我到目前为止所做的,但plainText
保持空白:
private void Scrape()
{
// create variables
string html;
string plainText;
// download page source
// sample URL: http://freekeywords.wordtracker.com/?seed=test&adult_filter=remove_offensive&suggest=Hit+Me";
html = webBrowser1.Document.Body.InnerText;
// scrape keywords
plainText = Regex.Match(html, @"class='k'[^x]display: none""", RegexOptions.IgnoreCase).Groups[1].Value;
//plainText = Regex.Replace(plainText, @"\,", Environment.NewLine);
//plainText = Regex.Replace(plainText, @"""", "");
this.richTextBox1.Text = html;
}
答案 0 :(得分:0)
您尝试从索引为1的组中获取值,但您的正则表达式不包含任何组。用户组[0],或简称Match.Value。