我有以下
<INPUT type=hidden value=2 name=hidItemCount>
<INPUT type=hidden value="2;undefined;1;SR;Name=Created 12-May-10;Use Selected=;
DS Mnemonic=L#%%902;List Size=2;Created=Aug 6 2009 ;Amended=May 12 2010 ;|undefined;1;SR;Name=Created 12-May-10;
Use Selected=;DS Mnemonic=L#ABCD12;List Size=2;Created=Apr 15 2010 ;Amended=May 12 2010 ;|" name=hidItemData>
由此我需要找出 DS Mnemonic 的值
L#%%902 and L#ABCD12
。在这种情况下
最好的方法是什么?任何正则表达式?
到目前为止,我的方法是
string source = "<INPUT type=hidden value=2 name=hidItemCount>";
source += "<INPUT type=hidden value=2;undefined;1;SR;Name=Created 12-May-10;Use Selected=;";
source +="DS Mnemonic=L#%%902;List Size=2;Created=Aug 6 2009 ;Amended=May 12 2010 ;|undefined;1;SR;Name=Created 12-May-10;";
source +="Use Selected=;DS Mnemonic=L#ABCD12;List Size=2;Created=Apr 15 2010 ;Amended=May 12 2010 ;| name=hidItemData> ";
string[] seperator = new string[] { "DS Mnemonic=" };
string[] arr1 = source.Split(seperator, StringSplitOptions.None).Skip(1).ToArray();
//final result
string[] arr2 = arr1.ToList().Select(i => i.Split(';').First()).ToArray();
使用C#3.0
答案 0 :(得分:1)
以下代码段使用正则表达式
返回助记符的所有值 Regex r;
Match m;
r = new Regex(@"Mnemonic=(\S*);",
RegexOptions.IgnoreCase | RegexOptions.Compiled);
for (m = r.Match(source); m.Success; m = m.NextMatch())
{
Console.WriteLine(m.Groups[1] + " at "
+ m.Groups[1].Index);
}
(\ S *);表示您查找零个或多个以; 结尾的非空格字符。
答案 1 :(得分:0)
public static List<String> getProperty(HtmlDocument document, string element, string attribute, string value) {
HtmlElementCollection elems = document.GetElementsByTagName(element);
List<String> ret = new List<String>();
foreach(HtmlElement elem in elems) {
String valueAtr = elem.GetAttribute(attribute);
if(!String.IsNullOrEmpty(valueAtr)) {
var pos = valueAtr.indexOf(value);
while(pos != -1) {
valueAtr = valueAtr.Substring(pos + value.Lenght + 1); // L#%%902;List Size=2;Cr
res.Add(valueAtr.SubString(valueAtr.indexof(';')));
pos = valueAtr.indexOf(value);
} //while
} //if
} // for
返回; }
我不确定100%索引的这项工作可能是错误的。