我掌握了HtmlAgilityPack。我试图从预加载的页面获取数据。即: 有一页1.htm。 我想从表格#34;操作系统"对面的表中获取值。 (文件本身附上)。 我这样做:
private void simpleButton1_Click(object sender, EventArgs e)
{
// Создаю экземпляр класса
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
// Загружаю файл
doc.Load(@"D:\(тут путь к файлу)\1.htm");
// Пытаюсь получить информацию из ноды, но получаю null
HtmlAgilityPack.HtmlNode bodyNode = doc.DocumentNode.SelectSingleNode("//TD[@CLASS=pt]");
...
一般来说,有必要从文件中提取大量信息,但我认为如果获得一行,那么可以进一步类比。
所需的行如下:
private void simpleButton1_Click(object sender, EventArgs e)
{
// Создаю экземпляр класса
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
// Загружаю файл
doc.Load(@"D:\(тут путь к файлу)\1.htm");
foreach (HtmlAgilityPack.HtmlNode node in doc.DocumentNode.SelectNodes("//body/table[2]/tr[8]/td[4]"))
{
string stroka = node.InnerText;
}
但这个选项在前额上是#34;"如果您不更改我的文档的结构。在搜索的帮助下如何做到这一点还没有想到。
答案 0 :(得分:0)
这将按名称返回表的字典。每个表都是一个字典,第一列为键,第二列为值。
var tables = new Dictionary<string, Dictionary<string, string>>();
var doc = new HtmlDocument();
doc.Load(@"D:\(тут путь к файлу)\1.htm", Encoding.GetEncoding(1251), false);
var tableNames = doc.DocumentNode.SelectNodes("//td[@class='pt']/a").Select(a=>a.Attributes["name"].Value);
foreach(string name in tableNames)
{
var table = doc.DocumentNode.SelectSingleNode("//table[.//a[@name='" + name + "']]/following-sibling::table[1]");
int columns = table.SelectNodes(".//tr[1]/td").Count();
string[] keys = table.SelectNodes(".//tr/td["+(columns-1)+"]").Select(n => n.InnerText.Replace(" "," ").Trim()).ToArray();
string[] values = table.SelectNodes(".//tr/td["+columns+"]").Select(n => n.InnerText.Replace(" "," ").Trim()).ToArray();
var body = new Dictionary<string, string>();
for (int i = 0; i < keys.Count(); i++)
{
string key = keys[i];
if (body.ContainsKey(key))
body[key] += ", " + values[i];
else if( key!="" && values[i]!="")
body[key] = values[i];
}
tables.Add(name, body);
}
例如tables["power management"]
返回4个条目:
- [0] {[Текущийисточникпитания,Электросеть]} System.Collections.Generic.KeyValuePair
- [1] {[更多信息,Нетбатареи]} System.Collections.Generic.KeyValuePair
- [2] {[Полноевремяработыотбатарей,Неизвестно]} System.Collections.Generic.KeyValuePair
- [3] {[Оставшеесявремяработыотбатарей,Неизвестно]} System.Collections.Generic.KeyValuePair
和tables["power management"]["Текущий источник питания"]
返回:
“Электросеть”
对于迭代,你可以这样做:
foreach(var tableName in tables.Keys)
{
var table = tables[tableName];
foreach(var key in table.Keys)
{
string value = table[key];
Debug.Print(tableName + "/" + key + "/" + value);
}
}