Question

美好的一天，我想解析网站表中的内容。在网站上有一个Top Weekly Exp Players排名。随着命令〜每周我想要击败最好的20名球员。现在我有以下代码：

commands.CreateCommand("weekly")
            .Do(async (e) =>
            {
                WebClient webClient = new WebClient();
                string html = webClient.DownloadString("http://combatarms.nexon.net/de/ranking/player");

                HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
                doc.LoadHtml(html);

                foreach (var cell in doc.DocumentNode.SelectNodes("//table[@class='ranking_tbl']/tr/td"))
                {
                    await e.Channel.SendMessage(cell.InnerText);
                }

               // await e.Channel.SendMessage("test"); 
            });

但它没有向我显示任何东西，为什么我错了？一个更好的事情是我可以做一个数组（以前有它但没有工作）我可以说“我只想要第一个<tr>（＃），第二个<tr>（名称），例如第7 <tr>（Clanname）。

但我失败了数组+解析这些tr内容到discord：/

例如，表中的1行是：

<table class="ranking_tbl" summary="">
            <colgroup>
                <col width="80">
                <col width="250">
                <col width="100">
                <col width="150">
                <col width="100">
                <col width="100">
                <col width="280">
            </colgroup>
            <thead>
                <tr>
                    <th></th>
                    <th>Name </th>
                    <th>Rang </th>
                    <th>EP </th>
                    <th>KDR </th>
                    <th>Land </th>
                    <th>Clan- </th>
                </tr>
            </thead>
            <tbody>
                <tr>
                    <td class="cell_left">1</td>
                    <td><a href="/de/profile/player/RADICALIST">RADICALIST</a></td>
                    <td><img src="http://caimage.nexoneu.com/Rank/rank_51.gif" alt=""></td>
                    <td>5.219.130</td>
                    <td>1,46</td>
                    <td><img src="http://caimage.nexoneu.com/Web_site/Main/img/flag/SI.png" alt=""></td>
                    <td><a href="/de/clan/profile/Jasmine%20Thompson">Jasmine Thompson</a></td>
                </tr>

Answer 1

我认为表中的内容是动态生成的，页面中的一些javascript代码会生成它。但是在加载文档后加载此动态内容。因此，当您下载页面时，您无法获得所有内容你可以在这里阅读更多相关信息：
htmlagilitypack and dynamic content issue
webclient doesn't download the web page completely
Load dynamically generated HTML Code in WebClient
How to extract dynamic ajax content from a web page
Scraping data dynamically generated by JavaScript in html document using C#

我如何解析Discord Chat中的HTML表格内容？ Discord.NET C＃

1 个答案: