为什么在下载html并将其作为文件保存在硬盘上时,html文件内容与view-source内容不同?

时间:2015-02-22 10:31:37

标签: c# html .net winforms

这是原始的html网址:http://www.tapuz.co.il/forums2008/forumpage.aspx?forumid=393&pagenumber=1

Original Link

这就是我下载html的方式:

private void GetHtml()
        {
            for (int i = 1; i < 2; i++)
            {
                webclient.DownloadFile(sourceUrl + i, combinedHtmlsDir + "\\Page" + i + ".html");
            }
        }

我正在保存的html文件的内容是:这是内容的第一行:

<!DOCTYPE html>
<html>
<head>
        <meta http-equiv="X-UA-Compatible" content="IE=edge" />

        <meta name="description" content="פורום מזג האוויר - תפוז פורומים, קהילות בכל נושא שבעולם. בואו לדבר על מזג האוויר במערכת הפורומים הטובה ביותר ברשת." />

        <meta name="keywords" content="פורום, פורומים, קהילות, מאמרים, מידע, דיון, תגובות ,תפוז, תפוז אנשים,מזג האוויר" />

这是页面视图的顶行 - 来源:

<!DOCTYPE html>
<html>
<head>
        <meta http-equiv="X-UA-Compatible" content="IE=edge" />

        <meta name="description" content="מתעניינים במזג האוויר? רוצים לקבל מידע אונליין על המתרחש? היכנסו לפורום מזג אוויר בתפוז!" />

        <meta name="keywords" content="פורום, פורומים, קהילות, מאמרים, מידע, דיון, תגובות ,תפוז, תפוז אנשים,מזג האוויר, מזג אויר, חיזוי, אקלים, אטמוספירה, גשמים, חום, קור, משקעים, גשם, רוחות, רוח, עננות, עננים, ענן, צירוס, קומולוס, צירוסים, קומולוסים, קרה, ברד, קר, חם, מזג אוויר, לחות, nzd vtuuhr, דני רופ, מטאורולוג" />

内容不一样。如何下载view-source的相同内容?可能是我正在下载的链接与view-source one不同?

我现在也测试了如果我正在浏览网页到页面然后右键单击鼠标并进行保存并将其保存为:网页,HTML只有那时我的硬盘上的html文件很好磁盘大小为311KB。

但是使用我的程序,硬盘上的html文件大小只有77KB。

我无法弄清楚为什么它没有在我的程序中保存与html文件相同的内容和大小,就像我正在保存为。

2 个答案:

答案 0 :(得分:0)

也许你不下载真正的源代码,而是下载解释代码。

请参阅https://stackoverflow.com/a/13070367/4592312

答案 1 :(得分:0)

如果页面是动态的(内容会发生变化),我怀疑您的问题是视图来源与下载之间的内容发生了变化。

如果情况不是这样,那么检查浏览器/ js是否更改了您在视图源中看到的DOM树,或者网站可能会根据用户代理更改其内容。