我正在寻找一种在C#中复制Web浏览器“另存页面为”功能(另存为Type =文本文件)的方法。
难题:我试图使用WebClient和HttpWebRequest从网页上下载所有文本。两种方法都只返回不包含动态内容的网页HTML。
示例代码:
string url = @"https://www.canadapost.ca/cpotools/apps/track/personal/findByTrackNumber?trackingNumber=" + package.Item2 + "&LOCALE=en";
try
{
System.Net.ServicePointManager.SecurityProtocol = System.Net.SecurityProtocolType.Tls11 | System.Net.SecurityProtocolType.Tls12;
using (WebClient client = new WebClient())
{
string content = client.DownloadString(url);
}
}
上面的示例返回了没有页面跟踪事件的HTML。
当我在Firefox中显示页面时,右键单击该页面,然后选择“页面另存为”并另存为“文本文件”,所有原始文本都保存在文件中。我想模仿这个功能。
答案 0 :(得分:0)
如果要抓取显示动态内容的网页,则基本上有2个选项: