我有一个.html文件只包含文本(以某种方式格式化)。我想知道是否有办法复制所有文本(如果使用ctrl + A)并将其分配给字符串所以我可以然后将其导出到.txt文件?所有这些必须从代码隐藏中发生(打开html,选择文本并将其分配给字符串)。
在Microsoft.Office.Interop
我记得有一个复制活动窗口选择的选项,所以我想知道这是否可行而且在这里。
答案 0 :(得分:1)
使用HttpAgilityPack。有人可能会说它过分了,但明天你会问我们如何转换&代码;在文件中,第二天你会问别的东西。
答案 1 :(得分:0)
使用它来读取文件
using (StreamReader sr = new StreamReader("TestFile.html"))
{
String line = sr.ReadToEnd();
Console.WriteLine(line);
}
http://msdn.microsoft.com/en-us/library/db5x7c0d.aspx
这是从url读取的
WebClient client = new WebClient();
String htmlCode = client.DownloadString("http://test.com/file.html");