我正在尝试从网站获取具体信息。现在我有这个html字符串,你可以看到我的代码,网站的html源代码放在“responseText”。我知道我可以用If的声明做到这一点,但这真的很乏味。我是新手,所以我不知道我在做什么。我确信必须有另一种更简单的方法从网站检索信息......这是Windows商店的c#所以我不能使用webclient。这个代码获取字符串,但是有没有办法我可以删除html代码,只留下变量或什么?我只是想为网页做这个,我知道我想要的变量,因为我查看了网页的html代码。这不是一种通过网站上的信息请求变量列表的方法吗?我有点迷失在这里。所以基本上我只想从c#网站获取具体信息,我正在为windows商店制作应用程序。
StringBuilder sb = new StringBuilder();
// used on each read operation
byte[] buf = new byte[8192];
// prepare the web page we will be asking for
HttpClient searchClient;
searchClient = new HttpClient();
searchClient.MaxResponseContentBufferSize = 256000;
HttpResponseMessage response = await searchClient.GetAsync(url);
response.EnsureSuccessStatusCode();
responseText = await response.Content.ReadAsStringAsync();
答案 0 :(得分:0)
此代码获取字符串,但是有没有办法可以删除html代码并只保留变量或其他内容?
什么"变量"?您获得了HTML - 这是来自Web服务器的响应。如果你想剥离那个HTML,这取决于你。您可能希望使用HTML Tidy使其更愉快,但从HTML中提取相关信息的业务由您自己决定。 HTML并不是作为原始信息源设计为机器可读的 - 它意味着要标记以呈现给人类。
您应该调查信息是否在更加机器友好的源中可用,没有演示信息等。例如,可能有某种方式将数据作为JSON或XML获取。