Question

我正在尝试从网站获取具体信息。现在我有这个html字符串，你可以看到我的代码，网站的html源代码放在“responseText”。我知道我可以用If的声明做到这一点，但这真的很乏味。我是新手，所以我不知道我在做什么。我确信必须有另一种更简单的方法从网站检索信息......这是Windows商店的c＃所以我不能使用webclient。这个代码获取字符串，但是有没有办法我可以删除html代码，只留下变量或什么？我只是想为网页做这个，我知道我想要的变量，因为我查看了网页的html代码。这不是一种通过网站上的信息请求变量列表的方法吗？我有点迷失在这里。所以基本上我只想从c＃网站获取具体信息，我正在为windows商店制作应用程序。

     StringBuilder sb = new StringBuilder();
     // used on each read operation
    byte[] buf = new byte[8192];
    // prepare the web page we will be asking for
    HttpClient searchClient;
    searchClient = new HttpClient();
    searchClient.MaxResponseContentBufferSize = 256000;
    HttpResponseMessage response = await searchClient.GetAsync(url);
    response.EnsureSuccessStatusCode();
    responseText = await response.Content.ReadAsStringAsync();

Answer 1

此代码获取字符串，但是有没有办法可以删除html代码并只保留变量或其他内容？

什么＆＃34;变量＆＃34;？您获得了HTML - 这是来自Web服务器的响应。如果你想剥离那个HTML，这取决于你。您可能希望使用HTML Tidy使其更愉快，但从HTML中提取相关信息的业务由您自己决定。 HTML并不是作为原始信息源设计为机器可读的 - 它意味着要标记以呈现给人类。

您应该调查信息是否在更加机器友好的源中可用，没有演示信息等。例如，可能有某种方式将数据作为JSON或XML获取。

从网站C＃windows store app获取特定信息

1 个答案: