使用C#从Web获取HTML字符串,但不包含数据部分

时间:2018-10-05 15:22:33

标签: c# html parsing uwp web-crawler

我正在尝试在我的UWP应用中从网页(https://finance.naver.com/sise/sise_trans_style.nhn)中获取数据。
我在项目中编写以下源代码。

public class MainPageViewModel : Observable
{
    public string urlAddress = "https://finance.naver.com/sise/sise_trans_style.nhn";
    public string data { get; set; }

    public MainPageViewModel()
    {
        ButtonClick = new RelayCommand(Click);
    }

    public async void Click()
    {
        HttpClient httpClient = new HttpClient();
        Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
        var result = await httpClient.GetStringAsync(new Uri(urlAddress));
        data = result;
        OnPropertyChanged("data");
    }
    public RelayCommand ButtonClick { get; set; }
}

但是,问题是我没有获取文档的数据部分。下图描绘了我想要获取的文档部分。
the part that i want to get

在“数据”变量中,获得无数据的文档对我来说是最重要的部分。我可以得到其他HTML部分。

我试图弄清楚数据来自哪里,或哪个来源可以帮助我获取数据。但我失败了。
数据是由javascript制作的吗? .. ajax ...,以及如何从该网页获取数据? ..如果我下次遇到此类问题,我该如何找出原因?

(编辑)添加了HTML源代码。以及更多指定内容。

当我看到带有源代码的HTML DOCS时,可以获得以下内容。

<div class="box_type_m">
    <iframe name="time" src="/sise/investorDealTrendTime.nhn?bizdate=20181005&sosok=" width="100%"  height="380" marginheight="0" bottommargin="0" topmargin="0" SCROLLING="no" frameborder="0" title="시간별 순매수"></iframe>
</div>  

但是iframe还有另一个html源(包含头部和身体)。

1 个答案:

答案 0 :(得分:2)