从网站获取特定文本(html)

时间:2013-10-17 08:28:37

标签: c# javascript html visual-studio web

我想制作一个小程序,以便我可以快速轻松地收听这个电台。

http://www.offradio.gr/player

问题在于我无法想办法获得现在播放的曲目名称,制作人的姓名和播放历史。

我考虑过从网站的原始源代码中提取特定数据,但源代码就像4,000行代码 - 对我来说太过分了。

有什么想法吗?

我正在使用Visual Studio和C#

1 个答案:

答案 0 :(得分:0)

我知道这不是最好的方式,但它是一个起点并且有效:

public Form1()
{
    InitializeComponent();

    webBrowser1.DocumentCompleted += webBrowser1_DocumentCompleted; // Subscribe event

    webBrowser1.Navigate("http://www.offradio.gr/player"); // Navigate to radio stream
}

private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
    /*
    Look for the element containing the element with the track number
    I've chosen this one because it has an ID means it's always the same div
    */
    HtmlElement parent = webBrowser1.Document.GetElementById("show_info");

    if (parent != null) // This event fires multiple times. Sometimes this element hasn't been created yet
    {
        /*
        We know it's a childless node inside `#show_info`.
        So let's just search for it.
        */
        foreach (HtmlElement child in parent.GetElementsByTagName("span"))
        {
                if (child.Children.Count == 0) // Check if it has children
                {
                    string title = child.InnerText; // The result
                    break;
                }
            }
        }
    }

不幸的是,我不得不使用.NET函数,使用JS我会更容易:

document.querySelector('#show_info .field-content').innerText

<强>更新

让我再给你一个提示。

查看document.getElementById('show_info').innerText的输出。

你可能会解析它并且你已经完成了!

希望有所帮助