我想知道从网站提取数据并将其解析为我们自己的代码以将其呈现给用户的方法。 例如:考虑一个应用程序,其中用户键入电影名称,所有海报都从各种网站获取,如IMDb等。或者用户输入电影名称,并获取IMDb中的所有数据。我知道用于从IMDb获取数据的某些第三方API服务,例如omdbapi和imdbapi,但我想知道从任何类型的网站这样做的方法,而不仅仅是IMDb。 在这方面我是一个完整的新手,所以请从一开始就指导我。我想在Visual Studio中使用C#和XAML在Windows 8商店应用程序中执行此操作。
答案 0 :(得分:0)
简单的方法是使用网站的RSS源。您可以找到任何网站的RSS订阅源。您所要做的就是使用Web请求对象将参数作为查询字符串传递。在响应流中,他们将拥有您想要的所有细节,可以在c#中解析并进行处理。
答案 1 :(得分:0)
对于任何网站都没有标准的方法 您必须为要从中获取内容的每个网站编写算法
的HttpClient 是您在应用中获取网页内容的工具
答案 2 :(得分:0)
结帐YQL: Yahoo Query Language是一种富有表现力的类SQL语言,允许您跨Web查询,过滤和连接数据。
答案 3 :(得分:0)
您应该使用Html Agility Pack。
为了获得更好的性能,请在Azure上托管您的抓取服务。