您好我想问一下......有没有办法从网站上读取一些我不拥有的信息
就像我想阅读某个网站上每个页面的标题一样......我可以这样做吗?
不是一种只是为了阅读明文而没有html代码想要阅读的黑客攻击方式
我不知道该怎么做或怎么做我需要一个想法
有没有办法搜索几个网站中的特定单词和api用它来搜索网站
答案 0 :(得分:1)
您仍然必须阅读HTML,因为标题的传输方式如何。
使用HttpWebRequest类向Web服务器和HttpWebResponse发出请求以获取响应,并使用GetResponseStream()方法发送响应。然后你需要以某种方式解析它。
查看HTMLAgilityPack以解析HTML。您可以使用它来从HTML中获取title元素并阅读它。然后,您可以获取页面中的所有锚元素,并确定下一个要访问其网站的主题元素以扫描标题。
答案 1 :(得分:0)
.Net可以使用强大的HTML解析器,可以与XPATH一起使用来读取HTML页面, HTML Agility pack
或者
你可以使用内置的WebClient
类从页面获取数据作为字符串,然后进行字符串操作。