C ++,从网站获取文本

时间:2010-05-03 02:11:03

标签: c++

我被告知必须使用winsock,但我不知道从哪里开始。例如,我试图访问,让我们说http://www.newegg.com/,我试图获得只有三个首页产品的文本标题。任何帮助是极大的赞赏。 :d

7 个答案:

答案 0 :(得分:4)

我还建议libcurl这类事情。

您也可以使用cURL命令行工具生成示例代码,这有助于实验。

答案 1 :(得分:1)

W3.org本身为Http请求提供了样本C / C ++库。

找到他们here

具体来说,寻找HTTPReq.c

答案 2 :(得分:1)

使用boost库和poco。它们都为网络编程提供解决方案。 Boost还提供了精神库,您可以使用它来解析来自网站的数据。 Poco libraru还提供NetSSL,加密解决方案。

P.S。 boost :: spirit不是用于解析网站数据的库,它提供了解析字符串的解决方案......

答案 3 :(得分:0)

你需要打开一个插座。

然后你需要做一个http get

有点像: - http://www.esqsoft.com/examples/troubleshooting-http-using-telnet.htm

答案 4 :(得分:0)

您可以使用QNetworkAccessmanager中的Qt framework课程。

答案 5 :(得分:0)

我假设您需要使用c ++是出于某种原因,例如与现有软件集成,否则,根据其他一些建议,选择具有更方便框架的语言(例如:脚本语言)会更好适合这项任务。

如果你想避免弄脏WINSOCK,或者需要在Windows以外的平台上运行,你可以看一下使用boost asio库。

以下页面包含指向简单同步和异步http客户端的链接: http://www.boost.org/doc/libs/1_37_0/doc/html/boost_asio/examples.html

您可以在以下位置找到有关该库本身的文档: http://www.boost.org/doc/libs/1_37_0/doc/html/boost_asio.html

答案 6 :(得分:-3)

如果必须,请使用c ++,但使用python可能会少得多。

查看Python httplib模块,了解如何设置要从中提取的主机等。大多数平台都可以免费使用Python,就像C ++一样,你可以学习python的速度比你学习的快得多用c ++编写程序控制的浏览器。好吧,也许对于这个网站上的每个人来说都不是这样,但我敢打赌,对于我们这里的“大多数人”来说都是如此。我曾经几乎实时从CNN Money获得股票报价,而IIRC则是大约100行的python代码。

布袋