我正在尝试一个小程序来下载网页并收集一些数据。 该程序适用于大多数网页。但是,下载Twitter搜索结果存在问题。 下载程序似乎只获得了Twitter主页。我正在使用WinInet进行下载。
注意到Twitter使用“#!”在它的网址。 (www.twitter.com /#!/ ......)。这与此有关吗?
感谢有关如何处理此问题的任何建议。
由于
答案 0 :(得分:0)
如果您想从Twitter收集一些数据,您应该使用他们的API。
答案 1 :(得分:0)
只需删除hashbang就可以了。但是,使用API更合适。
答案 2 :(得分:0)
您可能成为缓存的牺牲品,尤其是URL中的#。尝试INTERNET_FLAG_RELOAD |对于HttpOpenRequest或InternetOpenURL中的dwFlags,INTERNET_FLAG_NO_CACHE_WRITE(忽略缓存并从网络重新加载|不要为缓存写入响应)。 您也可以尝试URLEncoding#。