我试图从chatzy.com获取数据,特别是其中一个房间。例如,取http://us19.chatzy.com/72966652423259 - 这是房间里面的URL,但如果你试图用python从中获取数据,请使用请求库(下面的代码)而不是给你这样:
不重要的html不重要的html:
<P class="a"><B style="color:#000000;">William</B>: test</P>
<P class="a"><B style="color:#000000;">William</B>: test1</P>
<P class="a"><B style="color:#000000;">William</B>: test2</P>
<P class="a"><B style="color:#000000;">William</B>: test3</P>
<P class="a"><B style="color:#000000;">William</B>: test4</P>
<P class="a"><B style="color:#000000;">William</B>: test5</P>
它为我提供了view-source:http://www.chatzy.com/72966652423259的html,它只是查看首页。 我并不关心头版 - 我的最终目的是能够每次都阅读用户+消息。如果谁比我更了解Python,可以提供帮助,我们将非常感激。
目前代码非常基础,只是从网站检索数据:
import requests
z = requests.get("http://www.chatzy.com/72966652423259")
content = str(z.content) # because z.content is binary
print(content)