我正在组建一个Forum Stats网站,我需要在几个论坛上找到活跃会员的数量。
许多人都列出了“会员总数”,但这对我没有帮助。
我认为“活跃”是指在过去几个月中至少发布过5次的人。
我真的很困惑如何做到这一点。有什么建议吗?
答案 0 :(得分:2)
如果您无权访问数据库,请抓取html页面,跟踪链接,并确定发布日期和时间。来自HTML本身的后用户似乎只能通过gp。 (HTTPRequest
或cURL
用于获取,与DOMDocument
/ DOMXpath
结合使用以进行可靠的HTML解析和查找显式节点),将其存储在您自己的数据库中。总而言之,取决于论坛的确切HTML布局,不是很复杂,而是很多工作,并且可能需要一次又一次地重复,每个不同的论坛都会有小的变化。
如果论坛有RSS源或其他获取更多结构化内容/数据的方法,则可以大大减少所需的工作量。