标签: python classification e-commerce
我有一个网站URL列表,我想根据其性质自动对其进行分类(例如:电子商务网站,博客,新闻报纸网站,论坛等)
例如,我正在考虑寻找所有这些类型共同使用的模式:
电子商务:添加到图表按钮,购物篮
博客:大量文本内容(比率文本与链接)
新闻纸:新鲜文章
论坛:不知道
您能建议我使用其他逻辑吗?更好的是不必搜寻整个网站来做出决定。我猜只有抓取给定的URL才能完成这项工作(或者至少也抓取首页)
或者可能已经有一些python库完成了这项工作?
谢谢