如何自动将网站标记为电子商务

时间:2019-05-16 16:43:12

标签: python classification e-commerce

我有一个网站URL列表,我想根据其性质自动对其进行分类(例如:电子商务网站,博客,新闻报纸网站,论坛等)

例如,我正在考虑寻找所有这些类型共同使用的模式:

  • 电子商务:添加到图表按钮,购物篮

  • 博客:大量文本内容(比率文本与链接)

  • 新闻纸:新鲜文章

  • 论坛:不知道

您能建议我使用其他逻辑吗?更好的是不必搜寻整个网站来做出决定。我猜只有抓取给定的URL才能完成这项工作(或者至少也抓取首页)

或者可能已经有一些python库完成了这项工作?

谢谢

0 个答案:

没有答案