确定给定URL的类别

时间:2017-01-26 23:25:07

标签: python text-classification

我想根据类别列表(例如编程,健康,素食,计算机科学,数学)确定给定URL作为输入的类别。

cats = [ "programming", "health", "raw vegan food", "vegan cooking", "computer science", "math" ]

def getCategory(url, cats):
  ...

我想这样做,而无需下载大量数据来获取类别。我已经搜索了很多可用的东西,但是我开始信息过载,丢失了很多关于NLP,主题建模的数据。

我找到了gensim库,但不确定它是否能够进行此转换。 所以,如果你能提供一定的指导,那将非常有用。

0 个答案:

没有答案