我想根据类别列表(例如编程,健康,素食,计算机科学,数学)确定给定URL作为输入的类别。
cats = [ "programming", "health", "raw vegan food", "vegan cooking", "computer science", "math" ]
def getCategory(url, cats):
...
我想这样做,而无需下载大量数据来获取类别。我已经搜索了很多可用的东西,但是我开始信息过载,丢失了很多关于NLP,主题建模的数据。
我找到了gensim库,但不确定它是否能够进行此转换。 所以,如果你能提供一定的指导,那将非常有用。