我在R上读了很多书,我相信它可能对我所涉及的反向关键字分类很有用。
我在我的网站上有一个搜索词列表,需要与相关类别匹配。
在一些URL之下,我可以从中推断出每个语料库的类别和关键字。该网站有400多个不同的“家庭”。
ironmongery-security/cctv/kits
heating-plumbing/radiators/central-heating-radiators
auto-cleaning/tools-parts/torque-wrenches
这些可能是我需要分类的关键字示例
neoprene sheet
fuse wdu 2.5
cctv monitor
multimeter
temperature data logger
msr127tp
ip rating
torque wrench
我认为我需要通过拆分URL来构建聚类或语料库,但是我无法考虑以后应该如何构建数据框来支持我的任务。
任何人都可以分享一些信息吗?
期望的输出将是知道例如torque wrench
属于第三个URL,最后一个家族。 CCTV监视器属于第一个URL,第二个级别。