汽车制造商和型号有几个数据集。每个包含数百个数据条目,如下所示:
梅赛德斯GLK 350 W2
Prius Plug-in Hybrid Advanced Toyota
通用汽车别克君威2012 GS 2.4L
如何仅使用这些文件自动将上述条目划分为制造商(例如丰田)和型号(例如Prius Plug-in Hybrid Advanced)?
提前致谢。
答案 0 :(得分:1)
机器学习(ML)通常依赖于 训练数据 ,它允许ML逻辑生成并验证基础数据的模型。使用这个模型,它可以推断出呈现给它的新数据类(在分类器应用程序中,作为手头的数据)或推断某个变量的值(在回归情况下,如下所示,比方说,ML应用程序预测特定区域下个月将会收到的降雨量。)
问题中提出的情况在几个层面上有点令人费解
首先,汽车制造商的数量是有限的,而且相对较小。因此,很容易手动制作这些制造商的清单,然后简单地使用这个词典从型号中解析出制造商,使用普通的字符串解析技术,即这里不需要ML或甚至不需要ML。 (唉,要求一个人使用"...only those files"
似乎排除了这个选项
其次,人们可以想到一些可以用来产生所需分类器的模式或启发式方法(暂时是一个相对较弱的分类器,因为想到ATM的模式/启发式方法似乎相对不可靠)。此外,这种方法在对该词的共同理解中也不是一种ML方法。