通过模式创建新组

时间:2019-06-18 17:27:55

标签: python machine-learning

我有包含有关某些产品的数据的JSON,并且已经通过pandas将其转换为平面表,因此现在我有几列包含数据。我手动选择了一些产品,并将它们分成一组。例如,我已经按名称对它们进行了排序,但是这比较复杂,还有一些功能和要求需要检查。 因此,我想要创建一个脚本,该脚本将按照与我根据自己的想法手动创建的那几个组相似的方式对产品进行分组。 我是机器学习的新手,但是我读了这本书,还看了一些教程,但是我还没有看到这种情况。 我看到,例如,如果我使用KNN分类器,则必须输入存在的每个组,然后它将单个产品分配给那些组中的一个,但是在我的情况下,这一定更复杂,因为我想从中进行选择脚本以自己的方式创建这些组,然后由我选择。

我当时正在考虑无监督的机器学习,但这看起来不像是解决方案,因为我有自己想提供的数据,看来我需要在监督的机器学习中使用某种混合方式。

data = pd.read_json('recent.json')['results']
data = json_normalize(data)
le = preprocessing.LabelEncoder()
product_name = le.fit_transform(data['name'])

只是一些代码来显示我所做的事情

我不知道我想要的是什么,我已经通过If和循环的事情以正常方式尝试了此问题,而无需机器学习,但我希望我也可以以“更智能”的方式做到这一点< / p>

1 个答案:

答案 0 :(得分:0)

以上代码未显示任何内容。如果您有一些产品的数据,例如每个条目都包含字段,则可以使用KNN进行分类,这是一种不可替代的方法。

  

我必须输入每个存在的组

不,只需定义两个条目之间的度量,然后该方法便会根据该方法生成类或整个树状图,因此您可以根据需要从树状图中选择类。如果您查看那里的每个节点,它将包含类中各项的共同特征,因此它可以自动描述一个类。