我有以下熊猫数据框数据集:
A:
col1 col2
0 5 3
1 5 4
B:
col1 col2
0 6 4
1 2 4
我的列表:
[24.5, 65.4]
假设我有三十个A,B,my_list对的数据集,它们具有不同的值集。在数据框A和B中的一个或两个中更改单个或多个值会影响my_list中的值。
假设我要在my_list中实现[65.0,46.21],我需要找出A,B数据帧中需要存在哪些值。
我正在寻找建议,什么是解决此问题的最佳方法?一个简单的ML算法?深度学习模型?如果是这样,我应该使用哪一个?
请注意,我的数据集只有30个,我正在寻求一个尽可能接近所需的my_list值的值。
任何建议将不胜感激。
答案 0 :(得分:1)
听起来像您需要回归算法。
我可以将您的任务转换为:给定8个位置输入,找到一个通用公式,该公式会产生最接近所需输出的输出。这是一个典型的回归问题,您可以使用许多强大的工具。
鉴于您的数据集很小,最好从简单的算法(例如线性回归)开始,然后在必要时使用更复杂的算法(例如支持向量机)。