如何过滤/排序/排序对象模型节点?

时间:2009-08-13 17:45:07

标签: artificial-intelligence filtering machine-learning classification bayesian

我有某种对象模型,我需要对某些属性的节点进行过滤和排序。有哪些自动化系统可以生成和选择与我想要的相关的对象模型的属性? (我故意是抽象和非特定的)

我正在考虑一种类似垃圾邮件过滤器或监督分类系统的系统,因为在给定示例数据集的情况下,它识别出找到感兴趣节点的规则。但是我正在寻找一个更通用的系统,因为它不需要任何关于对象模型的设计时间信息。它应该作为电子邮件上的垃圾邮件过滤器,代码库上的错误查找器,新闻组中的兴趣过滤器或社交网站上的机器人帐户查找器工作平等。只要它可以通过反射探索对象模型并给出一组“有趣”的节点,它应该能够找到能找到更多类似节点的规则。

1 个答案:

答案 0 :(得分:1)

单一的自动分类系统极不可能完成您所要求的所有工作。此外,我相信错误查找器应用程序不属于这样一个系统的范围,因为在该领域成功使用的方法主要围绕语法分析,数据流分析和其他高度针对软件错误问题量身定制的算法方法。虽然机器学习研究正在那里进行,但该领域的分类系统主要用于增强而不是取代分析方法(据我所知)。

对于大多数非平凡的分类问题,通常需要仔细选择和改进问题表示,以便通过机器学习获得有用和有效的结果。简单地使用现有的“原始”数据对象模型而没有对状态空间进行某种定制的转换倾向于导致输入数据值的分布的不完全覆盖和/或所学习的分类器的不良概括。另外,特定于所使用的机器学习方法的其他参数可能需要反复试验以获得针对给定问题的适当结果。并非所有方法都有这样的参数,但很多方法都有,例如神经网络,遗传算法,贝叶斯推理方法等。

您所要求的是一种几乎通用的机器学习方法,它不是目前存在的方法。我能看到的最可行的替代方案是(1)找到不同问题的子集,而这些问题不是所需的能力/复杂程度,或者(2)创建一个不仅使用一种分类技术而且使用其他分类技术的系统有一个不同方法的工具箱,它可以根据给定的问题自动测试,然后使用在监督学习制度下产生最佳分类结果的工具箱。虽然后者仍然是一个非常有效的挑战,但它并没有消除如何表示/转换数据模型的状态空间的问题。