python - 朴素的贝叶斯特色向量在pmml

朴素的贝叶斯特色向量在pmml

时间：2014-11-25 23:31:48

标签： python machine-learning scikit-learn pmml

我正在尝试为我在scikit中构建的Naive Bayes模型构建我自己的pmml导出器。在阅读PMML文档时，似乎对于每个特征向量，如果它是离散的，则可以根据计数数据输出模型，如果是连续的，则可以作为高斯/泊松分布输出模型。但我的scikit学习模型的系数是根据特征的经验对数概率，即p（y | x_i）。是否可以根据这些概率而不是计数来指定贝叶斯输入参数？

1 个答案:

答案 0 :(得分：1)

由于Naive Bayes模型的PMML表示通过＆＃34; PairCounts＆＃34;来实现表示联合概率。元素，可以简单地用概率输出（而不是对数概率）替换该比率。由于最终概率是标准化的，因此差异并不重要。如果要求涉及大量为0的可能性，那么＆＃34;阈值＆＃34;模型的属性可用于设置此类概率的默认值。

如何改善朴素贝叶斯的特征选择？
NLTK朴素贝叶斯分类器情绪不正确的特征选择
朴素的贝叶斯特色向量在pmml
Naive Bayes示例中的特征独立性？
具有交叉/正交特征集的朴素贝叶斯分类器？
R中的朴素贝叶斯 - 处理给定类的所有0的特征向量
朴素贝叶斯的特征选择
如何在天真的贝叶斯中获得功能重要性？
在朴素贝叶斯中获得功能重要性
获取功能重要性PySpark Naive Bayes分类器

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？