机器学习之朴素贝叶斯分类
朴素贝叶斯分类 朴素贝叶斯模型是一组非常简单快速的分类算法,通常适用于维度非常高的数据集。因为运行速度快,而且可调参数少,因此非常适合为分类问题提供快速粗糙的基本方案。
·
一、贝叶斯分类介绍
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。
许多网站上介绍贝叶斯分类都是许多人类看不懂的公式的堆叠,很简单的问题常常被复杂化,其实贝叶斯分类只需要记住一个公式即可(如果学过概率论的话):
如果没学过概率论的话,那就再记住一个公式:
那么,贝叶斯分类问题究竟是做什么呢? 其实,简单来讲,就是在满足某些条件(属性的情况下),让我们预测一下这个东西属于哪一类。
贝叶斯分类的本质是 —— 假设每个属性之间是相互独立的, 如果不是相互独立的,不能用贝叶斯来做
psps: 朴素贝叶斯分类之所以朴素,就是因为我们做了一个简单的假设,即类中特定特征的存在与任何其他特征的存在无关,这意味着每个特征彼此独立。因此对实际情况有所约束,如果属性之间存在关联,分类准确率会降低。不过在大多数应用的场景,朴素贝叶斯的分类效果都不错。
二、贝叶斯分类举例
例题如上,本题的目的是已知一名顾客,他的各个属性分别为(1)age <= 30;(2)Income = medium;(3)Student = yes;(4)Credit_rating = Fair,我们根据之前的知识,预测一下这个人会不会买电脑,即buys_computer = ‘yes’ 还是 'no’,以下是本题的参考解答:
三、优点
朴素贝叶斯算法的优点:
1. 算法逻辑简单,易于实现;
2. 分类过程中时空开销小;
3. 算法稳定,对于不同的数据特点其分类性能差别不大,健壮性好
更多推荐
已为社区贡献1条内容
所有评论(0)