我们还是来看看关于西瓜分类的问题:
色泽 | 敲声 | 纹理 | 好瓜 |
青绿 | 浊响 | 清晰 | 是 |
乌黑 | 沉闷 | 清晰 | 是 |
乌黑 | 浊响 | 清晰 | 是 |
青绿 | 沉闷 | 清晰 | 是 |
浅白 | 浊响 | 清晰 | 是 |
乌黑 | 沉闷 | 模糊 | 否 |
青绿 | 清脆 | 清晰 | 否 |
浅白 | 清脆 | 模糊 | 否 |
浅白 | 浊响 | 模糊 | 否 |
青绿 | 浊响 | 模糊 | 否 |
朴素贝叶斯的思想是从概率的角度出发,计算训练样本中不用情况下出现不同结果的概率,然后对目标样本根据其特征值计算它属于每一个分类的概率,找出概率最高的分类即为预测值。例如:对于一个“色泽浅白、敲声沉闷、纹理清晰”的西瓜是好瓜还是坏瓜呢?我们首先来看一下贝叶斯定理:
具体来说,就是已知在B条件下A的概率即:
在这里我们假设每一个特征概率都是相互独立的即朴素的,所以我们也称这种分类方法为“朴素贝叶斯分类器”。所以有:
于是我们得到了“色泽浅白、敲声沉闷、纹理清晰”是好瓜的概率为0.74074,由于我们的目标分类只有两种取值“是”或“不是”,所以概率值大于0.5则为好瓜,小于0.5则不是好瓜。
Copyright © 2015-2023 问渠网 辽ICP备15013245号