机器学习笔记

    返回首页    发表留言
本文作者:李德强
          第一节 概率问题
 
 

        我们还是来看看关于西瓜分类的问题:

 

色泽 敲声 纹理 好瓜
青绿 浊响 清晰
乌黑 沉闷 清晰
乌黑 浊响 清晰
青绿 沉闷 清晰
浅白 浊响 清晰
乌黑 沉闷 模糊
青绿 清脆 清晰
浅白 清脆 模糊
浅白 浊响 模糊
青绿 浊响 模糊

         朴素贝叶斯的思想是从概率的角度出发,计算训练样本中不用情况下出现不同结果的概率,然后对目标样本根据其特征值计算它属于每一个分类的概率,找出概率最高的分类即为预测值。例如:对于一个“色泽浅白、敲声沉闷、纹理清晰”的西瓜是好瓜还是坏瓜呢?我们首先来看一下贝叶斯定理:

        具体来说,就是已知在B条件下A的概率即:

        在这里我们假设每一个特征概率都是相互独立的即朴素的,所以我们也称这种分类方法为“朴素贝叶斯分类器”。所以有:

        于是我们得到了“色泽浅白、敲声沉闷、纹理清晰”是好瓜的概率为0.74074,由于我们的目标分类只有两种取值“是”或“不是”,所以概率值大于0.5则为好瓜,小于0.5则不是好瓜。

    返回首页    返回顶部
  看不清?点击刷新

 

  Copyright © 2015-2018 问渠网 辽ICP备15013245号