什么是朴素贝叶斯分类器中的“幼稚”?

What is "naive" in a naive Bayes classifier?

提问人:Peddler 提问时间:5/16/2012 最后编辑:mervPeddler 更新时间:2/13/2023 访问量:25571

问:

朴素贝叶斯有什么天真?

算法 分类 naivebayes

评论

11赞 Yavar 5/16/2012
你不必感到尴尬,小贩,你问了一个好问题。+1

答:

61赞 laurent 5/16/2012 #1

维基百科上实际上有一个很好的例子:

简单来说,朴素贝叶斯分类器假设给定类变量,类中特定特征的存在(或不存在)与任何其他特征的存在(或不存在)无关。例如,如果一个水果是红色的、圆形的,直径约为 4 英寸,则可以将其视为苹果。即使这些特征相互依赖或依赖于其他特征的存在,朴素贝叶斯分类器也会认为所有这些属性都独立地影响了这种水果是苹果的概率。

基本上,它是“幼稚的”,因为它做出的假设可能是正确的,也可能不是。

评论

5赞 Chip 5/16/2012
维基百科的文章正确地解释了它,但我不同意“它做出的假设可能是正确的,也可能不是正确的”。有了适量的训练数据,它就可以很好地过滤掉不相关的参数。“幼稚”的部分是不考虑参数之间的依赖性。因此可能必须查看冗余数据。
15赞 gr33ndata 8/29/2013 #2

如果数据由特征向量 X = {x1, x2, ...x10} 和类标签 y = {y1, y2, .. y5},贝叶斯分类器将正确的类标签标识为最大化以下公式的类标签:

P(y|X) = P(X|y) * P(y) = P(x1,x2,...,x10|y) * P(y)

就目前而言,它仍然不幼稚。但是,很难计算 P(x1,x2,...,x10|y),因此我们假设特征是独立的,这就是我们所说的朴素假设,因此,我们最终得到以下公式:

P(y|X) = P(x1|y) * P(x2|y) * ... * P(x10|y) * P(y)

6赞 user3664740 5/22/2014 #3

它之所以被称为幼稚,是因为它假设所有属性都是相互独立的。这个假设就是为什么它被称为幼稚,因为在许多现实世界中,这不适合。尽管如此,该分类器在许多现实世界中都运行得非常好,并且在某些情况下(尽管不是全部)具有与中性网络和 SVM 相当的性能。

1赞 Nicky 9/16/2015 #4

对于分类,当我们找到联合分布时,问题在于它只是反映了训练数据,并且也很难计算。因此,我们需要一些更有用的概括。

朴素模型强烈地概括了每个属性的分布都独立于任何其他属性

它确实有助于在很大程度上不关心属性之间的依赖关系。

1赞 muhammed fairoos nm 11/25/2019 #5

在这里,我分享了一份关于朴素贝叶斯分类器实用解释的好文档,它会给你一个非常好的想法。

点击这里