随机分布直方图

Histogram of random distribution

提问人:AmirMohammad Shakeri 提问时间:8/28/2023 最后编辑:jaredAmirMohammad Shakeri 更新时间:8/28/2023 访问量:79

问:

我不知道这是一个与数学有关的问题还是一个与计算机有关的问题,所以决定在两个网站上提问。

首先,我需要说的是,我在统计学和概率方面没有太多的知识,所以我认为这可能是我问这些问题的原因。


所以我在玩matplotlib,绘制不同分布的直方图,并在numpy()创建的随机分布中看到了一些奇怪的东西。numpy.random.random

data = np.random.random(1000)
plt.hist(data, bins = 100, density=True)

enter image description here

这是我的问题:

  1. 为什么有些柱会越过 [0-1] 的极限?密度不是在下面定义的吗?

密度 =(数据点的出现次数/数据总数)。

根据该定义,密度不应大于 1 且小于 0。如果是这样,为什么有些柱会超过这个限制?我是否误解了密度的含义?最大密度不应该小于 1 吗?


data = np.random.random(1000)
plt.hist(data, bins = 100)

enter image description here

  1. 如果我转动,我会得到上面的结果。根据图,一个箱子的最大出现次数约为 20 次。如果我将其除以数据数组的长度 1000,它应该是 0.02,但相反,我的最大高度是 2 而不是 0.02。为什么?density=Falsedensity=True

我想我可能误解了密度的定义,它的含义,它是如何计算的,以及它代表什么。因此,如果您能用简单的术语为我解释密度,我将不胜感激。

我想我也可能对随机分布有一些错误的想法,并将它们视为正态分布,这就是为什么我正在努力理解这个问题并弄清楚它。如果您还能解释随机分布及其与正态分布的主要区别,我将不胜感激。

python numpy matplotlib 数学 统计

评论

0赞 JohanC 8/28/2023
,总面积为 1 个单位。由于0-1上均匀分布的蓝色区域的总宽度为1个单位,因此平均高度也应为1个单位。要使平均值为 1,有些值会更高,有些值会更低。使用标准正态分布时,宽度要高得多,具体取决于随机选择的最小值和最大值。正态分布的最高点约为 0.4,因此密度直方图不太可能在某处高于 1。density=True
0赞 Severin Pappadeux 8/29/2023
密度 =(数据点出现次数/数据总数)/Δx。这就是为什么它被称为“密度”,使得积分等于 1

答:

1赞 tryna_learn 8/28/2023 #1

密度参数的描述可以在 numpy 的文档中找到: https://numpy.org/doc/stable/reference/generated/numpy.histogram.html

从文档中:

密度 : BOOL, 可选

如果为 False,则结果将包含每个 bin 中的样本数。 如果为 True,则结果是概率密度函数的值 在箱中,归一化,使得该范围内的积分为 1。 请注意,直方图值的总和将不等于 1 除非选择了单位宽度的箱;它不是一个概率质量 功能。

由于目标是积分(注意:整数而不是总和)为 1,则平均柱的高度为 1,因为完全随机分布将是 x 轴上从 0 到 1 的矩形,在 y 轴上从 0 到 1,面积为 1。

换句话说,某些条形可以高于 1,因为每个条柱的宽度小于 1,因此每个条形的面积仍然小于 1。

当然,因为这是随机的,所以有些条形的高度小于 1,有些条形的高度大于 1。

评论

0赞 AmirMohammad Shakeri 8/28/2023
那么,为什么正态分布不会发生同样的事情呢?如果我绘制正态分布密度的直方图,则条形的高度不会超过 1,但如果选择随机分布,则高度将超过 1。为什么?
0赞 Severin Pappadeux 8/29/2023
@AmirMohammadShakeri 不,在正态分布下,效果是一样的 - 你绘制高斯 PDF,将其与采样直方图重叠,一些条柱将高于 PDF 曲线,而一些条柱将低于 PDF 曲线
0赞 tryna_learn 8/29/2023
AmirMohammad Shakeri,正态分布的密度高度是否超过 1 取决于其标准差。尝试以较低的标准偏差进行尝试。密度 = True 的绘图仅表示总面积 = 1。因此,更瘦的分布会更高。
0赞 AmirMohammad Shakeri 8/30/2023
@tryna_learn谢谢,感谢您向我解释。我想我需要研究一点概率和统计学,以便能够完全理解你的意思。
0赞 tryna_learn 8/31/2023
如果它回答了你的问题,你应该接受答案。