高斯分布：自然界与科学的“隐形规律”——从理论到应用的全景解析

目录#

历史起源：从测量误差到“正态”之名
数学基石：高斯分布的定义与公式
- 2.1 概率密度函数（PDF）
- 2.2 累积分布函数（CDF）与误差函数
- 2.3 标准正态分布
核心性质：为何高斯分布如此特殊？
- 3.1 对称性与集中趋势
- 3.2 形状参数：均值与方差的影响
- 3.3 尾部特性与“68-95-99.7”法则
- 3.4 矩与生成函数
- 3.5 线性组合与卷积性质
可视化：从钟形曲线看参数变化
- 4.1 均值（μ）对位置的影响
- 4.2 标准差（σ）对形状的影响
- 4.3 不同参数下的曲线对比
应用场景：高斯分布的“统治领域”
- 5.1 自然科学：从身高到分子运动
- 5.2 统计学：假设检验与置信区间的基石
- 5.3 物理学：热噪声与量子力学
- 5.4 金融：风险建模与资产定价
- 5.5 机器学习：从数据预处理到生成模型
深层逻辑：中心极限定理——高斯分布的“存在证明”
- 6.1 定理核心：为何“万物皆正态”？
- 6.2 成立条件与直观理解
- 6.3 实例：骰子之和的分布演变
扩展：多元高斯分布与高维世界
- 7.1 从一维到多维：数学表达
- 7.2 协方差矩阵与相关性
- 7.3 应用：图像处理与异常检测
常见误区与局限性：何时不宜用高斯分布？
- 8.1 “过度正态化”的陷阱
- 8.2 非对称数据与“肥尾”现象
- 8.3 离散数据与边界约束问题
实践工具：如何计算与应用高斯分布？
- 9.1 z分数与标准化
- 9.2 软件工具：Python中的scipy.stats.norm
- 9.3 从理论到代码：实战案例
结语：高斯分布——科学思维的“通用语言”
参考文献

1. 历史起源：从测量误差到“正态”之名#

高斯分布的诞生，与“如何描述误差”这一古老问题密不可分。在18世纪，天文学家和数学家面临一个挑战：多次测量同一物理量（如行星位置）时，结果总是存在微小差异，如何从这些“误差”中推断真实值？

1.1 早期探索：棣莫弗与拉普拉斯的贡献#

最早的突破来自法国数学家亚伯拉罕·棣莫弗（Abraham de Moivre）。1733年，他在研究二项分布的近似计算时发现，当试验次数足够大时，二项分布的概率直方图会趋近于一个光滑的钟形曲线。他推导出了这一曲线的数学表达式（即标准正态分布的雏形），但当时并未引起广泛关注。

1809年，法国数学家皮埃尔-西蒙·拉普拉斯（Pierre-Simon Laplace） 独立研究了误差分布问题。他证明了“最小二乘法”（通过最小化误差平方和估计参数）在误差服从某种对称分布时的合理性，并推导出了类似的钟形曲线公式。拉普拉斯还提出了“中心极限定理”的早期版本，为误差分布的普适性提供了理论依据。

1.2 高斯的决定性贡献：从天文观测到“正态分布”#

真正让这一分布“成名”的是德国数学家卡尔·弗里德里希·高斯（Carl Friedrich Gauss）。1801年，意大利天文学家朱塞普·皮亚齐发现了谷神星，但观测数据有限，难以确定其轨道。高斯通过一种新的“最小二乘法”精确预测了谷神星的位置，引起轰动。

1809年，高斯在《天体运动理论》中系统阐述了他的误差理论：他假设测量误差服从一种“最优”分布，即使观测数据出现概率最大的分布，并通过数学推导证明了这种分布的形式——正是我们今天所说的高斯分布。他还证明了：若误差服从高斯分布，则“最小二乘法”是参数估计的最优方法（即“最大似然估计”）。

由于高斯的巨大影响力，这一分布被命名为“高斯分布”。而“正态分布”的名称则源于19世纪后期统计学家卡尔·皮尔逊（Karl Pearson），他用“normal”（意为“常规的、典型的”）来强调其在自然界中的普遍性。

1.3 名称之争：“高斯”还是“正态”？#

至今，“高斯分布”与“正态分布”仍被混用，但两者内涵略有差异：

“高斯分布”强调其数学起源与形式；
“正态分布”则强调其在现实中的“常态性”。
本文统一使用“高斯分布”，但会在具体语境中说明其“正态”特性。

2. 数学基石：高斯分布的定义与公式#

要理解高斯分布，首先需要掌握其数学表达。我们从最基础的一维情况入手。

2.1 概率密度函数（PDF）#

高斯分布的核心是概率密度函数（Probability Density Function, PDF），它描述了随机变量在某个取值点附近的“概率密度”（注意：密度不等于概率，概率是密度在区间上的积分）。其公式为：

f(x; \mu, \sigma^2) = \frac{1}{\sigma \sqrt{2\pi}} \exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right)

其中：

$x$ 是随机变量的取值（如身高、温度等）；
$\mu$ （希腊字母“缪”）是均值（mean），决定分布的“中心位置”；
$\sigma^2$ （“西格玛平方”）是方差（variance），决定分布的“离散程度”；
$\sigma = \sqrt{\sigma^2}$ 是标准差（standard deviation），与方差同量级，更直观反映离散程度；
$\exp(\cdot)$ 是指数函数， $\pi$ 是圆周率（约3.1416）。

公式解读：每个部分的作用#

** normalization constant（归一化常数）**： $\frac{1}{\sigma \sqrt{2\pi}}$
确保整个PDF曲线下的面积（即总概率）为1，满足概率分布的基本要求： $\int_{-\infty}^{+\infty} f(x) dx = 1$ 。
推导思路：通过积分 $\int_{-\infty}^{+\infty} \exp(-x^2/2) dx = \sqrt{2\pi}$ （高斯积分），可验证归一化常数的合理性。
指数项： $\exp\left( -\frac{(x - \mu)^2}{2\sigma^2} \right)$
这是PDF的“主体”，决定了曲线的形状。
- $(x - \mu)^2$ ：衡量 $x$ 与均值 $\mu$ 的“距离”（平方项确保距离非负，且对偏离更敏感）；
- 除以 $2\sigma^2$ ：用方差“标准化”距离， $\sigma$ 越大，相同偏离的“惩罚”越小（曲线越平坦）；
- 负号：确保偏离均值越远，密度值越小（符合“中间高、两边低”的钟形特征）。

2.2 累积分布函数（CDF）#

累积分布函数（Cumulative Distribution Function, CDF） 定义为 $P(X \leq x) = \int_{-\infty}^x f(t) dt$ ，即随机变量 $X$ 取值小于等于 $x$ 的概率。
由于高斯PDF的积分无法用“初等函数”（如多项式、指数、三角函数等）表达，CDF需通过误差函数（Error Function, erf） 间接表示：

F(x; \mu, \sigma^2) = \frac{1}{2} \left[ 1 + \text{erf}\left( \frac{x - \mu}{\sigma \sqrt{2}} \right) \right]

其中误差函数 $\text{erf}(z) = \frac{2}{\sqrt{\pi}} \int_0^z \exp(-t^2) dt$ ，它是一个特殊函数，可通过数值计算（如查表、软件工具）得到结果。

2.3 标准正态分布：简化的“基准”#

当 $\mu = 0$ 且 $\sigma^2 = 1$ 时，高斯分布被称为标准正态分布（Standard Normal Distribution），其PDF和CDF简化为：

\phi(x) = \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{x^2}{2} \right), \quad \Phi(x) = \frac{1}{2} \left[ 1 + \text{erf}\left( \frac{x}{\sqrt{2}} \right) \right]

标准正态分布是高斯分布的“基准”，任何高斯分布都可通过标准化变换转化为标准正态分布：
若 $X \sim \mathcal{N}(\mu, \sigma^2)$ （表示 $X$ 服从均值为 $\mu$ 、方差为 $\sigma^2$ 的高斯分布），则：

Z = \frac{X - \mu}{\sigma} \sim \mathcal{N}(0, 1)

$Z$ 称为z分数（z-score），表示 $X$ 偏离均值的“标准差倍数”。

3. 核心性质：为何高斯分布如此特殊？#

高斯分布的“普适性”源于其独特的数学性质，这些性质使其在理论推导和实际应用中都极为方便。

3.1 对称性与集中趋势#

对称性：PDF曲线关于均值 $\mu$ 对称，即 $f(\mu + a) = f(\mu - a)$ 。这意味着：
$P(X \leq \mu - a) = P(X \geq \mu + a)$ ，极端值在两侧出现的概率相等。
集中趋势三量重合：均值（μ）、中位数（50%分位数）、众数（PDF最大值点）完全相同。
这是对称性和单峰性（只有一个峰值）共同作用的结果，简化了对“中心位置”的描述。

3.2 形状参数：均值与方差的影响#

高斯分布的形状完全由 $\mu$ 和 $\sigma^2$ 决定，这一“简洁性”是其广泛应用的重要原因：

均值 $\mu$ ：仅影响曲线的水平位置，不改变形状。 $\mu$ 增大，曲线右移； $\mu$ 减小，曲线左移。
方差 $\sigma^2$ ：仅影响曲线的“胖瘦”，不改变中心位置。 $\sigma^2$ 越大（数据越离散），曲线越平坦、越宽； $\sigma^2$ 越小（数据越集中），曲线越陡峭、越窄。

3.3 尾部特性与“68-95-99.7”法则#

高斯分布的“尾部”（远离均值的区域）概率衰减极快（指数级衰减），这一特性可通过“68-95-99.7法则”量化：

约 68% 的数据落在 $[\mu - \sigma, \mu + \sigma]$ 区间内；
约 95% 的数据落在 $[\mu - 2\sigma, \mu + 2\sigma]$ 区间内；
约 99.7% 的数据落在 $[\mu - 3\sigma, \mu + 3\sigma]$ 区间内。

这一法则在数据异常检测中常用：若一个数据点落在 $\mu \pm 3\sigma$ 之外，可初步判断为“异常值”（概率仅0.3%）。

3.4 矩与生成函数#

低阶矩：
- 一阶矩（均值）： $E[X] = \mu$ ；
- 二阶矩（方差）： $\text{Var}(X) = E[(X - \mu)^2] = \sigma^2$ ；
- 三阶矩（偏度，skewness）： $E\left[\left( \frac{X - \mu}{\sigma} \right)^3\right] = 0$ （对称性导致偏度为0）；
- 四阶矩（峰度，kurtosis）： $E\left[\left( \frac{X - \mu}{\sigma} \right)^4\right] = 3$ （“正态峰度”，作为衡量其他分布“尾部肥瘦”的基准）。
矩生成函数（MGF）： $M(t) = \exp\left( \mu t + \frac{1}{2} \sigma^2 t^2 \right)$ 。
MGF是计算矩的工具，其形式简单，使得高斯分布的线性组合、卷积等运算极为方便。

3.5 线性组合与卷积性质#

线性变换不变性：若 $X \sim \mathcal{N}(\mu, \sigma^2)$ ，则对任意常数 $a, b$ （ $a \neq 0$ ），有：
$Y = aX + b \sim \mathcal{N}(a\mu + b, a^2 \sigma^2)$ 。
即高斯分布经线性变换后仍为高斯分布，这是其“稳定性”的体现。
独立和的封闭性：若 $X_1 \sim \mathcal{N}(\mu_1, \sigma_1^2)$ ， $X_2 \sim \mathcal{N}(\mu_2, \sigma_2^2)$ ，且 $X_1, X_2$ 独立，则：
$X_1 + X_2 \sim \mathcal{N}(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)$ 。
这一性质可推广到多个独立高斯变量的和，是后续“中心极限定理”的基础。
卷积性质：两个高斯分布的卷积（即独立变量和的分布）仍是高斯分布。
这意味着，若系统输入为高斯信号，输出也为高斯信号（如线性系统的噪声传递）。

4. 可视化：从钟形曲线看参数变化#

文字描述不如图像直观。通过可视化不同参数下的高斯分布曲线，我们能更深刻理解 $\mu$ 和 $\sigma$ 的作用。

4.1 均值（μ）对位置的影响#

固定 $\sigma = 1$ ，改变 $\mu$ ：

$\mu = -2$ ：曲线峰值在 $x = -2$ ；
$\mu = 0$ ：峰值在 $x = 0$ （标准正态分布）；
$\mu = 2$ ：峰值在 $x = 2$ 。

结论： $\mu$ 仅横向平移曲线，不改变形状。

4.2 标准差（σ）对形状的影响#

固定 $\mu = 0$ ，改变 $\sigma$ ：

$\sigma = 0.5$ ：曲线陡峭、狭窄（数据高度集中在均值附近）；
$\sigma = 1$ ：标准正态分布；
$\sigma = 2$ ：曲线平缓、宽阔（数据分散）。

结论： $\sigma$ 决定“胖瘦”， $\sigma$ 越小，数据越集中； $\sigma$ 越大，数据越分散。

4.3 不同参数下的曲线对比#

![高斯分布曲线对比示意图（示意图，实际需手绘或用工具生成）]
（假设图中包含三条曲线：

红线： $\mu=0, \sigma=0.5$ （陡峭）；
蓝线： $\mu=0, \sigma=1$ （中等）；
绿线： $\mu=2, \sigma=1$ （右移，形状与蓝线相同）。）

通过对比可见：高斯分布的“个性”完全由 $\mu$ 和 $\sigma$ 刻画，这是其简洁性的核心。

5. 应用场景：高斯分布的“统治领域”#

高斯分布的应用几乎遍及所有定量学科，以下是最典型的场景。

5.1 自然科学：从身高到分子运动#

生物特征：人类身高、体重、血压等生理指标；植物生长高度、果实重量等。例如：成年男性身高近似服从 $\mathcal{N}(175\,\text{cm}, 6^2\,\text{cm}^2)$ 。
物理现象：
- 热噪声（如电路中的电压波动）：服从高斯分布（约翰逊-奈奎斯特噪声）；
- 理想气体分子速度：在三维空间中，每个方向的速度分量服从高斯分布（麦克斯韦-玻尔兹曼分布的特例）；
- 测量误差：几乎所有物理测量（如长度、温度）的误差都近似高斯分布（源于中心极限定理）。

5.2 统计学：假设检验与置信区间的基石#

统计学的许多核心方法都依赖高斯分布假设：

z检验/t检验：通过将样本均值标准化为z分数（或t分数），利用高斯分布的尾部概率判断“差异是否显著”。
置信区间：利用“95%数据落在 $\mu \pm 2\sigma$ 内”的特性，构造总体参数的区间估计（如“均值的95%置信区间”）。
线性回归：经典线性回归假设残差（预测误差）服从高斯分布，从而可通过最大似然估计求解参数，并进行统计推断。

5.3 物理学：热噪声与量子力学#

电子工程：通信系统中的“加性高斯白噪声（AWGN）”是最基本的噪声模型，其功率谱密度平坦（白噪声）且幅度服从高斯分布。
量子力学：微观粒子的位置和动量分布在某些条件下接近高斯分布（如基态谐振子的波函数）。

5.4 金融：风险建模与资产定价#

资产收益：传统金融理论假设股票收益率服从高斯分布（如布莱克-斯科尔斯期权定价模型），从而可通过均值和方差衡量收益与风险（如夏普比率）。
风险度量：Value at Risk（VaR）模型常用高斯分布估算“在一定概率下的最大损失”（如“95%置信水平下，日VaR为2%”）。
注意：实际金融数据常具有“胖尾”（极端事件概率高于高斯分布预测），需谨慎使用。

5.5 机器学习：从数据预处理到生成模型#

数据标准化：将特征转换为均值0、方差1的标准正态分布（如神经网络输入层的标准化），加速训练收敛。
高斯混合模型（GMM）：用多个高斯分布的加权和拟合复杂数据分布，用于聚类、密度估计或异常检测。
生成对抗网络（GAN）：某些GAN变体（如WGAN-GP）用高斯分布作为噪声输入，生成逼真的图像、文本等数据。
贝叶斯推断：高斯先验分布与高斯似然函数的结合会产生高斯后验分布，极大简化计算（如贝叶斯线性回归）。

6. 深层逻辑：中心极限定理——高斯分布的“存在证明”#

为何高斯分布如此普遍？答案藏在中心极限定理（Central Limit Theorem, CLT） 中——它从数学上解释了“为何自然界和人类社会中的许多现象都近似服从高斯分布”。

6.1 定理核心：为何“万物皆正态”？#

中心极限定理（简化版）：
设 $X_1, X_2, ..., X_n$ 是独立同分布（i.i.d.）的随机变量，其共同均值为 $\mu$ ，方差为 $\sigma^2$ （均有限）。记 $S_n = X_1 + X_2 + ... + X_n$ ，则当 $n$ 足够大时， $S_n$ 近似服从 $\mathcal{N}(n\mu, n\sigma^2)$ 分布。

更直观地说：大量独立随机因素的“总和”或“平均值”，无论单个因素的分布如何，最终都会趋近于高斯分布。

6.2 成立条件与直观理解#

独立性：各随机变量之间相互独立，避免某一因素主导结果。
有限均值与方差：若单个变量的方差无限（如柯西分布），则CLT不成立。
“大量”的标准：通常 $n \geq 30$ 时，近似效果已较好；若原始分布接近对称， $n$ 可更小（如均匀分布 $n=10$ 即可近似高斯）。

直观理解：每个独立因素对总和的贡献“微小且随机”，正偏差与负偏差会部分抵消，最终使得“中等偏差”最常见（对应钟形曲线的峰值），“极端偏差”极罕见（对应尾部）。

6.3 实例：骰子之和的分布演变#

以“掷骰子”为例：

1个骰子：结果为1-6，均匀分布（平坦直方图）；
2个骰子：和为2-12，分布呈三角形（中间值7概率最高）；
3个骰子：和的分布开始接近钟形；
10个骰子：和的分布已非常接近高斯分布。

这一过程完美展现了CLT的作用：独立变量和的分布随 $n$ 增大而“正态化”。

7. 扩展：多元高斯分布与高维世界#

现实问题常涉及多个相关变量（如身高与体重、图像的像素点），此时需用多元高斯分布（Multivariate Gaussian Distribution） 描述。

7.1 从一维到多维：数学表达#

d维高斯分布的PDF为：

f(\mathbf{x}; \boldsymbol{\mu}, \boldsymbol{\Sigma}) = \frac{1}{(2\pi)^{d/2} |\boldsymbol{\Sigma}|^{1/2}} \exp\left( -\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^T \boldsymbol{\Sigma}^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right)

其中：

$\mathbf{x} = (x_1, x_2, ..., x_d)^T$ 是d维随机向量；
$\boldsymbol{\mu} = (E[x_1], ..., E[x_d])^T$ 是d维均值向量；
$\boldsymbol{\Sigma}$ 是d×d协方差矩阵，元素 $\Sigma_{ij} = \text{Cov}(x_i, x_j) = E[(x_i - \mu_i)(x_j - \mu_j)]$ ；
$|\boldsymbol{\Sigma}|$ 是 $\boldsymbol{\Sigma}$ 的行列式， $\boldsymbol{\Sigma}^{-1}$ 是其逆矩阵。

7.2 协方差矩阵与相关性#

协方差矩阵 $\boldsymbol{\Sigma}$ 是多元高斯分布的核心，它描述了变量间的相关性：

对角元素 $\Sigma_{ii} = \sigma_i^2$ ：单个变量的方差；
非对角元素 $\Sigma_{ij} = \rho_{ij} \sigma_i \sigma_j$ ：变量 $i$ 与 $j$ 的协方差，其中 $\rho_{ij}$ 是相关系数（ $-1 \leq \rho_{ij} \leq 1$ ）。

若 $\boldsymbol{\Sigma}$ 为对角矩阵（非对角元素为0），则变量间相互独立，此时多元高斯分布退化为d个独立一维高斯分布的乘积。

7.3 应用：图像处理与异常检测#

图像处理：图像的相邻像素值高度相关，可用多元高斯分布建模其联合分布，用于去噪或压缩。
异常检测：假设正常数据服从多元高斯分布，通过计算新数据点的“概率密度”判断是否异常（密度低于阈值则为异常）。
人脸识别：主成分分析（PCA）常与多元高斯分布结合，将人脸图像降维后建模，实现身份识别。

8. 常见误区与局限性：何时不宜用高斯分布？#

尽管高斯分布应用广泛，但并非所有数据都适合用高斯分布描述。以下是常见误区：

8.1 “过度正态化”的陷阱#

误区：默认所有数据都是高斯分布，直接套用基于高斯假设的方法（如t检验、线性回归）。
后果：若数据非高斯（如偏态、多峰），结果可能完全错误。
例：收入分布（右偏，少数人收入极高）、网络流量（突发峰值频繁，非高斯）。
对策：先通过直方图、Q-Q图（Quantile-Quantile Plot）检验数据是否符合高斯分布。

8.2 非对称数据与“肥尾”现象#

非对称数据：如考试分数（多数人集中在中等，少数高分或低分，可能左偏或右偏），高斯分布的对称性会低估某一侧的极端值概率。
肥尾现象：金融市场、自然灾害等领域中，极端事件（如股市崩盘、大地震）的发生概率远高于高斯分布预测（高斯分布尾部衰减太快）。此时需用“肥尾分布”（如学生t分布、幂律分布）。

8.3 离散数据与边界约束问题#

离散数据：如“每天的顾客数”（只能取非负整数），高斯分布允许连续取值，可能预测出“负数顾客数”，需用离散分布（如泊松分布、二项分布）。
边界约束：如“零件寿命”（只能非负）、“比例数据”（如合格率，范围[0,1]），高斯分布可能超出合理范围，需用截断高斯分布或Beta分布等。

9. 实践工具：如何计算与应用高斯分布？#

在实际工作中，我们无需手动计算高斯分布的PDF/CDF，可借助统计软件或编程语言实现。

9.1 z分数与标准化#

如前所述，任何高斯变量都可通过标准化转化为标准正态分布：
$Z = \frac{X - \mu}{\sigma} \sim \mathcal{N}(0, 1)$ 。
z分数的意义：

$Z = 1.96$ ：对应97.5%分位数（即 $P(Z \leq 1.96) = 0.975$ ），常用于95%置信区间（双侧）；
$Z = 3$ ：对应99.87%分位数，即“3σ原则”中的阈值。

9.2 软件工具：Python中的`scipy.stats.norm`#

Python的scipy.stats库提供了高斯分布的完整实现（norm类），常用方法：

norm.pdf(x, loc=μ, scale=σ)：计算PDF；
norm.cdf(x, loc=μ, scale=σ)：计算CDF；
norm.ppf(q, loc=μ, scale=σ)：计算分位数（CDF的逆函数，如求“95%分位数”）；
norm.rvs(loc=μ, scale=σ, size=n)：生成n个符合高斯分布的随机数。

9.3 从理论到代码：实战案例#

案例：假设某班学生数学成绩服从 $\mathcal{N}(70, 10^2)$ ，求：

成绩在60-80分之间的概率；
成绩前10%的最低分数（即90%分位数）。

Python代码：

from scipy.stats import norm
 
mu = 70  # 均值
sigma = 10  # 标准差
 
# 1. 成绩在60-80分之间的概率：P(60 ≤ X ≤ 80) = CDF(80) - CDF(60)
p = norm.cdf(80, mu, sigma) - norm.cdf(60, mu, sigma)
print(f"概率：{p:.4f}")  # 输出：0.6827（即68.27%，符合68-95-99.7法则）
 
# 2. 90%分位数：找到x，使CDF(x) = 0.9
x = norm.ppf(0.9, mu, sigma)
print(f"前10%最低分数：{x:.1f}")  # 输出：82.8（即需至少82.8分）

10. 结语：高斯分布——科学思维的“通用语言”#

从高斯对谷神星轨道的预测，到今天机器学习中的数据建模，高斯分布已成为连接数学理论与现实世界的“桥梁”。它的成功不仅源于优美的数学性质，更源于其背后的深刻逻辑——中心极限定理所揭示的“随机性中的规律性”。

然而，我们也需警惕“高斯迷信”：自然界的复杂性意味着，总有现象超越高斯分布的描述能力。真正的科学思维，是在理解高斯分布的同时，也能敏锐识别其局限性，灵活选择更合适的工具。

无论如何，高斯分布仍是定量研究的“第一站”。理解它，你便掌握了一把解读数据、洞察规律的“万能钥匙”。

11. 参考文献#

Jaynes, E. T. (2003). Probability Theory: The Logic of Science. Cambridge University Press.
DeGroot, M. H., & Schervish, M. J. (2012). Probability and Statistics (4th ed.). Pearson.
Wikipedia contributors. (2023). "Normal distribution." In Wikipedia, The Free Encyclopedia.
陈希孺. (2009). 概率论与数理统计（第二版）. 中国科学技术大学出版社.
吴军. (2014). 数学之美（第二版）. 人民邮电出版社.（第8章：高斯分布与信息论）
Scipy Documentation. "scipy.stats.norm." https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html<|FCResponseEnd|>

目录#