标签: #数学

深度学习中的数学:香农熵、交叉熵、KL散度

本文围绕香农熵、交叉熵与KL散度的关联展开,旨在帮助理解KL散度这一大模型强化学习中的核心概念。信息量用-log表示,小概率事件信息量更大;香农熵是概率分布的平均信息量,描述不确定性,均匀分布熵大、聚拢分布熵小。交叉熵为估计分布q对真实分布p的平均信息量估计,通常大于等于香农熵,分布越接近越趋近。KL散度量化两分布差异,定义为交叉熵减香农熵,具有非负(仅相等时为0)、不对称(非距离)性质,最小化KL散度等价于最小化交叉熵,故交叉熵可用于损失函数。另一理解角度:基于P采样,比较两分布下概率相近程度可判断分布相似度。