数学 - 标签 - Ajax Zhan's Blog

2025-02-23

深度学习中的数学：香农熵、交叉熵、KL散度

本文围绕香农熵、交叉熵与KL散度的关联展开，旨在帮助理解KL散度这一大模型强化学习中的核心概念。信息量用-log表示，小概率事件信息量更大；香农熵是概率分布的平均信息量，描述不确定性，均匀分布熵大、聚拢分布熵小。交叉熵为估计分布q对真实分布p的平均信息量估计，通常大于等于香农熵，分布越接近越趋近。KL散度量化两分布差异，定义为交叉熵减香农熵，具有非负（仅相等时为0）、不对称（非距离）性质，最小化KL散度等价于最小化交叉熵，故交叉熵可用于损失函数。另一理解角度：基于P采样，比较两分布下概率相近程度可判断分布相似度。

标签: #数学

深度学习中的数学：香农熵、交叉熵、KL散度