【模型】一篇入门之-标签平滑交叉熵损失函数

作者 : 老饼发表日期 : 2023-07-28 10:50:59 更新日期 : 2024-11-01 18:27:29

本站原创文章，转载请说明来自《老饼讲解-深度学习》www.bbbdata.com

标签平滑(LabelSmoothing)交叉熵损失函数属于交叉熵损失函数的一种正则化改进，它出自inception-V3模型的原文

本文讲解标签平滑-交叉熵损失函数的计算公式，以及它的意义，通过本文可以具体地掌握标签平滑-交叉熵损失函数

01. 什么是标签平滑-交叉熵损失函数

本节讲解标签平滑交叉熵损失函数的公式与意义

什么是标签平滑-交叉熵损失函数

标签平滑(LabelSmoothing)交叉熵损失函数是交叉熵损失函数的一种正则化改进，有利于增强模型的泛化能力
标签平滑-交叉熵损失函数出自inception-V3模型的原文《Rethinking the Inception Architecture for Computer Vision》
它在交叉熵损失函数的基础上，降低对样本标签的信任程度，属于交叉熵损失函数的一种正则化改进
标签平滑交叉熵损失函数的计算公式如下：

其中
：样本个数
：类别个数
：第i个样本的真实类别
：第i个样本属于第k个类别的预测概率
   ：平滑系数，一般设为0.1

标签平滑交叉熵损失函数-公式解读

交叉熵损失函数与标签平滑交叉熵-公式对比
交叉熵损失函数与标签平滑交叉熵的公式分别如下：
交叉熵损失函数公式为：
标签平滑交叉熵公式为：
可以看到，平滑形式只是将改为了
标签平滑交叉熵损失函数的解读
我们知道，是知道第i个样本是k类时，所带来的信息量(震惊程度)
如果样本的采样标签并不准确，我们不信任采样标签，那么样本可能是任意一个类别

则采样标签不准确时，在知道样本真实类别时，所带来的信息量期望为
标签平滑将“相信采样标签”与"不相信采样标签"两种情况进行加权，作为第i个样本的信息量
即，标签平滑交叉熵就是在交叉熵的基础上，考虑了采样不准确，不信任采样标签的情况

标签平滑交叉熵损失函数的意义
标签平滑考虑了采样不准确的场景，降低样本标签的“自信”，从而模型增强模型的泛化能力

因此标签平滑相当于交叉熵损失函数的一种正则化形式，其中是正则项

好了，标签平滑交叉熵损失函数就介绍到这里

End