本站原创文章,转载请说明来自《老饼讲解-深度学习》www.bbbdata.com
标签平滑(LabelSmoothing)交叉熵损失函数属于交叉熵损失函数的一种正则化改进,它出自inception-V3模型的原文
本文讲解标签平滑-交叉熵损失函数的计算公式,以及它的意义,通过本文可以具体地掌握标签平滑-交叉熵损失函数
本节讲解标签平滑交叉熵损失函数的公式与意义
什么是标签平滑-交叉熵损失函数
标签平滑(LabelSmoothing)交叉熵损失函数是交叉熵损失函数的一种正则化改进,有利于增强模型的泛化能力
标签平滑-交叉熵损失函数出自inception-V3模型的原文《Rethinking the Inception Architecture for Computer Vision》
它在交叉熵损失函数的基础上,降低对样本标签的信任程度,属于交叉熵损失函数的一种正则化改进
标签平滑交叉熵损失函数的计算公式如下:
其中
:样本个数
:类别个数
:第i个样本的真实类别
:第i个样本属于第k个类别的预测概率
:平滑系数,一般设为0.1
标签平滑交叉熵损失函数-公式解读
交叉熵损失函数与标签平滑交叉熵-公式对比
交叉熵损失函数与标签平滑交叉熵的公式分别如下:
交叉熵损失函数公式为:
标签平滑交叉熵公式为:
可以看到,平滑形式只是将改为了
标签平滑交叉熵损失函数的解读
我们知道,是知道第i个样本是k类时,所带来的信息量(震惊程度)
如果样本的采样标签并不准确,我们不信任采样标签,那么样本可能是任意一个类别
则采样标签不准确时,在知道样本真实类别时,所带来的信息量期望为
标签平滑将“相信采样标签”与"不相信采样标签"两种情况进行加权,作为第i个样本的信息量
即,标签平滑交叉熵就是在交叉熵的基础上,考虑了采样不准确,不信任采样标签的情况
标签平滑交叉熵损失函数的意义
标签平滑考虑了采样不准确的场景,降低样本标签的“自信”,从而模型增强模型的泛化能力
因此标签平滑相当于交叉熵损失函数的一种正则化形式,其中是正则项
好了,标签平滑交叉熵损失函数就介绍到这里
.
End