CNN-卷积神经网络

【附件】pytorch提供的激活函数公式与图像

作者 : 老饼 发表日期 : 2023-07-28 10:52:04 更新日期 : 2024-03-08 19:22:41
本站原创文章,转载请说明来自《老饼讲解-深度学习》www.bbbdata.com




深度学习常用的激活函数除了ReLu、LeakyReLu、Sigmoid、tanh等之外,还有许多其它激活函数

本文展示pytorch所提供的所有激活函数,包括激活函数的图像、计算公式、和pytorch的API等






    01. pytorch的激活函数与图像     



本节介绍pytorch中提供的激活函数以及它们的图像



     pytorch深度学习-激活函数简介    


在pytorch中提供了各种激活函数,包括如下:
ELU、Hardshrink、Hardsigmoid、Hardtanh、Hardswish、LeakyReLU、LogSigmoid、   
MultiheadAttention、PReLU、ReLU、ReLU6、RReLU、SELU、CELU、GELU、Sigmoid、
SiLU、Mish、Softplus、Softshrink、Softsign、Tanh、Tanhshrink、Threshold、GLU、   
Softmin、Softmax、Softmax2d、LogSoftmax、ADAPTIVELOGSOFTMAXWITHLOSS      
各个函数的详细说明: https://pytorch.org/docs/stable/nn.html#non-linear-activations-weighted-sum-nonlinearity 




     pytorch深度学习-激活函数图像    


 
✍️备注:上述图象中不包括MultiheadAttention、Threshold、GLU三个激活函数






    02. pytorch深度学习-激活函数的公式     




本节介绍激活函数的公式以及pytorch中激活函数API



ELU


torch.nn.ELU(alpha=1.0, inplace=False)
 


Hardshrink


torch.nn.Hardshrink(lambd=0.5)
 


Hardsigmoid


torch.nn.Hardsigmoid(inplace=False)


Hardtanh


torch.nn.Hardtanh(min_val=- 1.0, max_val=1.0, inplace=False, min_value=None, max_value=None)


Hardswish


torch.nn.Hardswish(inplace=False)
  


LeakyReLU


torch.nn.LeakyReLU(negative_slope=0.01, inplace=False)
 
或者


LogSigmoid


torch.nn.LogSigmoid(*args, **kwargs)


MultiheadAttention


torch.nn.MultiheadAttention(embed_dim
, num_heads
, dropout=0.0
, bias=True
, add_bias_kv=False
, add_zero_attn=False
, kdim=None
, vdim=None
, batch_first=False
, device=None
, dtype=None)
 
其中 


PReLU


torch.nn.PReLU(num_parameters=1, init=0.25, device=None, dtype=None)
 
或者


ReLU


torch.nn.ReLU(inplace=False)


ReLU6


torch.nn.ReLU6(inplace=False)


RReLU


torch.nn.RReLU(lower=0.125, upper=0.3333333333333333, inplace=False)
 


SELU


torch.nn.SELU(inplace=False)
 
其中, 


CELU


torch.nn.CELU(alpha=1.0, inplace=False)


GELU


torch.nn.GELU(approximate='none')
 
其中是高斯分布的累积分布函数
用tanh来近似时,GELU的计算公式为
 


Sigmoid


torch.nn.Sigmoid(*args, **kwargs)
 


SiLU


torch.nn.SiLU(inplace=False)
 


Mish


torch.nn.Mish(inplace=False)
 


Softplus


torch.nn.Softplus(beta=1, threshold=20)


Softshrink


torch.nn.Softshrink(lambd=0.5)


Softsign


torch.nn.Softsign(*args, **kwargs)


Tanh


torch.nn.Tanh(*args, **kwargs)


Tanhshrink


torch.nn.Tanhshrink(*args, **kwargs)


Threshold


torch.nn.Threshold(threshold, value, inplace=False)
 


GLU


torch.nn.GLU(dim=- 1)
  
其中,a是矩阵的前半部分,b是矩阵的后半部分,结果是原矩阵的一半






第二类



Softmin


torch.nn.Softmin(dim=None)
 



Softmax


torch.nn.Softmax(dim=None)
  


Softmax2d


torch.nn.Softmax2d(*args, **kwargs)
对图片进行softmax,
当输入为单张图片(C,H,W)时,对每个通道各自进行softmax,
当输入为多张图片(N,C,H,W)时,对每张图片每个通道各自进行softmax
# 通过下面的例子可以了解Softmax2d是怎么回事
torch.manual_seed(99)
m      = torch.nn.Softmax2d()
input  = torch.randn(3,4,5)
output = m(input)
n      = output.numpy()
n.sum(axis=0)


LogSoftmax


torch.nn.LogSoftmax(dim=None)



ADAPTIVELOGSOFTMAXWITHLOSS


torch.nn.AdaptiveLogSoftmaxWithLoss(in_features
, n_classes
, cutoffs
, div_value=4.0
, head_bias=False
, device=None
, dtype=None)
类别非常多时(比如上百万个类),Softmax的高效实现




     附件:绘图所有激活函数图像的代码     


import torch
import matplotlib.pyplot as plt
import math
x = torch.arange(-5,5.1,0.1)
mds = {'ELU':torch.nn.ELU()
           ,'Hardshrink':torch.nn.Hardshrink()
            ,'Hardswish':torch.nn.Hardswish()
            ,'LeakyReLU':torch.nn.LeakyReLU()
            ,'PReLU':torch.nn.PReLU()
            ,'ReLU':torch.nn.ReLU()
            ,'ReLU6':torch.nn.ReLU6()
            ,'RReLU':torch.nn.RReLU()
            ,'SELU':torch.nn.SELU()
            ,'CELU':torch.nn.CELU()
            ,'GELU':torch.nn.GELU()
            ,'SiLU':torch.nn.SiLU()
            ,'Mish':torch.nn.Mish()
            ,'Softplus':torch.nn.Softplus()
            ,'LogSigmoid':torch.nn.LogSigmoid()
            ,'Sigmoid':torch.nn.Sigmoid()
            ,'Softshrink':torch.nn.Softshrink()
            ,'Softsign':torch.nn.Softsign()
            ,'Tanh':torch.nn.Tanh()
            ,'Tanhshrink':torch.nn.Tanhshrink()
            ,'Hardsigmoid':torch.nn.Hardsigmoid()
            ,'Hardtanh':torch.nn.Hardtanh()
            # ,'MultiheadAttention':torch.nn.MultiheadAttention()
            # ,'Threshold':torch.nn.Threshold()
            # ,'GLU':torch.nn.GLU()   
           }
figure = plt.figure(figsize=(13, 30))
col = 2
row = math.ceil(len(mds)/col)
t = 0 
for key in mds:
    t = t + 1
    figure.add_subplot(row,col, t) 
    plt.title(key)
    y = mds[key](x).detach().numpy() 
    plt.plot(x,y)
    plt.subplots_adjust(wspace=0.2,hspace=0.5)
plt.show()





好了,以上就是pytorch深度学习中各个激活函数的公式与图像了~








 End 







联系老饼