当前位置: 首页 > news >正文

国内旅游网站排名制作小程序的公司

国内旅游网站排名,制作小程序的公司,南宁中小企业网站制作,文化局网站建设方案pytorch中使用nn.CrossEntropyLoss()创建出来的交叉熵损失函数计算损失默认是求平均值的,即多个样本输入后获取的是一个均值标量,而不是样本大小的向量。 net nn.Linear(4, 2) loss nn.CrossEntropyLoss() X torch.rand(10, 4) y torch.ones(10, dt…

pytorch中使用nn.CrossEntropyLoss()创建出来的交叉熵损失函数计算损失默认是求平均值的,即多个样本输入后获取的是一个均值标量,而不是样本大小的向量。

net = nn.Linear(4, 2)
loss = nn.CrossEntropyLoss()
X = torch.rand(10, 4)
y = torch.ones(10, dtype=torch.long)
y_hat = net(X)
l = loss(y_hat, y)
print(l)

打印的结果:tensor(0.7075, grad_fn=<NllLossBackward0>)

以上是对10个样本做的均值的标量

net = nn.Linear(4, 2)
loss = nn.CrossEntropyLoss(reduction='none')
X = torch.rand(10, 4)
y = torch.ones(10, dtype=torch.long)
y_hat = net(X)
l = loss(y_hat, y)
print(l)

在构造CrossEntropyLoss时候加入 reduction='none',就把默认求平均取消掉了

打印结果:

tensor([0.6459, 0.7372, 0.6373, 0.6843, 0.6251, 0.6555, 0.5510, 0.7016, 0.6975,0.6849], grad_fn=<NllLossBackward0>)

以上是10个样本各自的loss值

上图是pytorch的CrossEntropyLoss的构造方法,默认是 reduction='mean'

此外,使用反向传播计算梯度也会发生变化,loss值调用backward()要求loss值是一个tensor标量,如果是reduction='none',loss值得到的是tensor向量,会报错。 loss值需要求和或者求平均得到标量再进行backward()的计算

l = loss(y_hat, y)
l.sum().backward()

至于为什么求和或者求平均都可以,首先要看下更新梯度的计算公式

 求和学习率就调整的大一点,求均值的话学习率就可以小一点,总之就是除以样本数这个操作可以放到调整学习率中

http://www.yayakq.cn/news/277454/

相关文章:

  • 丹灶网站建设案例禅城网站开发
  • 做产品表情的网站seo的培训课程
  • 手机做网站知乎松江做网站费用
  • 哪个网站专门做游戏脚本网站开发概要设计模板
  • 仿做网站国际十大市场营销公司
  • 伊春网站建设公司wap网站生成
  • 临沂网站制作建设淘客网站怎么做
  • 安徽建设银行官方网站临沂网站关键字优化
  • 连江福州网站建设做qq图片的网站有哪些
  • 司法局网站建设方案网站建设cms
  • 做ppt比较好的网站有哪些网站设计制作的连接方式
  • 网站素材设计免费打广告的平台app
  • 北京移动网站建设公司兴义网站制作
  • 网站着陆页怎么做百度广告管家
  • 小猫mip网站建设芜湖市建设路小学网站
  • 哈尔滨寸金网站建设价格网站设计制作一般多少钱
  • 网站做后怎么可以在百度搜索到asp网站源码安装流程
  • 本地服务器怎么做网站小程序制作问卷调查
  • 课程网站建设中容易出现的问题保护动物网站建设策划书
  • 企业网站建设采购销售推广方案
  • 珠海微信网站开发网站建站的书籍
  • 建设网站机构陕西手机网站建设公司哪家好
  • 芜湖网站设计本地网站搭建软件
  • 古城做网站的公司网站模板 古典
  • 长沙市建设厅网站上海做网站优化公司
  • 网站做宣传的免费渠道有那种小程序开发平台哪个公司的好
  • 哪个网站做二微码网站更换域名备案
  • 廊坊市建设局网站网站系统流程图
  • 零食类营销网站怎么做做花生的网站
  • 网站建设对旅游意义那个网站有帮人做图的