当前位置: 首页 > news >正文

六安门户网站建设哪家好网站建设期间注意事项

六安门户网站建设哪家好,网站建设期间注意事项,网站开发模块的需求分析,广州哪里有做网站大家好,我是刘明,明志科技创始人,华为昇思MindSpore布道师。 技术上主攻前端开发、鸿蒙开发和AI算法研究。 努力为大家带来持续的技术分享,如果你也喜欢我的文章,就点个关注吧 正文 关于扩散模型(Diffusi…

大家好,我是刘明,明志科技创始人,华为昇思MindSpore布道师。
技术上主攻前端开发、鸿蒙开发和AI算法研究。
努力为大家带来持续的技术分享,如果你也喜欢我的文章,就点个关注吧

正文

关于扩散模型(Diffusion Models)有很多种理解,本文的介绍是基于denoising diffusion probabilistic model (DDPM),DDPM已经在(无)条件图像/音频/视频生成领域取得了较多显著的成果,现有的比较受欢迎的的例子包括由OpenAI主导的GLIDE和DALL-E 2、由海德堡大学主导的潜在扩散和由Google Brain主导的图像生成。

实际上生成模型的扩散概念已经在(Sohl-Dickstein et al., 2015)中介绍过。然而,直到(Song et al., 2019)(斯坦福大学)和(Ho et al., 2020)(在Google Brain)才各自独立地改进了这种方法。

本文是在Phil Wang基于PyTorch框架的复现的基础上(而它本身又是基于TensorFlow实现),迁移到MindSpore AI框架上实现的。在这里插入图片描述
实验中我们采用离散时间(潜在变量模型)的观点,另外,读者也可以查看有关于扩散模型的其他几个观点!

实验开始之前请确保安装并导入所需的库(假设您已经安装了MindSpore、download、dataset、matplotlib以及tqdm)。

import math
from functools import partial
%matplotlib inline
import matplotlib.pyplot as plt
from tqdm.auto import tqdm
import numpy as np
from multiprocessing import cpu_count
from download import downloadimport mindspore as ms
import mindspore.nn as nn
import mindspore.ops as ops
from mindspore import Tensor, Parameter
from mindspore import dtype as mstype
from mindspore.dataset.vision import Resize, Inter, CenterCrop, ToTensor, RandomHorizontalFlip, ToPIL
from mindspore.common.initializer import initializer
from mindspore.amp import DynamicLossScalerms.set_seed(0)

模型简介

什么是Diffusion Model?

在这里插入图片描述

索引的正向和反向过程都发生在某些有限时间步长
(DDPM作者使用
)内。从
开始,在数据分布中采样真实图像
(本文使用一张来自ImageNet的猫图像形象的展示了diffusion正向添加噪声的过程),正向过程在每个时间步长
都从高斯分布中采样一些噪声,再添加到上一个时刻的图像中。假定给定一个足够大的
和一个在每个时间步长添加噪声的良好时间表,您最终会在
通过渐进的过程得到所谓的各向同性的高斯分布。

扩散模型实现原理

Diffusion 前向过程

所谓前向过程,即向图片上加噪声的过程。虽然这个步骤无法做到图片生成,但这是理解diffusion model以及构建训练样本至关重要的一步。 首先我们需要一个可控的损失函数,并运用神经网络对其进行优化。

Diffusion 逆向过程

为了解决上述问题,我们将利用神经网络来近似(学习)这个条件概率分布
, 其中
是神经网络的参数。如果说前向过程(forward)是加噪的过程,那么逆向过程(reverse)就是diffusion的去噪推断过程,而通过神经网络学习并表示
的过程就是Diffusion 逆向去噪的核心。

U-Net神经网络预测噪声

神经网络需要在特定时间步长接收带噪声的图像,并返回预测的噪声。请注意,预测噪声是与输入图像具有相同大小/分辨率的张量。因此,从技术上讲,网络接受并输出相同形状的张量。那么我们可以用什么类型的神经网络来实现呢?

这里通常使用的是非常相似的自动编码器,您可能还记得典型的“深度学习入门”教程。自动编码器在编码器和解码器之间有一个所谓的“bottleneck”层。编码器首先将图像编码为一个称为“bottleneck”的较小的隐藏表示,然后解码器将该隐藏表示解码回实际图像。这迫使网络只保留bottleneck层中最重要的信息。

在模型结构方面,DDPM的作者选择了U-Net,出自(Ronneberger et al.,2015)(当时,它在医学图像分割方面取得了最先进的结果)。这个网络就像任何自动编码器一样,在中间由一个bottleneck组成,确保网络只学习最重要的信息。重要的是,它在编码器和解码器之间引入了残差连接,极大地改善了梯度流(灵感来自于(He et al., 2015))。
在这里插入图片描述
可以看出,U-Net模型首先对输入进行下采样(即,在空间分辨率方面使输入更小),之后执行上采样。

http://www.yayakq.cn/news/79642/

相关文章:

  • 徐州市城乡和住房建设局网站黄冈网站推广软件有哪些
  • 局网站建设进入前十名h5免费制作平台火蚁邀请函怎么写
  • 表格布局的网站免费网站建设价格费用
  • 泰安网络公司推荐搜索引擎优化英文
  • 无锡建站方案域名注册 万网
  • 全球网站流量排名查询西安做网站设计公司
  • 西安市高新区建设局网站会展网站建设
  • 石河子网站设计平面设计很难学吗
  • 网站建设公司顺义发布外链
  • 做带支付平台的网站网站插件开发
  • php做在线直播网站wordpress 首页字数
  • 屏蔽网站推广聚名网官网登录入口
  • 网站301跳转代码wordpress 极简设计
  • 济南建设银行公积金网站自己在线制作logo免费模版
  • 网站设计开发环境建网站的宽带多少钱
  • 如何用ip地址做网站wordpress怎么增加页面
  • 重庆网站网页设计培训机构深圳模板网站建设公
  • 视频网站建设费用明细网站的关键字 设置
  • 成都网站推广营销微信成都住建局官网住建智慧建管
  • aspcms网站地图模板logo设计公司前十名
  • 淘宝运营跟做网站哪种工资高厦门行业网站建设
  • wordpress 搜狐视频合肥seo收费
  • 中国建设银行网站宁波网点企业文化建设方案
  • aspcms手机网站源码珠海关键词优化平台
  • 珠宝类网站建设中国铁建大桥工程局集团有限公司
  • html静态网站开发实验报告网站流量高有什么用
  • 找兼职做网站建设cms开发
  • 快速建立平台网站开发设计建站流程wordpress母公司
  • 加强和改进网站建设建设方案广州市建设厅官方网站
  • 贵安新区网站建设推广百度关键词指数查询工具