当前位置: 首页 > news >正文

成都网站建设赢展泛站群

成都网站建设赢展,泛站群,wordpress 响应式产品展示站,咨询公司名称torch.nn - PyTorch中文文档 (pytorch-cn.readthedocs.io) LSTM — PyTorch 2.3 documentation LSTM层的作用 LSTM层:长短时记忆网络层,它的主要作用是对输入序列进行处理,对序列中的每个元素进行编码并保存它们的状态,以便后续的处理。 …

torch.nn - PyTorch中文文档 (pytorch-cn.readthedocs.io)

LSTM — PyTorch 2.3 documentation

LSTM层的作用

LSTM层:长短时记忆网络层,它的主要作用是对输入序列进行处理,对序列中的每个元素进行编码并保存它们的状态,以便后续的处理。

LSTM 是一种特殊的 RNN,它通过引入门控机制来解决传统 RNN 的长期依赖问题。

我们假设:h为LSTM单元的隐藏层输出,c为LSTM内存单元的值,x为输入数据。

LSTM 的结构包含以下几个关键组件:

1、输入门(input gate):决定当前时间步的输入信息对细胞状态的影响程度。

2、遗忘门(forgetgate):决定上一个时间步的细胞状态对当前时间步的影响程度。

3、细胞状态(cell state):用于在不同时间步之间传递和存储信息。

4、输出门(output gate):决定细胞状态对当前时间步的输出影响程度。

5、隐藏状态(hiddenstate):当前时间步的输出,也是下一个时间步的输入。

nn.LSTM

计算公式

对输入序列的每个元素,LSTM的每层都会执行以下计算:

h_t是时刻t的隐状态,
c_t是时刻t的细胞状态,
x_t是上一层的在时刻t的隐状态或者是第一层在时刻t的输入。
i_t, f_t, g_t, o_t分别代表 输入门,遗忘门,细胞和输出门。

参数说明:

 torch.nn.LSTM(input_sizehidden_sizenum_layers=1bias=Truebatch_first=Falsedropout=0.0bidirectional=Falseproj_size=0device=Nonedtype=None)

  • input_size – 输入x的特征数量。
  • hidden_size – 隐层的特征数量。
  • num_layers – RNN的层数。
  • nonlinearity – 激活函数。指定非线性函数使用tanh还是relu。默认是tanh
  • bias – 是否使用偏置。
  • batch_first – 如果True的话,那么输入Tensor的shape应该是[batch_size, time_step, feature],输出也是这样。默认是 False,就是这样形式,(seq(num_step), batch, input_dim),也就是将序列长度放在第一位,batch 放在第二位
  • dropout – 默认不使用,如若使用将其设置成一个0-1的数字即可。如果值非零,那么除了最后一层外,其它层的输出都会套上一个dropout层。
  • bidirectional是否使用双向的 rnn,默认是 False

输入:input, (h_0, c_0)

  • input_shape = [时间步数, 批量大小, 特征维度] = [num_steps(seq_length), batch_size, input_dim]=input (seq_len, batch, input_size)保存输入序列特征的tensor。
  • h_0是shape=(num_layers*num_directions,batch_size,hidden_size)的张量,保存着batch中每个元素的初始化隐状态的Tensor。其中num_layers就是LSTM的层数。如果bidirectional=True,num_directions=2,否则就是1,表示只有一个方向。
  • c_0 是shape=(num_layers*num_directions,batch_size,hidden_size)的张量, 保存着batch中每个元素的初始化细胞状态的Tensor。h_0,c_0如果不提供,那么默认是0。

输出:output, (h_n, c_n)

  • output的shape=(seq_length,batch_size,num_directions*hidden_size),(时间步数, 批量大小, 隐藏单元个数)。保存最后一层的输出的Tensor
  • h_n (num_layers * num_directions, batch, hidden_size): Tensor,保存着LSTM最后一个时间步的隐状态。
  • c_n (num_layers * num_directions, batch, hidden_size): Tensor,保存着LSTM最后一个时间步的细胞状态。

LSTM模型参数:

LSTM — PyTorch 2.3 documentation

LSTM的结构解释:

MATLAB神经网络---lstmLayer(LSTM 长短期记忆神经网络)-CSDN博客

http://www.yayakq.cn/news/73677/

相关文章:

  • 程序员帮忙做放贷网站网站该如何做
  • 企业建设网站有哪些asp网站301
  • 贵州省建设厅网站谷歌广告推广网站
  • 包头建设工程安全监督站网站类似淘宝网站模板
  • 建国外网站需要多少钱网络推广的策略方法
  • 临沂学做网站建外贸商城网站
  • 写资料的网站有哪些电脑网站与手机的区别
  • 罗湖建网站公司四川省建设厅网站电话
  • 百度云建网站有做义工的相亲网站吗
  • 河北建设厅网站修改密码在哪里长沙市天心区建设局网站
  • 百度官网网站登录搬家公司网站建设价格
  • 公司网站上传图片WordPress秀人网采集
  • 网站建设目的深圳住建局招投标交易中心
  • 山西省城乡和建设厅网站wordpress 签到功能
  • 网站主题设计特色山西旅游网站建设
  • 公司网站做首页大图淘宝网站内搜索引擎优化怎么做
  • 在哪里可以做网站赚钱购物网站设计的意义
  • 网站集群建设绵阳优化网站排名
  • 汽车网站排名查询卖摄影作品的网站
  • 工商企业网站微信crm管理系统
  • 郑州网站竞价托管甘孜州手机网站建设
  • 古镇中小企业网站建设lsp必备公众号
  • 哪个网站可以做英文兼职免费行情软件网站有哪些
  • 学校门户网站什么意思二维码页面设计模板
  • 宁夏做网站的网站模版免费下载
  • 网站建设情况介绍网站建设银行北京冬奥会纪念币发行时间
  • 广安市建设局官方网站网站备案为什么要闭站
  • 营销网站建设公司一级建造师求职网
  • 乐清建站公司哪家好搜易网提供的技术服务
  • 贵州省建设部网站济南哪有做网站的