当前位置: 首页 > news >正文

上海网站设计外包做架构图的网站

上海网站设计外包,做架构图的网站,最新网络销售平台,网站常见的域名蒙特卡洛树搜索又称随机抽样或统计试验方法,属于计算数学的一个分支,它是在上世纪四十年代中期为了适应当时原子能事业的发展而发展起来的。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡洛树搜索方法由…

蒙特卡洛树搜索又称随机抽样或统计试验方法,属于计算数学的一个分支,它是在上世纪四十年代中期为了适应当时原子能事业的发展而发展起来的。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡洛树搜索方法由于能够真实地模拟实际物理过程,故解决问题与实际非常符合,可以得到很圆满的结果。这也是以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。

在搜索空间巨大的情况下会比较有效

从全局来看,其主要目标为给定一个游戏状态来选择最佳的下一步

经典应用:alpha go

算法过程

选择:选择能够最大化UCB值的结点,即UCB越大,越有可能选择这条路径
在这里插入图片描述
在这里插入图片描述该节点下的平均value大小

C:常数,通常可以取2
N:总探索次数
ni:当前阶段的探索次数

扩展:创建一个或多个子节点

在这里插入图片描述

仿真:在某一点用随机策略进行决策,又称palyout或rollout

在这里插入图片描述

反向传播:使用随机搜索的结果来更新整个搜索树
在这里插入图片描述
在这里插入图片描述

算法过程
流程图

算法的终结机制

1,限定运行时间
2,给固定的迭代次数

迭代完成后,选择value更大的节点即可完成决策

示例:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

左边搜索在这里插入图片描述
在前面的基础上,进行右边搜索
在这里插入图片描述
计算
在这里插入图片描述
左边再深一层搜索
在这里插入图片描述

计算
在这里插入图片描述

右边深一层搜索
在这里插入图片描述

蒙特卡洛树搜索与深度神经网络的结合

这是alpha go的计算原理

最初的解决方案是使用小型网络:
即rollout policy
原理:对棋盘的特征做新性组合,再做softmax借此得到行动的概率
当时使用了8百万人类棋手的数据进行训练

这样做对局时每一步的准确率为24.2%

考虑到围棋变化的复杂度,他们上了神经网络
效果:3毫秒内完成计算,落子准确率为57%
原理:
以输入棋盘状态S为输入数据
以选择不同行动的概率为输出
训练方法:梯度下降

网络总体架构:
分成两个网络:策略网络(给出决策)与价值网络(评估胜率)

公式
在这里插入图片描述

现在将神经网络用到搜索树中
在这里插入图片描述

下面针对上面的UCT公式进行说明:
策略树
即UCT算法(Upper Confidence Bound Apply to Tree)
公式:
行动价值选择函数
在这里插入图片描述

c为常数,c所乘公式用于表示不确定的项

s表示状态 a表示行动
Q(s,a):该函数表示状态行动对的价值。
N(s,a):状态行动对的访问次数,没有采取过的行动的不确定性比较大,潜力亦比较大。
在这里插入图片描述

最初的价值和访问次数都是0,那么我们最初就要随机选择
即rollout policy(随机policy)方法(一般利用MC估计值函数的策略叫做rollout policy,因为这个策略就是用来roll out出一个轨迹的),而不是找到一个最优策略。经验表明,rollout算法虽然简单,但是在实际中十分有效。)

在反向传播的过程中,如果这个决断使得棋局走向了胜利,那么就标记为1,反之标记为-1

backup:
故W表示的就是节点的总价值
backup:
这是基本结构
在这里插入图片描述
为了定制阈值的生长速度,这里加以改进

在这里插入图片描述

有了这种网络,我们一开始就能考虑那些高概率的行为,而不必像UCT那样从0开始学习,大大减少了计算负担。

总体来说alpha go具有以下优点:
神经网络+rollout 构成快速决策系统
价值网络估计叶节点的价值→与rollout的价值做加权平均
反向传播

http://www.yayakq.cn/news/504232/

相关文章:

  • 劳力士手表价格及图片 官方网站手表网站排名前十
  • 滑县网站建设哪家便宜组合图片可以用在网站做链接吗
  • 北京响应式网站开发宁波网络建站模板
  • 建站公司还行吗做网站做58好还是赶集好
  • 提供企业网站建设方案中国制造网网站
  • 唐山建设网站制作wordpress qa
  • 深圳网站维护东莞网页设计
  • 坑梓做网站网站编写流程
  • 国内大型网站建设公司xml格式文件打开都是乱码
  • 旅游网站定位网站开发前端框架和后端框架
  • 网站做的一般怎么评价wordpress开源可视化编辑器
  • 阿里巴巴开网店的详细步骤网站手机端优化
  • 现在网站建设尺寸一般多少怎么编辑网站源代码
  • 建设信用卡官网网站app那个网站开发比较好
  • 国外网站怎么推广wordpress 搬家插件
  • 杭州模板网站制作南和网站建设公司太原网站建设
  • 商务网站模板网站开发使用框架原因
  • 集宁有做蒙古黑石材网站的嘛做海鱼的网站
  • 手机网站建设方法长子网站建设
  • 没有网站域名备案幸运28网站建设
  • 深圳优化网站排名wordpress舰娘
  • 成都高新区国土规划建设局网站景德镇市场建设局网站
  • 网站备案 影响吗学校网站建设实训总结
  • 沁水网站建设动漫做的游戏 迅雷下载网站有哪些
  • 布吉附近公司做网站建设多少钱如何搭建一个网站开发环境
  • 网站建设中要多使用图片网站后台从哪里进去
  • 内蒙网站建设赫伟创意星空科技静态网站怎么容易做
  • 科技小报站内seo是什么意思
  • 网站开发前后端分工数据库做后台网站
  • 江苏网站建设联系方式怎么在网站备案号码上加一个工信部链接地址