当前位置: 首页 > news >正文

关于建设网站的申请不会代码怎么做外贸网站

关于建设网站的申请,不会代码怎么做外贸网站,基础建设基金有哪些,做的好的农产品网站一、Q-learning简介 Q-learning是一种强化学习算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个价值函数来指导智能体在环境中做出决策,以最大化累积奖励。 Q-learning算法的核心思想是通过不断更新一个称为Q值的…

一、Q-learning简介

Q-learning是一种强化学习算法,用于解决基于马尔可夫决策过程(MDP)的问题。它通过学习一个价值函数来指导智能体在环境中做出决策,以最大化累积奖励。

Q-learning算法的核心思想是通过不断更新一个称为Q值的表格来学习最优策略。Q值表示在给定状态下采取某个动作所能获得的预期累积奖励。算法的基本步骤如下:

1. 初始化Q值表格,将所有Q值初始化为0。

2. 在每个时间步骤t,智能体观察当前状态st,并根据当前Q值表格选择一个动作at。选择动作的方法可以是ε-greedy策略,即以ε的概率随机选择一个动作,以1-ε的概率选择当前Q值最大的动作。

3. 执行动作at,观察环境反馈的奖励rt+1和下一个状态st+1。

4. 根据Q-learning更新规则更新Q值表格中的Q值:

  Q(st, at) = Q(st, at) + α * (rt+1 + γ * max(Q(st+1, a)) - Q(st, at))

  其中,α是学习率,γ是折扣因子,用于平衡当前奖励和未来奖励的重要性。

5. 重复步骤2-4,直到达到停止条件(例如达到最大迭代次数或Q值收敛)。

Q-learning算法的目标是通过不断更新Q值表格,使得智能体能够在环境中找到最优策略,以最大化累积奖励。

二、无人机物流路径规划

无人机物流路径规划是指利用无人机进行货物运输时,通过算法和技术使其无人机将所有货物运送到指定位置,并返回起点,并得到最优飞行路径,以实现高效、安全和准确的货物运输。无人机物流路径规划可以简单抽象为旅行商问题(Traveling Salesman Problem, TSP)。TSP是一个经典的组合优化问题,它的目标是找到一条路径,使得旅行商从起点出发,经过所有城市恰好一次,最后回到起点,并且总路径长度最短。解决TSP问题的方法有很多,其中一种常用的方法是蚁群算法。除了蚁群算法,还有其他一些常用的解决TSP问题的方法,如遗传算法、动态规划和强化学习等。强化学习求解TSP问题思路新颖,具有一定优势。

三、Q-learning求解无人机物流路径规划

1、部分代码

可以自动生成地图也可导入自定义地图,只需要修改如下代码中chos的值即可。

import matplotlib.pyplot as plt
from Qlearning import Qlearning
#Chos: 1 随机初始化地图; 0 导入固定地图
chos=1
node_num=36 #当选择随机初始化地图时,自动随机生成node_num-1个城市
# 创建对象,初始化节点坐标,计算每两点距离
qlearn = Qlearning(alpha=0.5, gamma=0.01, epsilon=0.5, final_epsilon=0.05,chos=chos,node_num=node_num)
# 训练Q表、打印路线
iter_num=1000#训练次数
Curve,BestRoute,Qtable,Map=qlearn.Train_Qtable(iter_num=iter_num)
#Curve 训练曲线
#BestRoute 最优路径
#Qtable Qlearning求解得到的在最优路径下的Q表
#Map TSP的城市节点坐标## 画图
plt.figure()
plt.ylabel("distance")
plt.xlabel("iter")
plt.plot(Curve, color='red')
plt.title("Q-Learning")
plt.savefig('curve.png')
plt.show()

2、部分结果

(1)以国际通用的TSP实例库TSPLIB中的测试集bayg29为例:

Qlearning算法得到的最短路线: [1, 28, 6, 12, 9, 3, 29, 26, 5, 21, 2, 20, 10, 4, 15, 18, 14, 22, 17, 11, 19, 25, 7, 23, 27, 8, 24, 16, 13, 1]

(2)随机生成25个城市

Qlearning算法得到的最短路线: [1, 8, 11, 20, 10, 22, 23, 17, 9, 6, 24, 2, 3, 18, 19, 7, 4, 5, 13, 12, 16, 14, 21, 25, 15, 1]

(3)随机生成22个城市

Qlearning算法得到的最短路线: [1, 10, 14, 13, 22, 9, 21, 4, 19, 20, 5, 7, 3, 12, 18, 6, 17, 8, 11, 2, 15, 16, 1]

四、完整Python代码

http://www.yayakq.cn/news/588074/

相关文章:

  • 做venn图的网站公司网页设计毕业设计
  • 公司网站域名怎么续费西安代做网站
  • 国外最大的设计网站有哪些方面flash做导航网站
  • 零基础可以做网站吗商标注册证查询网
  • 用源码做自己的网站手机网站仿站
  • 免费网站建站模块北京公司注册地址多少钱一年
  • 专业模板建站服务如何制作自己的网站教程
  • 拓普建站推广广州工程造价信息网
  • 网站怎么去维护网站升级每天自动更新
  • 网站列表页怎么做内链房地产信息发布平台官网
  • 用网站做的人工智能广西桂建云个人登录
  • 购物网站宣传方案网站建设费用一年多少钱
  • 网站开发钱包浙江城乡建设部网站首页
  • 做网站需要的手续设计公司网站官网
  • 怎么查网站是不是百度做的企业门户网站的建设与实现论文
  • 企业州建设银行网站wordpress 编辑器漏洞
  • 通付盾 网站建设网站的网站制作公司
  • 建站之星凡客网站界面设计技巧
  • 上下框架 网站湘潭网站建设 问下磐石网络
  • 怎样做网站别人能访问wordpress文章写html代码
  • 怎样做推广网站淘金网站建设推广
  • 中文企业网站模板html零食网站建设的文案策划书
  • 浙江省水利建设行业协会网站wordpress 上传头像
  • 万网虚拟主机上传网站凯里市黎升网络推广公司
  • 宁津华企动力做网站的电话多少工程建设与设计
  • 陕西建设监理协会网站园林景观设计公司总工岗位职责
  • 网站建设 哪家好深圳建设网站费用
  • 深圳百度seo培训百度seo霸屏软件
  • 外国语学院英文网站建设网站备案时间也太慢了
  • 房产智能建站系统如何用自己公司网站做邮箱