OpenEdv-开源电子网

 找回密码
 立即注册
正点原子全套STM32/Linux/FPGA开发资料,上千讲STM32视频教程免费下载...
查看: 3508|回复: 5

【新人的疯狂想法】STM32F4也能玩深度增强学习

[复制链接]

3

主题

4

帖子

0

精华

新手上路

积分
24
金钱
24
注册时间
2018-5-8
在线时间
1 小时
发表于 2018-5-24 11:54:40 | 显示全部楼层 |阅读模式
视频连接:
v.youku.com/v_show/id_XMzYyMjAyNDM4OA

我们团队的第三个作品,使用的是STM32F407,用的是正点原子的开发板,


游戏环境为自己编写的虚拟机械臂(reacher,到达者),控制一个两关节机械臂,使得机械臂尖端触碰目标

与之前相同,采用我们团队自己开发的操作系统OSlw,使用自己开发的神经网络框架。

不同于之前的flapperbrid,机械臂的转角是连续量,难以直接使用DQN算法,所以采用可以输出连续量的DDPG算法(Google Deepmind)


由于只是用了STM32F407的内部128k的ram,且DDPG算法十分耗内存(四个神经网络,两套参数),所以此次设计采用简化神经网络,增大ER的设计方法。


超参数:

演员网络:10->50(ReLU)->2(tanh)

评论家网络 12->70(ReLU)->1(linear)

学习速率统一0.001

gamma=0.9

ER:600取10

tau=0.01

【消息】
近来,我们团队准备将OSlw操作系统与内部的神经网络的算法框架在github完全开源,预计OSlw操作系统将率先开源,敬请期待。


简单作品,各位大神轻喷。

如有侵权,立刻删除。

如有问题与学习讨论意向请致邮箱
[url=]shuep_418_slw@outlook.com[/url]

正点原子逻辑分析仪DL16劲爆上市
回复

使用道具 举报

21

主题

2205

帖子

0

精华

资深版主

Rank: 8Rank: 8

积分
5141
金钱
5141
注册时间
2014-8-26
在线时间
1317 小时
发表于 2018-5-24 12:36:03 | 显示全部楼层
回复 支持 反对

使用道具 举报

3

主题

67

帖子

1

精华

论坛元老

Rank: 8Rank: 8

积分
4958
金钱
4958
注册时间
2014-10-24
在线时间
975 小时
发表于 2018-5-24 17:12:45 | 显示全部楼层
厉害了,老铁,强烈支持啊!
回复 支持 反对

使用道具 举报

4

主题

79

帖子

0

精华

中级会员

Rank: 3Rank: 3

积分
294
金钱
294
注册时间
2018-1-31
在线时间
46 小时
发表于 2018-5-25 08:11:45 | 显示全部楼层
盼早开源,好好学习学习
回复 支持 反对

使用道具 举报

2

主题

756

帖子

0

精华

论坛元老

Rank: 8Rank: 8

积分
4163
金钱
4163
注册时间
2017-10-24
在线时间
251 小时
发表于 2018-5-25 08:47:08 | 显示全部楼层
觉得不可思议,表示关注
十六进制带我飞。
回复 支持 反对

使用道具 举报

4

主题

22

帖子

0

精华

中级会员

Rank: 3Rank: 3

积分
253
金钱
253
注册时间
2017-11-3
在线时间
33 小时
发表于 2018-5-25 09:02:21 | 显示全部楼层
厉害,膜拜大神
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则



关闭

原子哥极力推荐上一条 /2 下一条

正点原子公众号

QQ|手机版|OpenEdv-开源电子网 ( 粤ICP备12000418号-1 )

GMT+8, 2025-6-7 22:51

Powered by OpenEdv-开源电子网

© 2001-2030 OpenEdv-开源电子网

快速回复 返回顶部 返回列表