由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 那个围棋程序用的什么模型?
相关主题
大致思路是用reinforcement围棋是低级游戏
对待AI的看法,可以看出人的智力水平我为什么鼓励天朝的小孩学国际象棋
看大家还在讨论阿尔法狗,我准备再次科普下正能量来了,围棋包揽八强
关于狗的几个问题 (转载)为啥喜欢俄罗斯,看看这个就知道
围棋象棋输给计算机,为啥有些人像死了爹似的?说电脑能战胜围棋的都是没有指数的概念
围棋体现了中华文明的高度,我们的崛起是必然的支持围棋软件速胜论的基本都不是懂围棋的,我讲几句不一定对啊
围棋对付电脑太简单了围棋是逼格最高的棋类
制约围棋AI发展的两个问题什么时候围棋能成为最高智力游戏,才代表亚裔的崛起
相关话题的讨论汇总
话题: 围棋话题: nothing话题: innovative话题: 程序话题: 棋局
进入Military版参与讨论
1 (共1页)
d*****u
发帖数: 17243
1
以前学过一些简单的棋类程序,都是用类似Markov Decision Process
训练出一个决策函数,然后每一步根据棋局可以选出一个最优步
围棋这个states比较多,而且对战时间也长,那种方法不好用。可能要分拆棋局。
C**********e
发帖数: 23303
2
去看看那篇论文
写的很清楚
h*i
发帖数: 3446
3
That paper is very easy to read. Nothing fancy or innovative. Not
publishable at NIPS or any top level ML conferences. So they publish it in
Nature. LOL.

【在 d*****u 的大作中提到】
: 以前学过一些简单的棋类程序,都是用类似Markov Decision Process
: 训练出一个决策函数,然后每一步根据棋局可以选出一个最优步
: 围棋这个states比较多,而且对战时间也长,那种方法不好用。可能要分拆棋局。

h*i
发帖数: 3446
4
Yes, they use reinforcement learning (i.e. MDP), but they train policy
function and value function with separate deep neural networks. They also do
monte carlo tree search, like other Go programs.
In any case, read the paper and you will see that it's nothing innovative.

【在 d*****u 的大作中提到】
: 以前学过一些简单的棋类程序,都是用类似Markov Decision Process
: 训练出一个决策函数,然后每一步根据棋局可以选出一个最优步
: 围棋这个states比较多,而且对战时间也长,那种方法不好用。可能要分拆棋局。

1 (共1页)
进入Military版参与讨论
相关主题
什么时候围棋能成为最高智力游戏,才代表亚裔的崛起围棋象棋输给计算机,为啥有些人像死了爹似的?
普通琐男玩5子棋能赢围棋9段吗?围棋体现了中华文明的高度,我们的崛起是必然的
中国的围棋才体现了中华民族人人平等的思想围棋对付电脑太简单了
Google围棋的事又来了:大象关冰箱要几步?制约围棋AI发展的两个问题
大致思路是用reinforcement围棋是低级游戏
对待AI的看法,可以看出人的智力水平我为什么鼓励天朝的小孩学国际象棋
看大家还在讨论阿尔法狗,我准备再次科普下正能量来了,围棋包揽八强
关于狗的几个问题 (转载)为啥喜欢俄罗斯,看看这个就知道
相关话题的讨论汇总
话题: 围棋话题: nothing话题: innovative话题: 程序话题: 棋局