由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 用一种真正便于棋手理解的方式解释alphago的算法
相关主题
看来电脑围棋压倒人类就在今年了这个alphaGo是怎么判断value的?
计算机在无概率的棋类完胜人类只是时间上的问题李世石:AlphaGo和我差2子 我绝不会输
几个高断选手同时出主意来一起和狗下能赢吗Google AlphaGo 人工智能挑战人类围棋冠军 (转载)
和电脑下要大量的新招和骗招Google围棋的事又来了:大象关冰箱要几步?
我提一个对付Alphago的方法只要不是0:5就算人类胜
zt AlphaGo可能会发现另外一种围棋美,是我们想象不到的 (转载)机器狗第二盘不懂征子,和劫争一样,超出计算范围,
三个异常 谷歌围棋AI击败欧洲冠军是过度营销?专业科普AlphaGO
是不是狗狗花重金贿赂了二流二段棋手Master (P) 拍着中国职业棋手的脑袋说中文 “您下得非常好。” (转载)
相关话题的讨论汇总
话题: 研讨话题: alphago话题: 落子话题: uct话题: mcts
进入Military版参与讨论
1 (共1页)
h*h
发帖数: 27852
1
发信人: softmagic (魔术师), 信区: Weiqi
标 题: 用一种真正便于棋手理解的方式解释alphago的算法
发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
其实讲深度学习没有什么太大意义,那些都是离线做好的,
alphago下棋的时候并不需要深度学习。
但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
AlphaGo 的MCTS算法相当于几万个业余3-5段的选手,经过合理的组织,在
1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
获胜的招法。
这种合理组织并且表现在:
1.每个局面下,越有“合理招法”希望的落子,会被更多的“研讨对局”,通常比如当前
局面下,最有希望的落子位置会比,希望第二大的落子位置研讨次数多出一个数量级。
这个就是UCT算法,理论上来说,UCT一定会收敛到最优解。
但是需要的时间不切合实际。
2.比较容易被忽略的是,在研讨过程中,他们的各个局部的研究结论会以一种
高效的形式彼此沟通,换句话说,关于目前局面发现出来的知识是共享的。
这个非常有用是因为研讨的局面非常多的局部雷同性。
补充一点,
在MCTS+UCT刚出来的时候,一下子棋力提高了四个子。
但是发展起来后遇到的提高的瓶颈就是我这里说的“研讨对局”的质量不高,
有时候甚至相当于随机落子。
当时的研究就推测如果“研究对局”的质量达到业余3、5段的水平,
MCTS就可以PK职业选手了。
现在的发展只是证明了预测的正确。这种做法的威力确实很大。
O**l
发帖数: 12923
2
赞这个说到点子上来
Uct一出来 9*9 立即无敌
19*19就是时间问题了
[在 hsh (三胡) 的大作中提到:]
:发信人: softmagic (魔术师), 信区: Weiqi
:标 题: 用一种真正便于棋手理解的方式解释alphago的算法
:...........
h*h
发帖数: 27852
3
类似game show 让观众投票选达案,基本都是正确的

【在 O**l 的大作中提到】
: 赞这个说到点子上来
: Uct一出来 9*9 立即无敌
: 19*19就是时间问题了
: [在 hsh (三胡) 的大作中提到:]
: :发信人: softmagic (魔术师), 信区: Weiqi
: :标 题: 用一种真正便于棋手理解的方式解释alphago的算法
: :...........

b*******8
发帖数: 37364
4
一个项羽再厉害 也打不过一个万人方阵

★ 发自iPhone App: ChineseWeb 1.0.6

【在 h*h 的大作中提到】
: 发信人: softmagic (魔术师), 信区: Weiqi
: 标 题: 用一种真正便于棋手理解的方式解释alphago的算法
: 发信站: 水木社区 (Thu Mar 10 07:58:11 2016), 转信
: 其实讲深度学习没有什么太大意义,那些都是离线做好的,
: alphago下棋的时候并不需要深度学习。
: 但是事先做好的深度学习训练的模型保证了下面讲的参与“研讨”的选手的质量水平。
: AlphaGo 的MCTS算法相当于几万个业余3-5段的选手,经过合理的组织,在
: 1分钟内研讨了几百万盘当前局面下的后续对局发展。最终得出一个最有希望
: 获胜的招法。
: 这种合理组织并且表现在:

1 (共1页)
进入Military版参与讨论
相关主题
Master (P) 拍着中国职业棋手的脑袋说中文 “您下得非常好。” (转载)我提一个对付Alphago的方法
人工智能下围棋超过人类, 是一个虚假结论, 纯属误导!zt AlphaGo可能会发现另外一种围棋美,是我们想象不到的 (转载)
AlphaGo之父:关于围棋,人类3000年来犯了一个错zt三个异常 谷歌围棋AI击败欧洲冠军是过度营销?
据传 Google AlphaGo 用马甲在弈城围棋网 练级是不是狗狗花重金贿赂了二流二段棋手
看来电脑围棋压倒人类就在今年了这个alphaGo是怎么判断value的?
计算机在无概率的棋类完胜人类只是时间上的问题李世石:AlphaGo和我差2子 我绝不会输
几个高断选手同时出主意来一起和狗下能赢吗Google AlphaGo 人工智能挑战人类围棋冠军 (转载)
和电脑下要大量的新招和骗招Google围棋的事又来了:大象关冰箱要几步?
相关话题的讨论汇总
话题: 研讨话题: alphago话题: 落子话题: uct话题: mcts