由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 这局李九段看起来是乱中取胜
相关主题
神经网络的结构决定了他的极限李世石吃亏在明处
从第四盘棋看狗狗的弱点阿尔法最大的困难还是局面评估
当年怎么对付武宫正树的,类似办法可以对付狗听上去,李思思第五局策略已定?
技术贴(懂围棋的请进)阿法狗第四局最终并不是输在对妙手的漏算上
哈萨比斯:AlphaGo回国升级现在回头再看第4局
AlphaGo通俗的解释我从来没有说狗一无是处,事实上狗是全局棋高手
关于林海峰阿狗的局部计算力问题
接下来的李世石,将是痛不欲生的三局对局业余5段也可以帮助职业九段长棋
相关话题的讨论汇总
话题: 全局话题: 九段话题: 局李话题: training话题: 复杂
进入Go版参与讨论
1 (共1页)
t******l
发帖数: 10908
1
如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是
造成全局上的雷蒙九段说的 “get really complicated”。
不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。
怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。
另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都
力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢,
死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。”
a****t
发帖数: 7049
2
全局复杂的另一种说法就是不常见(这是复杂论用的定义),所以训练数据少,这部分
的神经网模拟的函数有问题,我觉得bug就在这里了。
m**o
发帖数: 9805
3
显然的
前几局,狗局面只要略优,都是尽量简化局面,不留变化

【在 t******l 的大作中提到】
: 如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是
: 造成全局上的雷蒙九段说的 “get really complicated”。
: 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。
: 怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。
: 另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都
: 力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢,
: 死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。”

M*******p
发帖数: 5626
4
全局复杂,加上劫争,柯洁早指出来了,石头第三盘前和朋友们通宵复盘也总结出来了
。结果由于第三盘石头太勉强,被阿法狗完胜,结果一大帮键盘侠猛喷棋渣。
D*******r
发帖数: 2323
5
也不是光复杂就可以的,deepmind回去后肯定回细看白78手前后,黑的选点评估是把78
点漏算了,还是对78点的计算有误砍枝?
并不是所有复杂局面都能让狗迷惑,恰好让狗迷惑的复杂局面可能是可遇不可求的

【在 t******l 的大作中提到】
: 如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是
: 造成全局上的雷蒙九段说的 “get really complicated”。
: 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。
: 怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。
: 另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都
: 力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢,
: 死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。”

t******l
发帖数: 10908
6
这局雷蒙九段开局时说李九段是更多用第二盘的战术,从抢边往中腹发展。
这样看来可能是两者结合,先搞定一定根基的前提下,然后依赖根基掀起全局大乱盘?

【在 M*******p 的大作中提到】
: 全局复杂,加上劫争,柯洁早指出来了,石头第三盘前和朋友们通宵复盘也总结出来了
: 。结果由于第三盘石头太勉强,被阿法狗完胜,结果一大帮键盘侠猛喷棋渣。

t******l
发帖数: 10908
7
指从阿狗算法角度的“复杂”:首先是更需要 policy network 做决定而不是 MCT。
然后是出现多个非正交大热点,使得按狗经验能拟合的 policy network 部分失效。
还有就是出现狗咬狗训练时,狗狗们都不愿往那种情况走的情况,导致不被训练到。

78

【在 D*******r 的大作中提到】
: 也不是光复杂就可以的,deepmind回去后肯定回细看白78手前后,黑的选点评估是把78
: 点漏算了,还是对78点的计算有误砍枝?
: 并不是所有复杂局面都能让狗迷惑,恰好让狗迷惑的复杂局面可能是可遇不可求的

m**o
发帖数: 9805
8
不光是漏算的问题
78就是神手,算到了黑棋也没有太好的办法

78

【在 D*******r 的大作中提到】
: 也不是光复杂就可以的,deepmind回去后肯定回细看白78手前后,黑的选点评估是把78
: 点漏算了,还是对78点的计算有误砍枝?
: 并不是所有复杂局面都能让狗迷惑,恰好让狗迷惑的复杂局面可能是可遇不可求的

l*****i
发帖数: 20533
9
我也认为这么打更好。早期确保局面平衡,各处有根,从而让自己之后的战斗更有选择
余地。然后率先在电脑的大模样里发动进攻,线条走乱一些。

【在 t******l 的大作中提到】
: 这局雷蒙九段开局时说李九段是更多用第二盘的战术,从抢边往中腹发展。
: 这样看来可能是两者结合,先搞定一定根基的前提下,然后依赖根基掀起全局大乱盘?

l*****i
发帖数: 20533
10
我看不懂的是103。什么意思?

【在 m**o 的大作中提到】
: 不光是漏算的问题
: 78就是神手,算到了黑棋也没有太好的办法
:
: 78

a****l
发帖数: 8211
11
这个是有道理的。狗的全局搜索是使用快速下子的低准确度网络快速摆出变化来估计,
一旦全局复杂就很容易误判导致失误。局部的搜索是使用类似暴力算步的,不怕复杂。

【在 t******l 的大作中提到】
: 如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是
: 造成全局上的雷蒙九段说的 “get really complicated”。
: 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。
: 怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。
: 另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都
: 力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢,
: 死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。”

h*h
发帖数: 27852
12
就是当年对付武宫正树的办法。狗杀棋不如武功,行棋比武功还高

【在 t******l 的大作中提到】
: 这局雷蒙九段开局时说李九段是更多用第二盘的战术,从抢边往中腹发展。
: 这样看来可能是两者结合,先搞定一定根基的前提下,然后依赖根基掀起全局大乱盘?

1 (共1页)
进入Go版参与讨论
相关主题
业余5段也可以帮助职业九段长棋哈萨比斯:AlphaGo回国升级
zz: 本因坊决赛第6局 羽根直树3-3扳平山下迎来决胜局AlphaGo通俗的解释
如果几个九段商量着来对阵机器狗,是不是必赢?关于林海峰
仔细想了一下,阿法狗的算法在劫争上完全没有漏洞接下来的李世石,将是痛不欲生的三局对局
神经网络的结构决定了他的极限李世石吃亏在明处
从第四盘棋看狗狗的弱点阿尔法最大的困难还是局面评估
当年怎么对付武宫正树的,类似办法可以对付狗听上去,李思思第五局策略已定?
技术贴(懂围棋的请进)阿法狗第四局最终并不是输在对妙手的漏算上
相关话题的讨论汇总
话题: 全局话题: 九段话题: 局李话题: training话题: 复杂