t******l 发帖数: 10908 | 1 如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是
造成全局上的雷蒙九段说的 “get really complicated”。
不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。
怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。
另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都
力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢,
死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。” |
a****t 发帖数: 7049 | 2 全局复杂的另一种说法就是不常见(这是复杂论用的定义),所以训练数据少,这部分
的神经网模拟的函数有问题,我觉得bug就在这里了。 |
m**o 发帖数: 9805 | 3 显然的
前几局,狗局面只要略优,都是尽量简化局面,不留变化
【在 t******l 的大作中提到】 : 如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是 : 造成全局上的雷蒙九段说的 “get really complicated”。 : 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。 : 怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。 : 另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都 : 力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢, : 死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。”
|
M*******p 发帖数: 5626 | 4 全局复杂,加上劫争,柯洁早指出来了,石头第三盘前和朋友们通宵复盘也总结出来了
。结果由于第三盘石头太勉强,被阿法狗完胜,结果一大帮键盘侠猛喷棋渣。 |
D*******r 发帖数: 2323 | 5 也不是光复杂就可以的,deepmind回去后肯定回细看白78手前后,黑的选点评估是把78
点漏算了,还是对78点的计算有误砍枝?
并不是所有复杂局面都能让狗迷惑,恰好让狗迷惑的复杂局面可能是可遇不可求的
【在 t******l 的大作中提到】 : 如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是 : 造成全局上的雷蒙九段说的 “get really complicated”。 : 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。 : 怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。 : 另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都 : 力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢, : 死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。”
|
t******l 发帖数: 10908 | 6 这局雷蒙九段开局时说李九段是更多用第二盘的战术,从抢边往中腹发展。
这样看来可能是两者结合,先搞定一定根基的前提下,然后依赖根基掀起全局大乱盘?
【在 M*******p 的大作中提到】 : 全局复杂,加上劫争,柯洁早指出来了,石头第三盘前和朋友们通宵复盘也总结出来了 : 。结果由于第三盘石头太勉强,被阿法狗完胜,结果一大帮键盘侠猛喷棋渣。
|
t******l 发帖数: 10908 | 7 指从阿狗算法角度的“复杂”:首先是更需要 policy network 做决定而不是 MCT。
然后是出现多个非正交大热点,使得按狗经验能拟合的 policy network 部分失效。
还有就是出现狗咬狗训练时,狗狗们都不愿往那种情况走的情况,导致不被训练到。
78
【在 D*******r 的大作中提到】 : 也不是光复杂就可以的,deepmind回去后肯定回细看白78手前后,黑的选点评估是把78 : 点漏算了,还是对78点的计算有误砍枝? : 并不是所有复杂局面都能让狗迷惑,恰好让狗迷惑的复杂局面可能是可遇不可求的
|
m**o 发帖数: 9805 | 8 不光是漏算的问题
78就是神手,算到了黑棋也没有太好的办法
78
【在 D*******r 的大作中提到】 : 也不是光复杂就可以的,deepmind回去后肯定回细看白78手前后,黑的选点评估是把78 : 点漏算了,还是对78点的计算有误砍枝? : 并不是所有复杂局面都能让狗迷惑,恰好让狗迷惑的复杂局面可能是可遇不可求的
|
l*****i 发帖数: 20533 | 9 我也认为这么打更好。早期确保局面平衡,各处有根,从而让自己之后的战斗更有选择
余地。然后率先在电脑的大模样里发动进攻,线条走乱一些。
【在 t******l 的大作中提到】 : 这局雷蒙九段开局时说李九段是更多用第二盘的战术,从抢边往中腹发展。 : 这样看来可能是两者结合,先搞定一定根基的前提下,然后依赖根基掀起全局大乱盘?
|
l*****i 发帖数: 20533 | 10 我看不懂的是103。什么意思?
【在 m**o 的大作中提到】 : 不光是漏算的问题 : 78就是神手,算到了黑棋也没有太好的办法 : : 78
|
a****l 发帖数: 8211 | 11 这个是有道理的。狗的全局搜索是使用快速下子的低准确度网络快速摆出变化来估计,
一旦全局复杂就很容易误判导致失误。局部的搜索是使用类似暴力算步的,不怕复杂。
【在 t******l 的大作中提到】 : 如果这不是简单 bug 的话,那看起来阿狗不怕局部乱,而是怕全局乱。也就是 : 造成全局上的雷蒙九段说的 “get really complicated”。 : 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT,其实不怕乱。 : 怕乱的可能是 training 的 policy 网,而 policy 网更多管全局的事儿。 : 另外如果狗对狗 training 都是目标以赢棋为主的话,说不定大部分狗都 : 力求把大局的局面简单化,结果出现狗对狗 training 的互相画地为牢, : 死锁在某一类 local 情况?出现 “三个臭皮匠,加起来还是臭皮匠。”
|
h*h 发帖数: 27852 | 12 就是当年对付武宫正树的办法。狗杀棋不如武功,行棋比武功还高
【在 t******l 的大作中提到】 : 这局雷蒙九段开局时说李九段是更多用第二盘的战术,从抢边往中腹发展。 : 这样看来可能是两者结合,先搞定一定根基的前提下,然后依赖根基掀起全局大乱盘?
|