这局李九段看起来是乱中取胜 - Go版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 这局李九段看起来是乱中取胜

相关主题
● 神经网络的结构决定了他的极限	● 李世石吃亏在明处
● 从第四盘棋看狗狗的弱点	● 阿尔法最大的困难还是局面评估
● 当年怎么对付武宫正树的，类似办法可以对付狗	● 听上去，李思思第五局策略已定？
● 技术贴（懂围棋的请进）	● 阿法狗第四局最终并不是输在对妙手的漏算上
● 哈萨比斯：AlphaGo回国升级	● 现在回头再看第4局
● AlphaGo通俗的解释	● 我从来没有说狗一无是处，事实上狗是全局棋高手
● 关于林海峰	● 阿狗的局部计算力问题
● 接下来的李世石，将是痛不欲生的三局对局	● 业余5段也可以帮助职业九段长棋

相关话题的讨论汇总
话题: 全局话题: 九段话题: 局李话题: training话题: 复杂

进入Go版参与讨论

1

(共1页)

t******l 发帖数: 10908	1 如果这不是简单 bug 的话，那看起来阿狗不怕局部乱，而是怕全局乱。也就是造成全局上的雷蒙九段说的 “get really complicated”。不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT，其实不怕乱。怕乱的可能是 training 的 policy 网，而 policy 网更多管全局的事儿。另外如果狗对狗 training 都是目标以赢棋为主的话，说不定大部分狗都力求把大局的局面简单化，结果出现狗对狗 training 的互相画地为牢，死锁在某一类 local 情况？出现 “三个臭皮匠，加起来还是臭皮匠。”
a****t 发帖数: 7049	2 全局复杂的另一种说法就是不常见（这是复杂论用的定义），所以训练数据少，这部分的神经网模拟的函数有问题，我觉得bug就在这里了。
m**o 发帖数: 9805	3 显然的前几局，狗局面只要略优，都是尽量简化局面，不留变化【在 t******l 的大作中提到】 : 如果这不是简单 bug 的话，那看起来阿狗不怕局部乱，而是怕全局乱。也就是 : 造成全局上的雷蒙九段说的 “get really complicated”。 : 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT，其实不怕乱。 : 怕乱的可能是 training 的 policy 网，而 policy 网更多管全局的事儿。 : 另外如果狗对狗 training 都是目标以赢棋为主的话，说不定大部分狗都 : 力求把大局的局面简单化，结果出现狗对狗 training 的互相画地为牢， : 死锁在某一类 local 情况？出现 “三个臭皮匠，加起来还是臭皮匠。”
M*******p 发帖数: 5626	4 全局复杂，加上劫争，柯洁早指出来了，石头第三盘前和朋友们通宵复盘也总结出来了。结果由于第三盘石头太勉强，被阿法狗完胜，结果一大帮键盘侠猛喷棋渣。
D*******r 发帖数: 2323	5 也不是光复杂就可以的，deepmind回去后肯定回细看白78手前后，黑的选点评估是把78 点漏算了，还是对78点的计算有误砍枝？并不是所有复杂局面都能让狗迷惑，恰好让狗迷惑的复杂局面可能是可遇不可求的【在 t******l 的大作中提到】 : 如果这不是简单 bug 的话，那看起来阿狗不怕局部乱，而是怕全局乱。也就是 : 造成全局上的雷蒙九段说的 “get really complicated”。 : 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT，其实不怕乱。 : 怕乱的可能是 training 的 policy 网，而 policy 网更多管全局的事儿。 : 另外如果狗对狗 training 都是目标以赢棋为主的话，说不定大部分狗都 : 力求把大局的局面简单化，结果出现狗对狗 training 的互相画地为牢， : 死锁在某一类 local 情况？出现 “三个臭皮匠，加起来还是臭皮匠。”
t******l 发帖数: 10908	6 这局雷蒙九段开局时说李九段是更多用第二盘的战术，从抢边往中腹发展。这样看来可能是两者结合，先搞定一定根基的前提下，然后依赖根基掀起全局大乱盘？【在 M*******p 的大作中提到】 : 全局复杂，加上劫争，柯洁早指出来了，石头第三盘前和朋友们通宵复盘也总结出来了 : 。结果由于第三盘石头太勉强，被阿法狗完胜，结果一大帮键盘侠猛喷棋渣。
t******l 发帖数: 10908	7 指从阿狗算法角度的“复杂”：首先是更需要 policy network 做决定而不是 MCT。然后是出现多个非正交大热点，使得按狗经验能拟合的 policy network 部分失效。还有就是出现狗咬狗训练时，狗狗们都不愿往那种情况走的情况，导致不被训练到。 78 【在 D*******r 的大作中提到】 : 也不是光复杂就可以的，deepmind回去后肯定回细看白78手前后，黑的选点评估是把78 : 点漏算了，还是对78点的计算有误砍枝？ : 并不是所有复杂局面都能让狗迷惑，恰好让狗迷惑的复杂局面可能是可遇不可求的
m**o 发帖数: 9805	8 不光是漏算的问题 78就是神手，算到了黑棋也没有太好的办法 78 【在 D*******r 的大作中提到】 : 也不是光复杂就可以的，deepmind回去后肯定回细看白78手前后，黑的选点评估是把78 : 点漏算了，还是对78点的计算有误砍枝？ : 并不是所有复杂局面都能让狗迷惑，恰好让狗迷惑的复杂局面可能是可遇不可求的
l*****i 发帖数: 20533	9 我也认为这么打更好。早期确保局面平衡，各处有根，从而让自己之后的战斗更有选择余地。然后率先在电脑的大模样里发动进攻，线条走乱一些。【在 t******l 的大作中提到】 : 这局雷蒙九段开局时说李九段是更多用第二盘的战术，从抢边往中腹发展。 : 这样看来可能是两者结合，先搞定一定根基的前提下，然后依赖根基掀起全局大乱盘？
l*****i 发帖数: 20533	10 我看不懂的是103。什么意思？【在 m**o 的大作中提到】 : 不光是漏算的问题 : 78就是神手，算到了黑棋也没有太好的办法 : : 78
a****l 发帖数: 8211	11 这个是有道理的。狗的全局搜索是使用快速下子的低准确度网络快速摆出变化来估计，一旦全局复杂就很容易误判导致失误。局部的搜索是使用类似暴力算步的，不怕复杂。【在 t******l 的大作中提到】 : 如果这不是简单 bug 的话，那看起来阿狗不怕局部乱，而是怕全局乱。也就是 : 造成全局上的雷蒙九段说的 “get really complicated”。 : 不过可能也应该能理解。类似 Deep Blue 这种暴力计算的 MCT，其实不怕乱。 : 怕乱的可能是 training 的 policy 网，而 policy 网更多管全局的事儿。 : 另外如果狗对狗 training 都是目标以赢棋为主的话，说不定大部分狗都 : 力求把大局的局面简单化，结果出现狗对狗 training 的互相画地为牢， : 死锁在某一类 local 情况？出现 “三个臭皮匠，加起来还是臭皮匠。”
h*h 发帖数: 27852	12 就是当年对付武宫正树的办法。狗杀棋不如武功，行棋比武功还高【在 t******l 的大作中提到】 : 这局雷蒙九段开局时说李九段是更多用第二盘的战术，从抢边往中腹发展。 : 这样看来可能是两者结合，先搞定一定根基的前提下，然后依赖根基掀起全局大乱盘？

1

(共1页)

进入Go版参与讨论

相关主题
● 业余5段也可以帮助职业九段长棋	● 哈萨比斯：AlphaGo回国升级
● zz: 本因坊决赛第6局羽根直树3-3扳平山下迎来决胜局	● AlphaGo通俗的解释
● 如果几个九段商量着来对阵机器狗，是不是必赢？	● 关于林海峰
● 仔细想了一下，阿法狗的算法在劫争上完全没有漏洞	● 接下来的李世石，将是痛不欲生的三局对局
● 神经网络的结构决定了他的极限	● 李世石吃亏在明处
● 从第四盘棋看狗狗的弱点	● 阿尔法最大的困难还是局面评估
● 当年怎么对付武宫正树的，类似办法可以对付狗	● 听上去，李思思第五局策略已定？
● 技术贴（懂围棋的请进）	● 阿法狗第四局最终并不是输在对妙手的漏算上

相关话题的讨论汇总
话题: 全局话题: 九段话题: 局李话题: training话题: 复杂

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)