由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 金明完9段点评AlphaGo: 缺点明显
相关主题
看来电脑围棋压倒人类就在今年了 (转载)哈比斯说没用高手期局训练啊
原来阿尔法下的是5秒版的ZEN推荐个免费的人工智能软件 Pachi
罗洗河让AlphaGo四子的说法没有什么错AlphaGo通俗的解释
围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法神经网络的结构决定了他的极限
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?阿法狗生怕人类还不够绝望
阿法狗怎么做到每天练习几十万盘棋?从第四盘棋看狗狗的弱点
阿法狗第二局最令人震惊的地方在于写过程序的都知道
接下来的李世石,将是痛不欲生的三局对局看大家讨论中比较少提这个 reinforcement learning
相关话题的讨论汇总
话题: alphago话题: 对局话题: 金明话题: 点评话题: network
进入Go版参与讨论
1 (共1页)
a******0
发帖数: 121
1
金明完9段点评 AlphaGo 与樊麾的对局:
https://www.youtube.com/watch?v=NHRHUHW6HQE
片面概括一下金9段对 AlphaGo 的点评(括号里话的是我加的):
(一)AlphaGo 实力很强,自己可能下不过(我觉得金9段过谦了),但应不是李世石
的对手;AlphaGo 实力大概是顶尖棋手让先的水平。
(二)AlphaGo 模仿人的走法(据Nature文章,AlphaGo用的两个神经网络Policy
Network和Value Network都是基于模仿(supervised learning)KGS Go对局);
(三)这几盘对局,AlphaGo 的几个主要缺陷体现在:
(1)对先手价值认识不够;
(2)对势的认识不足(国内高手同样认为AlphaGo重实地),缺乏大局观;
(3)太模仿人的常规走法, 没能走出高手都能看出的局部最佳招法;
(4) 不懂余味(势和余味的影响一般要对局多手后才能体现,AlphaGo 的 MCTS大
概看不到那么远)。
(四)对樊麾对局的评论:樊麾好像在走让子棋,走了一些骗招,被严厉惩罚;也许是
因为与业余棋手指导棋下的太多。
D*******r
发帖数: 2323
2
金明完总结的所有阿尔法的缺点,不过是站在人类角度上看的缺点而已。他没看到人类
和计算机在对局上的一个巨大区别:
这四条(先手价值,厚势价值,常规走法,余味)都说明人类棋手对局是想尽量保留不
确定性,而阿尔法的所有“缺点”都是在尽量减少不确定性,不确定性越少,计算越准
确,人类就越无反抗之力。

【在 a******0 的大作中提到】
: 金明完9段点评 AlphaGo 与樊麾的对局:
: https://www.youtube.com/watch?v=NHRHUHW6HQE
: 片面概括一下金9段对 AlphaGo 的点评(括号里话的是我加的):
: (一)AlphaGo 实力很强,自己可能下不过(我觉得金9段过谦了),但应不是李世石
: 的对手;AlphaGo 实力大概是顶尖棋手让先的水平。
: (二)AlphaGo 模仿人的走法(据Nature文章,AlphaGo用的两个神经网络Policy
: Network和Value Network都是基于模仿(supervised learning)KGS Go对局);
: (三)这几盘对局,AlphaGo 的几个主要缺陷体现在:
: (1)对先手价值认识不够;
: (2)对势的认识不足(国内高手同样认为AlphaGo重实地),缺乏大局观;

O**l
发帖数: 12923
3
这四条无非就是 机器没寻求局部最优
程序本身就没有要求选择局部最优
机器只要算出来全局赢了 根本不care局部到底怎么样 有没有更好解

【在 D*******r 的大作中提到】
: 金明完总结的所有阿尔法的缺点,不过是站在人类角度上看的缺点而已。他没看到人类
: 和计算机在对局上的一个巨大区别:
: 这四条(先手价值,厚势价值,常规走法,余味)都说明人类棋手对局是想尽量保留不
: 确定性,而阿尔法的所有“缺点”都是在尽量减少不确定性,不确定性越少,计算越准
: 确,人类就越无反抗之力。

W*****t
发帖数: 2425
4
这怎么感觉象原来的棋待诏陪皇上下棋。不追求局部最优。小胜即可。

【在 O**l 的大作中提到】
: 这四条无非就是 机器没寻求局部最优
: 程序本身就没有要求选择局部最优
: 机器只要算出来全局赢了 根本不care局部到底怎么样 有没有更好解

O**l
发帖数: 12923
5
MCT 没有赢多少的概念
只有胜的概率 领先情况下会非常保守 不会追求局部最优
确实他比你水平高 就是一直在下指导棋
看棋谱看不出他的实力上限

【在 W*****t 的大作中提到】
: 这怎么感觉象原来的棋待诏陪皇上下棋。不追求局部最优。小胜即可。
1 (共1页)
进入Go版参与讨论
相关主题
看大家讨论中比较少提这个 reinforcement learning田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?
李师师敢赌一百万美元5:0 fan hui么阿法狗怎么做到每天练习几十万盘棋?
四子棋zz阿法狗第二局最令人震惊的地方在于
听上去,李思思第五局策略已定?接下来的李世石,将是痛不欲生的三局对局
看来电脑围棋压倒人类就在今年了 (转载)哈比斯说没用高手期局训练啊
原来阿尔法下的是5秒版的ZEN推荐个免费的人工智能软件 Pachi
罗洗河让AlphaGo四子的说法没有什么错AlphaGo通俗的解释
围棋软件Zen,Pachi作者对AlphaGo提的一些问题和看法神经网络的结构决定了他的极限
相关话题的讨论汇总
话题: alphago话题: 对局话题: 金明话题: 点评话题: network