由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 大家都在说狗没算到那一招
相关主题
从第四盘棋看狗狗的弱点李世石吃亏在明处
神经网络的结构决定了他的极限阿尔法最大的困难还是局面评估
锵锵请的港大计算机系主任不懂啊阿发狗片面追求胜率
Can anyone explain neuron network?金明完9段点评AlphaGo: 缺点明显
Facebook’s AI tech mimics how humans learn原来阿尔法下的是5秒版的ZEN
阿法狗下围棋离人类还差的远阿法狗生怕人类还不够绝望
技术贴(懂围棋的请进)写过程序的都知道
猜一下几个AlphaGo崩了的原因看大家讨论中比较少提这个 reinforcement learning
相关话题的讨论汇总
话题: 一招话题: 没算话题: 算法话题: bug话题: mct
进入Go版参与讨论
1 (共1页)
a***m
发帖数: 5037
1
是算法本身问题
但就算miss了一招,后面也可以接着好好下啊,这是不难客服的bug吧
O**l
发帖数: 12923
2
不容易
policy network bias太大在这个地方导致分布不均 影响了MCT
唯一快速fix的方法可能是改变用时策略
MCT增加到足够多 分布会自我修复 但是需要增加极多
可能稍微有效点
r******i
发帖数: 1445
3
看那个所谓“bug”的性质了。
如果是神经网络本身的盲点或者是遇到了horizon effect,是很难在不动基本算法的基
础上改进的。

【在 a***m 的大作中提到】
: 是算法本身问题
: 但就算miss了一招,后面也可以接着好好下啊,这是不难客服的bug吧

a****t
发帖数: 7049
4
我觉得谷歌还是考虑到这个构架的的泛化性的,如果纯对付围棋可以加入许多特殊专业
知识为基础的算法来对付这种问题,或更直接的把人对一些局面的特定思路用算法表达。
比如这次它没用开局数据库,也是一个例子。

【在 r******i 的大作中提到】
: 看那个所谓“bug”的性质了。
: 如果是神经网络本身的盲点或者是遇到了horizon effect,是很难在不动基本算法的基
: 础上改进的。

b*******8
发帖数: 37364
5
怕就怕根本不是Bug,是那个模型网络的必然,就像那篇用图片欺骗AI的文章说的那样
,人类认知的围棋好棋,跟电脑模型认知的,不是一回事。
d*********8
发帖数: 2192
6
如果加入特殊算法做边界条件 估计现有数据得重新再来一次了 而且这些人为的边界条
件很可能直接把水平降到初学者

达。

【在 a****t 的大作中提到】
: 我觉得谷歌还是考虑到这个构架的的泛化性的,如果纯对付围棋可以加入许多特殊专业
: 知识为基础的算法来对付这种问题,或更直接的把人对一些局面的特定思路用算法表达。
: 比如这次它没用开局数据库,也是一个例子。

1 (共1页)
进入Go版参与讨论
相关主题
看大家讨论中比较少提这个 reinforcement learningFacebook’s AI tech mimics how humans learn
阿法狗怎样算气的?阿法狗下围棋离人类还差的远
科学:科学家:民科VS围棋:职业:业余[酱凯利@tom]技术贴(懂围棋的请进)
monte carlo tree search很神奇猜一下几个AlphaGo崩了的原因
从第四盘棋看狗狗的弱点李世石吃亏在明处
神经网络的结构决定了他的极限阿尔法最大的困难还是局面评估
锵锵请的港大计算机系主任不懂啊阿发狗片面追求胜率
Can anyone explain neuron network?金明完9段点评AlphaGo: 缺点明显
相关话题的讨论汇总
话题: 一招话题: 没算话题: 算法话题: bug话题: mct