大家都在说狗没算到那一招 - Go版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 大家都在说狗没算到那一招

相关主题
● 从第四盘棋看狗狗的弱点	● 李世石吃亏在明处
● 神经网络的结构决定了他的极限	● 阿尔法最大的困难还是局面评估
● 锵锵请的港大计算机系主任不懂啊	● 阿发狗片面追求胜率
● Can anyone explain neuron network?	● 金明完9段点评AlphaGo: 缺点明显
● Facebook’s AI tech mimics how humans learn	● 原来阿尔法下的是５秒版的ＺＥＮ
● 阿法狗下围棋离人类还差的远	● 阿法狗生怕人类还不够绝望
● 技术贴（懂围棋的请进）	● 写过程序的都知道
● 猜一下几个AlphaGo崩了的原因	● 看大家讨论中比较少提这个 reinforcement learning

相关话题的讨论汇总
话题: 一招话题: 没算话题: 算法话题: bug话题: mct

进入Go版参与讨论

1

(共1页)

a***m 发帖数: 5037	1 是算法本身问题但就算miss了一招，后面也可以接着好好下啊，这是不难客服的bug吧
O**l 发帖数: 12923	2 不容易 policy network bias太大在这个地方导致分布不均影响了MCT 唯一快速fix的方法可能是改变用时策略 MCT增加到足够多分布会自我修复但是需要增加极多可能稍微有效点
r******i 发帖数: 1445	3 看那个所谓“bug”的性质了。如果是神经网络本身的盲点或者是遇到了horizon effect，是很难在不动基本算法的基础上改进的。【在 a***m 的大作中提到】 : 是算法本身问题 : 但就算miss了一招，后面也可以接着好好下啊，这是不难客服的bug吧
a****t 发帖数: 7049	4 我觉得谷歌还是考虑到这个构架的的泛化性的，如果纯对付围棋可以加入许多特殊专业知识为基础的算法来对付这种问题，或更直接的把人对一些局面的特定思路用算法表达。比如这次它没用开局数据库，也是一个例子。【在 r******i 的大作中提到】 : 看那个所谓“bug”的性质了。 : 如果是神经网络本身的盲点或者是遇到了horizon effect，是很难在不动基本算法的基 : 础上改进的。
b*******8 发帖数: 37364	5 怕就怕根本不是Bug，是那个模型网络的必然，就像那篇用图片欺骗AI的文章说的那样，人类认知的围棋好棋，跟电脑模型认知的，不是一回事。
d*********8 发帖数: 2192	6 如果加入特殊算法做边界条件估计现有数据得重新再来一次了而且这些人为的边界条件很可能直接把水平降到初学者达。【在 a****t 的大作中提到】 : 我觉得谷歌还是考虑到这个构架的的泛化性的，如果纯对付围棋可以加入许多特殊专业 : 知识为基础的算法来对付这种问题，或更直接的把人对一些局面的特定思路用算法表达。 : 比如这次它没用开局数据库，也是一个例子。

1

(共1页)

进入Go版参与讨论

相关主题
● 看大家讨论中比较少提这个 reinforcement learning	● Facebook’s AI tech mimics how humans learn
● 阿法狗怎样算气的？	● 阿法狗下围棋离人类还差的远
● 科学：科学家：民科VS围棋：职业：业余[酱凯利@tom]	● 技术贴（懂围棋的请进）
● monte carlo tree search很神奇	● 猜一下几个AlphaGo崩了的原因
● 从第四盘棋看狗狗的弱点	● 李世石吃亏在明处
● 神经网络的结构决定了他的极限	● 阿尔法最大的困难还是局面评估
● 锵锵请的港大计算机系主任不懂啊	● 阿发狗片面追求胜率
● Can anyone explain neuron network?	● 金明完9段点评AlphaGo: 缺点明显

相关话题的讨论汇总
话题: 一招话题: 没算话题: 算法话题: bug话题: mct

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)