下围棋计算机优势很明显 - Military版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Military版 - 下围棋计算机优势很明显

相关主题
● Google围棋击败职业选手，即将挑战李世石 (转载)	● Google围棋的事又来了：大象关冰箱要几步？
● 亚洲理科生毫无尊严啊	● 人工智能与核武器，哪个更危险？(zz)
● 人是疯狂的，但机器不是	● 十分怀疑这次GOOGLE的程序有猫腻
● AlphaGo的程序员中间有多少华人？	● 弈城惊现疑似谷歌团队ID 金灿佑：棋谱似人工智能
● 16625份AI论文透露：深度学习正在走向终点？	● 据传 Google AlphaGo 用马甲在弈城围棋网练级
● Deepmind与暴雪开源接口，人工智能挑战星际争霸到哪一步了？	● alphaGo的胜利说明AI和码工一定崛起
● 阿尔法狗再进化:自学3天100:0碾压旧狗	● 想打败alphago，要首先回答一个问题
● zt AlphaGo可能会发现另外一种围棋美，是我们想象不到的 (转载)	● 有啥电脑上可以实现的游戏是电脑无法赢人类的？

相关话题的讨论汇总
话题: alphago话题: demis话题: 围棋话题: david话题: erica

进入Military版参与讨论

(共1页)

a**********h
发帖数: 370

下棋主要是要培养reading skill，就是怎么面对一个空盘，想象出几百步以后棋盘摆
满时的样子。
一般人都是要锻炼很久，但是对计算机完全不是问题。

g******t
发帖数: 11249

就跟人生规划一样
牛逼的人未必多聪明，只不过比别人多看了几步（年）而已

【在 a**********h 的大作中提到】

: 下棋主要是要培养reading skill，就是怎么面对一个空盘，想象出几百步以后棋盘摆
: 满时的样子。
: 一般人都是要锻炼很久，但是对计算机完全不是问题。

c*********3
发帖数: 6862

不懂装懂，笑死人

V********n
发帖数: 3061

要用有限的资源做几乎等于无限大的计算，不是那么容易的。这是计算机科学里终极的
课题

a**********h
发帖数: 370

傻逼，你会下吗

【在 c*********3 的大作中提到】

: 不懂装懂，笑死人

x********e
发帖数: 35261

确实是不懂装懂。稍微训练一下算几百步不成问题。难的是各种变化的形式判断。现在
的AI也不是傻算到死啊。

c*********3
发帖数: 6862

我不用会下（虽然我也确实会围棋），我只是比你看的东西多一点。你觉得alpha go就
是简单的机器试错死算，简直贻笑大方。
AlphaGo设计师黄士杰：“最强的学习技能在人类的脑袋里”
http://www.ftchinese.com/story/001075040#adchannelID=2100
AlphaGo是怎么开始的？
回到一开始，AlphaGo到底是怎么开始的？起点是有三组人马的聚集：Deepmind首席执
行官Demis Hassabis与AlphaGo项目领导David Silver、我、还有两位谷歌大脑(Google
brain)的同事Chris Maddison和Ilya Sutskever。
Demis和David原本是剑桥大学的同学，友情深厚。对西方人来说，当1997年IBM超级电
脑“深蓝”赢了西洋棋棋王卡斯巴罗夫之后，就只剩下流传几千年的中国围棋，是人工
智能发展的极大挑战。一开始，很多研究人员想把研究西洋棋的技术移到围棋上，但都
失败了。在2006年蒙特卡洛树搜索出来后，研究才提升一阶，让机器棋手的水平能达到
业余三段，但离职业棋士一段还有距离。Demis和David心中开始藏有一个梦，希望有一
天要能做出一个很强的围棋程式。
但有梦的不只有他们，故事的另一条线还有我。
在就读台湾师范大学资讯工程博士班时，我每天埋头解bug、写代码，就是希望做一个
很强的围棋程序。2010年，我研发出的围棋计算机程序Erica（事实上是用我妻子的名
字来命名），在计算机奥林匹亚获得 19 路围棋的冠军。虽然Erica只是单机版，但它
打败了用了6台PC的日本程序Zen跟其他参赛者，就像小虾米对抗大鲸鱼。当年还在英国
当教授的David，在比赛后写信问我有没有兴趣加入Deepmind，隔年我也正式加入团队
，成为第40号员工。
我还记得当年面试，老板问我，能做出Erica有什么感觉？我回答，满有成就的。Demis
点头，他明白我的感觉。
2014年，Google收购Deepmind，AlphaGo项目也正式浮现。Demis起初还在教书、还不是
全职员工，就常三不五时走过来跟我讨论围棋项目的想法。真的要开始时，我们其实都
已经有些准备。
既然决定要做围棋项目，当时我和Demis有一个共识，就是绝对不要复制Erica。Erica
其实有它的极限，最勉强的就是达到业余三段，继续复制的意义不大。我们想做不一样
的事，希望能运用到深度学习的原理。过了几个月，团队又增加了两个人，包括深度学
习之父以及带动深度学习革命的研究者。
我们怎么判断深度学习可能应用到围棋？如果人类可以一看棋盘就知道下哪一步会是好
棋，那么神经网络也可能办得到这种"直觉"。但如果人类得想五分钟才能给出答案，神
经网络可能办不到。一开始，我们训练AlphaGo从人类的棋谱去学习人类的直觉。我还
记得第一次测试神经网络，没想到能表现得那么好，百分之百对战都不会输，是一种碾
压式的胜利。
AlphaGo第二个突破的是价值网络。我记得当David跟我说他有这样一个点子时，我还质
疑，这会成吗？当我们把策略网络(Policy Network)做出来后，最强的程式可以达到70
%到80％的胜率，算得上是世界最强的。但老板的目标不只于此，我们又继续找人、继
续扩充团队。
这过程其实很辛苦，尝试很多，譬如网络要多深、要用什么架构？数据库有没有问题？
最终检验的，还是看AlphaGo有没有变强。过了一个月之后，我们找到了问题并且解决
掉，我仍然记得，旧版AlphaGo配上价值网络产生的新版AlphaGo，第一次的实验结果是
达到95%的胜率，棋力非常强。可以这么说，AlphaGo的成功就是深度学习与强化学习的
胜利，因为两者结合在一起，建构判断形式的价值网络(Value Network)，后来也成为
AlphaGo Zero的主要理论。
当价值网络出来后，Demis希望我们能与欧洲职业一段棋手进行比赛。当下，我除了要
做价值网络，还要研究平行网络搜索技术，Demis走过来说要比赛，我只想着：真的那
么有信心吗？
后来我们与欧洲围棋冠军樊麾进行比赛，最终以5比0获胜，这结果其实也很不可思议。
我记得樊麾输了第二盘棋后，想出去走走，会说中文的我，原本想去陪他，他挥挥手，
“不用，我自己出去透透气。”
难能可贵的是，樊麾是第一个被AI打败的职业棋士，但他的态度非常正面。樊麾在第五
盘棋虽然认输了，但他对AI并没有感到害怕，后来甚至也加入了团队，帮忙测试
AlphaGo。

【在 a**********h 的大作中提到】

: 傻逼，你会下吗

a**********h
发帖数: 370

读出各种变化也是reading skill，傻逼
人类唯一的优势是揣测对方的心理意图

【在 x********e 的大作中提到】

: 确实是不懂装懂。稍微训练一下算几百步不成问题。难的是各种变化的形式判断。现在
: 的AI也不是傻算到死啊。

a**********h
发帖数: 370

我说计算机是死算了吗

Google

【在 c*********3 的大作中提到】

:
: 我不用会下（虽然我也确实会围棋），我只是比你看的东西多一点。你觉得alpha go就
: 是简单的机器试错死算，简直贻笑大方。
: AlphaGo设计师黄士杰：“最强的学习技能在人类的脑袋里”
: http://www.ftchinese.com/story/001075040#adchannelID=2100
: AlphaGo是怎么开始的？
: 回到一开始，AlphaGo到底是怎么开始的？起点是有三组人马的聚集：Deepmind首席执
: 行官Demis Hassabis与AlphaGo项目领导David Silver、我、还有两位谷歌大脑(Google
: brain)的同事Chris Maddison和Ilya Sutskever。
: Demis和David原本是剑桥大学的同学，友情深厚。对西方人来说，当1997年IBM超级电

x********e
发帖数: 35261

你算功达到水平了根本不需要揣测对方意图

【在 a**********h 的大作中提到】

: 读出各种变化也是reading skill，傻逼
: 人类唯一的优势是揣测对方的心理意图

相关主题
● Deepmind与暴雪开源接口，人工智能挑战星际争霸到哪一步了？	● Google围棋的事又来了：大象关冰箱要几步？
● 阿尔法狗再进化:自学3天100:0碾压旧狗	● 人工智能与核武器，哪个更危险？(zz)
● zt AlphaGo可能会发现另外一种围棋美，是我们想象不到的 (转载)	● 十分怀疑这次GOOGLE的程序有猫腻
进入Military版参与讨论

a**********h
发帖数: 370

每个人都有心理意图，所以跟熟人下棋更有意思，计算机这方面不如人

【在 x********e 的大作中提到】

: 你算功达到水平了根本不需要揣测对方意图

x********e
发帖数: 35261

你说话顾头不顾腚啊。赶紧回头看看你的观点。这样能下好棋吗？

【在 a**********h 的大作中提到】

: 每个人都有心理意图，所以跟熟人下棋更有意思，计算机这方面不如人

a**********h
发帖数: 370

是你不懂好吗？你还是算你的星盘去吧

【在 x********e 的大作中提到】

: 你说话顾头不顾腚啊。赶紧回头看看你的观点。这样能下好棋吗？

x********e
发帖数: 35261

哟这谁马甲啊，还知道我擅长占星

【在 a**********h 的大作中提到】

: 是你不懂好吗？你还是算你的星盘去吧

a**********h
发帖数: 370

我还知道你擅长潮吹呢

【在 x********e 的大作中提到】

: 哟这谁马甲啊，还知道我擅长占星

(共1页)

进入Military版参与讨论

相关主题
● 有啥电脑上可以实现的游戏是电脑无法赢人类的？	● 16625份AI论文透露：深度学习正在走向终点？
● poker 软件有人在做 (转载)	● Deepmind与暴雪开源接口，人工智能挑战星际争霸到哪一步了？
● alphago今天可能被调过参数了	● 阿尔法狗再进化:自学3天100:0碾压旧狗
● 李世石：我再也不想下这样的比赛了。 (转载)	● zt AlphaGo可能会发现另外一种围棋美，是我们想象不到的 (转载)
● Google围棋击败职业选手，即将挑战李世石 (转载)	● Google围棋的事又来了：大象关冰箱要几步？
● 亚洲理科生毫无尊严啊	● 人工智能与核武器，哪个更危险？(zz)
● 人是疯狂的，但机器不是	● 十分怀疑这次GOOGLE的程序有猫腻
● AlphaGo的程序员中间有多少华人？	● 弈城惊现疑似谷歌团队ID 金灿佑：棋谱似人工智能

相关话题的讨论汇总
话题: alphago话题: demis话题: 围棋话题: david话题: erica

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天