|
D*******r 发帖数: 2323 | 2 不会找死啊,因为持白的阿法狗会以黑贴10目计算胜负,所以它会软弱退让,觉得只要
赢就行。
你要给阿法狗的赢棋目标定为让九子赢棋,它的招法也就是让九子能保证赢一目半目而
已。 |
|
发帖数: 1 | 3 我相信逼迫alpha走出你说的这些的人类棋手就需要相当的实力了,
因为这些会表现出高度的不确定性,alpha这么选择的话,
说明找不到更好的确定性高的招法了。 |
|
M*******p 发帖数: 5626 | 4 我觉得这是差不多最好结果了,就怕电脑真把所有最佳招法都算出来了,那就没的搞了
。 |
|
h*********n 发帖数: 5789 | 5 Alphago中局走的86明显是大错招,正确的招法是老老实实的走F6,破黑棋中腹的大空
。Alphago的86基本等于停了一手棋,让李世石占了半个角外加左下完全成空,白棋瞬
间实空大落后。如果不是李世石右下角连续梦游,Alphago想赢也不容易。 |
|
o*********1 发帖数: 2608 | 6 估计就真的0:5了
太多招法都是围棋书上说不好的 |
|
M*******p 发帖数: 5626 | 7 我还是不相信狗狗不会打劫,就是可能处理起来不会最优,而它的招法可能也都避免出
现劫争。 |
|
M*******p 发帖数: 5626 | 8 也要看实战效果,5路6路尖冲最后总输那也很快就没人用了,估计这种招法也就计算机
能用的好。 |
|
M*******p 发帖数: 5626 | 9 权甲龙:本想说电脑很业余 但李世石发挥很不好
新浪体育讯 3月10日李世石与谷歌人工智能AlphaGo在首尔四季酒店展开五番棋第
二局较量。昨日李世石首局告负引爆全世界,赛后坦言双方五五开,胜负才刚开始。王
卓6段介绍了李世石师傅权甲龙九段的评论。
关于首局比赛,权甲龙颇感遗憾,表示从小看李世石长大,觉得这盘棋完全不像他
下的,似乎非常紧张,发挥很不好。
对于电脑对手,权甲龙认为表现不像职业棋手,很多招法都有些意外,有点“绕”
的感觉。
主要还是李世石自己发挥不好,下得太单调了,感觉他比参加其他世界大赛还要紧
张。所以本来自己想评价电脑像业余棋手,但李世石最后输了,自己就不好说什么了。 |
|
M*******p 发帖数: 5626 | 10 棋渣8:2石头不是偶然,大局和判断上面都优于石头,机器狗的很多招法也看得出来,
但是真上去,赢的可能性也不大,几个月后更没可能了。 |
|
D*******r 发帖数: 2323 | 11 先以人类的对局为基础是以人类总结的知识为基础,建立基础模型。否则完全从自己的
对弈开始,要试遍所有的combination,数据量太大。有了基础模型后,然后它通过自
我对局找outlier,用此发现有没有在基础模型漏算的招法。相当于拆解几十万个变化
图,人类棋手几个每天拆解几十万个变化图来纠正自己的认识?
即使是人类的专业棋谱,计算机也不是简单地吸收,它将十几万盘棋谱,三千多万局面
进行复盘分析,调整基础模型的认识,人类棋手哪个能做到复盘十万棋谱,对三千万个
局面拆解分析局面? |
|
r******l 发帖数: 10760 | 12 这跟我的问题无关。我知道现在电脑国际象棋很厉害了。
我想知道电脑是步步妙手最后赢的,还是跟狗一样下很多人类认为的差的招法最后还能
赢呢? |
|
D********i 发帖数: 514 | 13 两种棋目标不一样,不能类比。国际象棋可以量化,比如被对方白白吃了个车很难被认
为是好的招法,人与AI评价很难有分歧。可能有分歧得是这种情况:弃车后20步必定可
以将死对方。可惜任何人或者AI迄今没发现这样的着法。不知道让谷歌同样算法弄个
betaChess会怎么样。 |
|
b*******8 发帖数: 37364 | 14 象棋人类已经很接近本质,绝大多数招法都是绝对正确的,电脑再厉害也比人强的有限
围棋人类离本质差好远,天花板空间很大,电脑不需要接近天花板,就可以远超人类 |
|
w******8 发帖数: 977 | 15 看完这两盘的感觉是,当局面复杂时,面对阿法狗的强硬招法,李师师总是妥协退让,
完全没有那种“我看不清的地方对手也看不清”的勇气,结果反而安乐死了。其实李师
师对柯洁也有这种感觉,就是内心已经认怂了,就是觉得对手比自己算的清。不如干脆
放手一博,如果还是惨败,那没啥好说的,只能承认人不如狗,但是被打死也比被吓死
强吧。真希望看到柯洁对阵阿法狗,柯洁比李师师霸气多了,柯狗大战想想都觉得刺激
。不过如果李师师0:5输了,柯洁估计也得虚。 |
|
|
H*******i 发帖数: 196 | 17 对 李世石有连续的思路,那就是畏畏缩缩的态度,所以才有这么多棋手不满。其实多
数棋手已经承认自己下不过alphago,但是没有人希望看到这种对局。目前的对局就如
同李世石被贴15目下出来的招法。
说到这,我倒是想起了棋魂里sai背负大贴目强行争胜的那盘棋。 |
|
M*******p 发帖数: 5626 | 18 第二盘后,韩国围棋队总教练刘昌赫就还是有些不服气:
“ 比赛结束后,韩国棋手刘昌赫九段评价说:“‘阿尔法围棋’下了很多怪手,如
果李世石按照自己的棋风果断地应对,他或许会赢。但是,李世石在很多局部战斗中,
没有按自己的棋风果断下棋,好像他在心理上有所畏缩。看上去,‘阿尔法围棋’棋行
有些弱,但是它判断形势和计算的能力很强。在官子阶段上,‘阿尔法围棋’占尽优势
。”
而且,我昨天也贴过李世石师傅权甲龙看了第一盘的评价,也是认为石头自己的“因素
”导致了他的失败。
阿法狗是个新东西,下在棋盘上的东西有不少现在棋手没看懂,而且有些招法很难说就
是最佳(比如昨天粘上两子跑出来),所以顶尖高手当然会有一些看法了,想上去试一
下的也不在少数,我估计中日韩都有。难不成看到阿法狗赢了石头两盘后想去挑战一下
的勇气都没有了? |
|
M*******p 发帖数: 5626 | 19 所以打入的时候做劫看来真的是一个不错的选择,那个时候白棋劫财有利,这里做劫迅
速安定应该就领先了(狗狗自己估计胜率会进一步下降吧)。
而且这样看来狗狗前面的招法确实也有商讨的余地,而不是现在版上一片狗狗下的都是
“神招”的歌功颂德,因为你看狗狗自己的判断都胜率不到5成。这也能看出来狗执黑
布局还不是天衣无缝的。 |
|
o*****p 发帖数: 2977 | 20 我只是说,开局的那段时间,只要它判断胜率是50%甚至以下,就说明它的对手这段时
间内水平和它相当 ---- 我们没有必要自己吓唬自己,以为它已经挖好了多大的一个坑。
我们要学习的,是当它判断它的胜率迅速上升的时候,那时候多半是我们的水平比它
低了。这时候要学习。
但开局一段时间,既然它判断胜负是50%,说明它的那些不同寻常的招发也没那么可怕
。人的招法不比它差。 |
|
k*******r 发帖数: 355 | 21 楼主,你的理解有很大问题。
"但开局一段时间,既然它判断胜负是50%,说明它的那些不同寻常的招发也没那么可怕
。人的招法不比它差。"
这句完全不对。
开始阶段,就算是由你随机在局面上丢个子应对,alphago对自己的胜率估计也不会突
然从50%提高很多。因为这个胜率是模拟从这个局面开始,alphago黑白左右互搏自己的
胜率。(更何况实战人类棋手的落子比随机的还是好很多)
因为是刚开局,虽然你走了个大臭手,但如果从此换成alphago自己和自己下,还有相
当大希望扳回来。但这不表示说你刚才那手不臭。
换而言之,狗估计的这个胜率是从此局面开始换成狗咬狗情况下,自己的胜率。所以狗
自我评价胜率53%, 是说从此开始换另一只狗帮你下,你还有47%的机会赢,不是说基于
前面那个人类棋手的水平你有47%的机会赢。(事实是基于前面那个人类棋手的水平赢的
可能性为0)。 |
|
H*******i 发帖数: 196 | 22 在算法突破后,机器超过人已经是必然的了,现在无非突破速度比这些职业棋手想的快
点就是了。
到现在还去猜测对手的莫须有的弱点,不去堂堂正正下一盘棋。想让以后的人怎么看这
5盘棋中那些奇怪的招法,步调?你们愿意去debug等后面版本有的是时间,但这载入历
史的一战就好好展示曾经的围棋第一人对于围棋的理解就可以了。
李喆的境界也就这样了。 |
|
n*****t 发帖数: 22014 | 23 先列一下已知条件:
1、阿发狗的棋力大大强于设计者。
2、设计者对棋的理解显然大大不如李思思这样的一流棋手。
3、设计者无法教会阿狗抽象的好和坏,唯一能做的就是不断点目。
4、穷尽计算所有变化是绝不可能的。
5、阿发狗的棋长得飞快,这是通过大量左右互搏达到的。
6、显然不是设计者教的,而是真正在对局中学习的。
基于以上这些,我更关心阿发狗的决策是怎样进行的,猜测其原理如下
1、积累大量的棋谱。
2、对局时参考棋谱,找出统计意义最有可能获胜的下一手或几手。
3、由此展开,计算后续可能的变化,先计算对手利益最大化的第二手,再计算自己利
益最大化的第三手
4、综合以上结果,找出当前最有利的一招
5、对手应招后,在之前的运算基础上继续深化计算。如对手应招不在范围内,比如意
想不到的脱先,则重新计算。
如果是这样的话,总结一下
1、由于缺乏高段棋手的棋谱,很多判断是不正确的。
2、序盘雷同的太多,比如错小目开局现在下很多,虽然模式很容易匹配,但参考意义
很小。因此很容易下出局部小亏的招法。
3、中盘由于计算力强大,如果遇到人类应对不当的地方,很容易追平甚至扩大领先优
势。
4、官子几乎不存在任何... 阅读全帖 |
|
D*******r 发帖数: 2323 | 24 黄士杰在一月份的时候就发过帖说:柯洁确实很强,但是围棋A I很快会让他胜率达不
到5%。
所以,早在一月份,deepmind内部的测试数据肯定已经证明了阿法狗的elo rating已经
远远高出人类顶尖棋手了。
再看看两次视频直播里,黄士杰气定神闲地,在任何一个人类棋手认为李世石占优的时
候都没有过任何紧张与不安。其实,结果是什么他早知道了,唯一就是想看看过程。
这么想,谷歌确实有点不厚道啊。这一幕,让我想起棋魂里的一幕,连子都不会拿的进
藤光坐在塔矢亮的对面,在棋盘上以下指导棋一样的招法碾压对手,藤原左为默默地俯
视着这孩子。 |
|
D*******r 发帖数: 2323 | 25 黄士杰在一月份的时候就发过帖说:柯洁确实很强,但是围棋A I很快会让他胜率达不
到5%。
所以,早在一月份,deepmind内部的测试数据肯定已经证明了阿法狗的elo rating已经
远远高出人类顶尖棋手了。
再看看两次视频直播里,黄士杰气定神闲地,在任何一个人类棋手认为李世石占优的时
候都没有过任何紧张与不安。其实,结果是什么他早知道了,唯一就是想看看过程。
这么想,谷歌确实有点不厚道啊。这一幕,让我想起棋魂里的一幕,连子都不会拿的进
藤光坐在塔矢亮的对面,在棋盘上以下指导棋一样的招法碾压对手,藤原左为默默地俯
视着这孩子。 |
|
h*h 发帖数: 27852 | 26 AlphaGo可能会发现另外一种围棋美,是我们想象不到的
DeepMind AlphaGo 与韩国李世石九段的比赛有着重要的历史意义——这是首次人
工智能在人类最复杂的博弈游戏中挑战最高级别的人类选手。而拉开这一帷幕的是去年
欧洲围棋冠军樊麾与 AlphaGo的对战。机器之心有幸采访到了樊麾老师,在与他的长谈
中,樊麾老师详细回顾了他与 AlphaGo 交战的精彩故事,畅谈了他对人工智能技术的
感触,以及对围棋与人生的哲学思考。樊麾老师将作为裁判长现场督战「AlphaGo VS
李世石」。这里,我们希望用樊麾老师这番丰富且深刻的思考和遐想来拉开这场「世纪
大战」,而更加重要的是,我们相信樊麾老师的长篇精彩分享一定可以给大家带来超越
比赛本身的启迪,关乎机器与人类、科技与文化、围棋与哲学、历史与未来。
对弈AlphaGo
“AlphaGo 没有人类棋手般心理的感觉,它就是一个虚无,但它却完全能把握住你的性
格,这是不对等的。
机器之心:是什么契机让你和 AlphaGo 开始的这场对弈?有没有一些比较有趣的事情?
樊麾:去年8月份,我去捷克一个小镇参加一年一度的欧洲围棋大会(欧洲冠军杯),... 阅读全帖 |
|
n*****t 发帖数: 22014 | 27 阿狗没有感情,也不存在熟悉不熟悉,更不太可能去归纳总结棋风。只能说,阿狗取胜
的招法都在柯洁预料中,甚至还有很多臭招。
我在人类这边。 |
|
w******8 发帖数: 977 | 28 狗李这两盘棋太好看了,接连两天我都熬到后半夜看直播,看完觉得真是太精彩了,仅
仅两盘棋就出现那么多颠覆性的招法,而且还都能大胜。真是期待今天的第三盘。上一
次这么激动是柯洁对李世石梦百合决胜局,不过那激动主要来自紧张和棋局的戏剧性,
不像这两盘棋仅仅内容就让人兴奋。现在的棋手对局大都很平淡,尤其是开局,千篇一
律,很没意思。现在最期待的就是柯洁挑战阿狗。如果柯洁也惨败,那今后围棋就没啥
看头了。 |
|
|
n*****t 发帖数: 22014 | 30 输赢,只是因为对手没有下出正确招法,100 万在围棋里还是太小了。 |
|
D*******r 发帖数: 2323 | 31 应该没戏,它的决策系统牵扯的计算量太大,人类没法handle,依葫芦画瓢似地学招法
没用。
现在能想到的唯一可学习的方法是,让它来分析人类棋手棋谱中的每一个我们本来以为
正确的应手是不是大致正确。比如说,我们以为是本手的应手,或者我们认为是两分的
局面,而在阿法狗看来,是胜率陡降。
然后让它分析一些经典布局,看看是不是真的两分,或者结论和人类以为的一样。这样
可能对人类的围棋理念能有一个质的改变和提升。
至于中盘手法,脱先转换,眼花缭乱的官子收束这些,人就不要学了,计算力达不到,
只会弄巧成拙。 |
|
s***y 发帖数: 357 | 32 不需要赢一盘,你让alpha go同样局面算100次,看有多少次他还走5路肩冲,有多少次
能走出人类正常招法。
你这个用输赢下定论说所有alpha go下的都是好棋,妙手,这是不客观,简单化。
另外要非要让人赢机器可以,把程序发过来研究两个月就能找到漏洞。 |
|
n*****t 发帖数: 22014 | 33 很多人说即使棋渣能赢,几个月后也是脆败了。这个结论的前提是阿狗通过左右互搏可
以不断长棋,将来就是 17 段 28 段 108 段了。果真如此?
我个人觉得,阿狗的极限可能就是一个不犯错的人类顶尖棋手了,基于围棋无法穷尽,
即使学习也不过是把人类的招法都学会。假如人类再有创新,阿狗顶多是秒学,而不能
正确应对。如此来看,人类还是可以通过不断创新来战胜机器,从而保持围棋的活力。
其实就是一个本质问题:AI 到底有没有创造力。 |
|
P******a 发帖数: 1379 | 34 大幅领先的情况下容易出“昏招”,因为不影响输赢结果,属于2。盘面胶着或落后情
况下,必须是1这种情况,因为必须无脑崇拜狗。
alphago |
|
b*******8 发帖数: 37364 | 35 就是概率。按赢5目的下法,是能多赢,但后面容易出错,一百条路里只有一条对的,
全下对才行。不如选赢1目的,100种下法里80种都行。概率上说,即便是我必败的局面
,也可能统计出99%的胜率,对方必须是围棋上帝,走对所有次序才能进入那1%。人类
在落后局面搅局,把棋盘变大,本质上也是这要造成这样的局面。 |
|
m*******i 发帖数: 75 | 36 想知道这个问题的答案也很简单,把她的赢棋目标定成盘面20目。那么她在大幅落后的
情况下,如果着着拼命,跟现在的下法迥然不同,那么2的可能性大,如果还是悠哉悠
哉的下,那就是1了。
alphago |
|
n*****t 发帖数: 22014 | 37 3、阿发狗自己也没算清,因为时间有限,算到 20 步导演喊 cut
alphago |
|
|
l*****i 发帖数: 20533 | 39 我看就是常规开局接围地棋。这时利用计算力等待对方给机会占优。然后把优势保持扩
大到底。这里除了算路深而准,另一个关键是围地棋的招法是基于对无数前人棋局的统
计而来,不太可能出恶手,也不会效率低。因为我自己就这种思路,所以看这几天的谱
感觉特别顺。区别在于我既没有深度算路的能力和耐心,也对前人棋步没那么熟。所以
我是臭棋篓子。 |
|
a**h 发帖数: 2150 | 40 金柜角有其特殊性,这个人也可以走出来,左边三路尖冲黑棋4路那子是梦幻招法。 |
|
b*****d 发帖数: 208 | 41 新的阴谋论登场了。
“阿尔法狗采用的是分布式计算,通过网络收集人类高手的研究信息,然后选择最好的
招法。” |
|
y****i 发帖数: 2108 | 42 即日,李彦宏宣布只花了一个下午研发的百度狗发布。据内线透露,百度狗算法保证跟
阿尔法狗对阵一击即败的招法即无招胜有招,执黑第一招即以黑虎掏心占据天元,然后
亦步亦趋拷贝白棋,在阿尔法狗被彻底迷惑随手棋频出的时候,突然变招,偷提几颗子
,然后终止棋局,宣布胜利。据信,其他没有解密的必杀技还包括在非热点地区偷子儿
,植入病毒,最后数目时候程序bug等,确保对阿尔法胜率达到100%。 |
|
m**m 发帖数: 5500 | 43 陈经:谷歌围棋算法存在缺陷 达不到人类最高水平
2016年1月28日,谷歌围棋程序AlphaGo以5:0战胜职业棋手的消息,震动了围棋圈。
这两天有很多的讨论,主要是新闻性的。我也在第一时间进行了常识性的介绍。
本文进一步从围棋和人工智能技术的角度,深入分析AlphaGo棋艺特点,评估其算
法框架的潜能,预测与人类最高水平棋手的胜负。下文中出现的策略网络、价值网络、
蒙特卡洛法请参考前文,理解具体围棋局面也需要一定的棋力,但是与算法推理相关的
内容理解起来并不难。
AlphaGo是如何下棋的
所有人,包括职业棋手,看了AlphaGo战胜樊麾二段的五盘棋,都说这程序下得像
人了,和以前的程序完全不同。柯洁九段(公认目前最强棋手,一年获得三个世界冠军
,对李世石6:2,古力7:0)的看法是:
“完全看不出来。这五盘棋我也仔细地看了一眼,但我没看名字,不知道谁执黑谁
执白,完全看不出谁是AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃
,该退出的地方也会退出,非常均衡的一个棋风,真是看不出来出自程序之手。因为之
前的ZEN那样的程序,经常会莫名其妙的抽风,突然跑到一个无关紧要的地方... 阅读全帖 |
|
m**m 发帖数: 5500 | 44 陈经:谷歌围棋算法存在缺陷 达不到人类最高水平
2016年1月28日,谷歌围棋程序AlphaGo以5:0战胜职业棋手的消息,震动了围棋圈。
这两天有很多的讨论,主要是新闻性的。我也在第一时间进行了常识性的介绍。
本文进一步从围棋和人工智能技术的角度,深入分析AlphaGo棋艺特点,评估其算
法框架的潜能,预测与人类最高水平棋手的胜负。下文中出现的策略网络、价值网络、
蒙特卡洛法请参考前文,理解具体围棋局面也需要一定的棋力,但是与算法推理相关的
内容理解起来并不难。
AlphaGo是如何下棋的
所有人,包括职业棋手,看了AlphaGo战胜樊麾二段的五盘棋,都说这程序下得像
人了,和以前的程序完全不同。柯洁九段(公认目前最强棋手,一年获得三个世界冠军
,对李世石6:2,古力7:0)的看法是:
“完全看不出来。这五盘棋我也仔细地看了一眼,但我没看名字,不知道谁执黑谁
执白,完全看不出谁是AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃
,该退出的地方也会退出,非常均衡的一个棋风,真是看不出来出自程序之手。因为之
前的ZEN那样的程序,经常会莫名其妙的抽风,突然跑到一个无关紧要的地方... 阅读全帖 |
|
m**m 发帖数: 5500 | 45 有句古语叫做东施效颦。预测今后几个月,会在人类棋手里大量出现类似招法,但因实
力不济,无后续手段,几个月后再度消沉。。 |
|
o*********1 发帖数: 2608 | 46 柯洁说棋很敏锐的
以前我都没看过他的棋
这几盘, 他明显是最敏锐的
不过今天小李中盘的招法比他摆的还炫
要赞 |
|
|
n*****t 发帖数: 22014 | 48 原理之前说过了,狗的设计者对棋的理解显然不是一流水准。即使是李世石柯洁去设计
,也可能有重大分歧。这就牵涉到一个关键问题:如何在众多变化中选取最好的一招。
可以相信,既然机器的算力无非穷尽,那每一手只能选择比较好的(基于数十手的计算
)。这样的决策,即使准确率高达 99%,每 100 手里还是会出现一个缓手、俗手甚至
大恶手。前几盘的对局已经出现很多莫名其妙的招法了,跪舔派相信只是人类无法理解
,对局者也因为对狗不了解,天然的认为一定是精妙的一招,从而选择退缩。
终于,今天 18k 的恶手出来了,忍无可忍再无压力的李世石捕捉到机会,拿下了这一
盘。如果之前大胆应对诸如脱先拆中国流、肩冲五路等等的坏招,李世石本可能更早赢
得胜利。 |
|
l*****i 发帖数: 20533 | 49 后来出现的很多bug招法暗示着阿发狗在中盘真正计算量很大时算法有漏洞。所以看起
来也许先稳固防守拖进中盘,到时候阿发狗如果判定自己处于劣势,自己就会出漏勺然
后一败涂地。相比之下,前三盘可能李都太心急了。如果真是这样,那弄个日本人去下
搞不好会意外轻松的获胜。 |
|
a******0 发帖数: 121 | 50 我对 Horizon Effect 的理解是:由搜索深度限制而看不到更远的事件。
AlphoGo 算法:用 Policy Network 设分枝、建一搜索树,每一枝结(node)由 Value
Network 设一价值,从每一树叶(leaf)起多次用随机下法(Monte Carlo Simulation
)把棋走到终盘,根据结果输赢反馈修改所有父母枝结的价值;最后价值底的分枝被
剪枝。基本原理与 minmax/alpha-bata 相同。
Deepmind 团队没有公开搜索树的深度,显然这由搜索时间、速度决定。但因为MCTS把
棋走到终盘,应该没有一个绝对的地平线(Horizon):地平线以外的招法完全看不到。
network |
|