阿法狗怎样算气的？ - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 阿法狗怎样算气的？

相关主题
● 看大家讨论中比较少提这个 reinforcement learning	● 李世石表情很痛苦
● 阿法狗生怕人类还不够绝望	● 狗狗肯定破不了珍珑
● 写过程序的都知道	● Facebook’s AI tech mimics how humans learn
● 阿法狗下围棋离人类还差的远	● 神经网络的结构决定了他的极限
● 阿法狗怎么做到每天练习几十万盘棋？	● 金明完9段点评AlphaGo: 缺点明显
● 阿法狗第二局最令人震惊的地方在于	● 原来阿尔法下的是５秒版的ＺＥＮ
● 我以前提到过阿法狗应该有更灵活的用时策略	● 专业科普AlphaGO (转载)
● 阿法狗第四局最终并不是输在对妙手的漏算上	● 从第四盘棋看狗狗的弱点

相关话题的讨论汇总
话题: ai话题: mcts话题: value话题: network话题: 阿法

进入Go版参与讨论

(共1页)

y********n
发帖数: 4452

我个人看了一下阿法狗的paper，里面吹嘘没有写任何围棋的规则，全都是棋谱里和实
战学的。我产生了这个问题：
研究AI的可不可以解释一下。它怎么知道算双方的气数，哪里开始紧气会赢？
如果像国际象棋一样，走policy network给的那些选择走，只是直觉，走个50步，然后
feedback/
value policy给个分数，那其实阿法狗还是不会下围棋。
或者说feedback/value policy会算气，知道这块棋是死是活，它又是怎么算出来的呢
，不是要走很多步才明朗嘛，走50步后有些地方死活不知，还没走完value policy怎么
可能算的出来赢率呢？

y********n
发帖数: 4452

个人的感觉是value network里每块棋都是back propagate的赢率。所以根本没有算气
，这块气死活已经populated。也就是说这样的棋形以前玩过，所以还没走完就知道死
活。
可是这个有几个问题，一个是数据量巨大，把计算转换成storage，search量也非常大
。导致AI只能做一件事，不能贯通知识到其他领域。
第二个问题是致命的，就是复杂一点的棋形，那判断就会出错，因为这种棋形的例子实
在太少。譬如第4盘的挖这手触动4方的棋形，早一点，阿法狗根本算不出来，第一因为
它不会算，value network不会算几块棋互相关联的赢率。要走很多步所有的棋块都明
朗了它才可以分开算对。还有它没有把挖那一手作为重要一手，可能走几步就淘汰掉了
，所以没有算穷那几块棋的最终结果。
所以人和电脑下，不要怕复杂，特别是到处棋块都会互相牵引的那种复杂性，也就是说
一盘棋没有各个板块的独立性，动一处可以引发全动的那种复杂，阿法狗应该算起来应
该非常困难。
个人浅见，抛砖引玉，请专家多多发言。

c*******9
发帖数: 9032

没有输入规则并不等于不算气，气也是一个特征。

【在 y********n 的大作中提到】

: 我个人看了一下阿法狗的paper，里面吹嘘没有写任何围棋的规则，全都是棋谱里和实
: 战学的。我产生了这个问题：
: 研究AI的可不可以解释一下。它怎么知道算双方的气数，哪里开始紧气会赢？
: 如果像国际象棋一样，走policy network给的那些选择走，只是直觉，走个50步，然后
: feedback/
: value policy给个分数，那其实阿法狗还是不会下围棋。
: 或者说feedback/value policy会算气，知道这块棋是死是活，它又是怎么算出来的呢
: ，不是要走很多步才明朗嘛，走50步后有些地方死活不知，还没走完value policy怎么
: 可能算的出来赢率呢？

a*****g
发帖数: 19398

feature里面就有气 libety吧

【在 y********n 的大作中提到】

O**l
发帖数: 12923

又来丢人现眼
具体怎么算和CNN没多大关系
具体算靠的是mcts
这种围棋AI都不懂瓶子水真是搞笑

a*****g
发帖数: 19398

哎呀，不要这样对汽油啦。

【在 O**l 的大作中提到】

: 又来丢人现眼
: 具体怎么算和CNN没多大关系
: 具体算靠的是mcts
: 这种围棋AI都不懂瓶子水真是搞笑

O**l
发帖数: 12923

这人一贯装逼
啥都不懂还喜欢到处现
看得就不爽

【在 a*****g 的大作中提到】

: 哎呀，不要这样对汽油啦。

y********n
发帖数: 4452

话都不会说，基本礼貌父母没教，自己也不觉得丢人？
你看了阿法狗paper吗？mcts做的search是用value network给的输赢率来判断用那个
path的。value network是pre-trained.
如果真的厉害，就会理解比你差的人，提高他们的知识，因为自己在不同的level上。
你这种人大家都看的出是自己觉得很厉害，觉得自己怀才不遇，社会亏待了自己，看谁
都不爽，其实机会都是给准备好的人，显然你是抓不住机会，只会怨天尤人。在这里发
牢骚。
我是感谢社会，感谢我的朋友同事圈子，我混的非常的好，非常grateful to everyone
helped me in my life. Everyone is super nice and I enjoy being with them.
你呢，自己想想吧，这种胸怀，态度，只会一辈子像个怨妇。

【在 O**l 的大作中提到】

: 又来丢人现眼
: 具体怎么算和CNN没多大关系
: 具体算靠的是mcts
: 这种围棋AI都不懂瓶子水真是搞笑

y********n
发帖数: 4452

我在股版也发表了一些我对阿法狗的看法：
http://www.mitbbs.com/article_t/Stock/36900091.html
我个人因为是做金融工程的，对于AI也略知一二。我其实以前有做过模拟大脑，而且方
法是更接近于人类的思维，想法，探讨的能力。不过因为要求时间浩大，所以先转做股
市套利，能先出人头地，自己活的舒服点，潇洒点。到目前已经有了一定规模，每个月
平均股市里有短期1-2万套利。工资和长期股市投资都没有算。可以不再追求每年更高
的收入，重新做我的模拟大脑。还有享受人生乐趣。
搞不懂那些一天到晚竖着脸对人的，别人说错了对你有没有影响，也可以好好说。自己
的心情好，看什么都顺眼。反过来也是。

y********n
发帖数: 4452

君子坦荡荡小人长戚戚
说的直白了些，不过对于聪明的人，是帮助。对于其他的人，觉得我只是攻击他。
怕你不懂：
坦荡荡：心胸宽广、开阔、容忍。
戚：在古代的意思形声。从戉，从尗，尗亦声。戉(yuè)，斧子。第一个戚是指的斧子
，第二个戚是指的斧别人，攻击别人，小人不是修自身的，是修别人的。

【在 O**l 的大作中提到】

: 这人一贯装逼
: 啥都不懂还喜欢到处现
: 看得就不爽

相关主题
● 阿法狗第二局最令人震惊的地方在于	● 李世石表情很痛苦
● 我以前提到过阿法狗应该有更灵活的用时策略	● 狗狗肯定破不了珍珑
● 阿法狗第四局最终并不是输在对妙手的漏算上	● Facebook’s AI tech mimics how humans learn
进入Go版参与讨论

O**l
发帖数: 12923

蠢货瞎比比一大堆天天泡古板还被人笑话大反指的loser
天天在论坛自言自语说欧耶我混的很好尼玛这是傻逼吗
尼玛混得好到天天只能泡古板
老子的狗的狗粮都比你的生活费多
policy network value network是剪枝和评估
只有在 MCTS到不了底的时候才用value network
MCT的choose agent arm是UCB1决定
value network 的output只是UCB1的一个input
屁都不懂在这瞎比比个啥
还模拟大脑这傻逼估计基本的大二的heuristic search都搞不清
丢人现眼
PS: 我还高看这玩意了这玩意估计大一的复杂度都没搞清楚就在这瞎比比

everyone
.

【在 y********n 的大作中提到】

: 话都不会说，基本礼貌父母没教，自己也不觉得丢人？
: 你看了阿法狗paper吗？mcts做的search是用value network给的输赢率来判断用那个
: path的。value network是pre-trained.
: 如果真的厉害，就会理解比你差的人，提高他们的知识，因为自己在不同的level上。
: 你这种人大家都看的出是自己觉得很厉害，觉得自己怀才不遇，社会亏待了自己，看谁
: 都不爽，其实机会都是给准备好的人，显然你是抓不住机会，只会怨天尤人。在这里发
: 牢骚。
: 我是感谢社会，感谢我的朋友同事圈子，我混的非常的好，非常grateful to everyone
: helped me in my life. Everyone is super nice and I enjoy being with them.
: 你呢，自己想想吧，这种胸怀，态度，只会一辈子像个怨妇。

O**l
发帖数: 12923

yangbaiwan 这傻逼最搞笑的是什么都不懂还喜欢装懂凑热点
尼玛一说具体马上露馅
一般网络神棍跳大神的大忽悠都是这个特点

y********n
发帖数: 4452

呵呵呵，首先说每次骂人一大堆，自己一大堆负能量累不累，活的这样也真可怜。
第二从你回复的算尽到底和用UCB1就知道你没有写过AI和MCTS。UCB1只是tree
traverse的一个方法，和算tree上每个node的围棋输赢根本没有关系。是的，value
network产生的围棋输赢率是可以做UCB1的input，告诉MCTS如果走到这里输赢是多少。
可是，没有value network的产生的数据。MCTS和UCB1根本做不了围棋AI，这两个不是
什么新玩意，已经非常久的历史了，是generic AI的一种方法。
你说算到底，你会下围棋吗？算到两方都pass，棋盘上还是非常tricky，有些地方放会
减分，有些地方放会死。即使算到底，底有很多个，还是需要value network判断输赢
率来选择path。
说到细节，就知道你是只看不练，只知道表皮一点点的水平。mcts的围棋软件外面非常
多, 也很多年了，水平都是业余段位。要达到阿法狗那么厉害，主要是靠脑神经系统
pre trained 的数据库: policy and value network.

【在 O**l 的大作中提到】

: 蠢货瞎比比一大堆天天泡古板还被人笑话大反指的loser
: 天天在论坛自言自语说欧耶我混的很好尼玛这是傻逼吗
: 尼玛混得好到天天只能泡古板
: 老子的狗的狗粮都比你的生活费多
: policy network value network是剪枝和评估
: 只有在 MCTS到不了底的时候才用value network
: MCT的choose agent arm是UCB1决定
: value network 的output只是UCB1的一个input
: 屁都不懂在这瞎比比个啥
: 还模拟大脑这傻逼估计基本的大二的heuristic search都搞不清

O**l
发帖数: 12923

SB完全不懂又在这胡喷
“”你说算到底，你会下围棋吗？算到两方都pass，棋盘上还是非常tricky，有些地方
放会
减分，有些地方放会死。即使算到底，底有很多个，还是需要value network判断输赢
率来选择path。”
MCT每步只在tree上建一个node
然后用monte-carlo simulation到底根本不需要评估直接返回结果
大量算到底的采样　在树中反馈
UCB1保证1-0的结果快速收敛
蠢猪屁都不懂　你不会认为ＵＣＴ的算到底的意思是穷极变化吧
“MCTS和UCB1根本做不了围棋AI，这两个不是什么新玩意，已经非常久的历史了”
你是从哪个平行宇宙穿越来的 MCT原理基于UCT 尼玛ＵＣＴ２００７年才提出
“MCTS和UCB1根本做不了围棋AI”　你这傻逼逗我　单独的ＭＣＴＳ可以做到业６
“主要是靠脑神经系统pre trained 的数据库”
老子笑喷了　原来ＣＮＮ是训练个数据库　做ＤＬ的都可以自杀去了
这傻逼讲相声　讲得没救了
明明叫monte-carlo tree search这傻逼估计到现在也没明白啥时候用 monte-carlo
估计这傻逼连大一的复杂度都没搞清楚看了几个大名词　就在这扯

y********n
发帖数: 4452

第一，和你谈AI完全是鸡同鸭讲。我已经说到value network里的细节，你非要说一些
普遍MCTS的东西，就像我说电驱动车，你和我说马车，都是有4个轮子。也可以走，可
是你非要强调是轮子，而不是电驱的作用电驱动车可以工作。
第二，你的嘴实在太恶心了。
请你绕道，别再这个贴谈你的高论，行不？真是多谢了。

【在 O**l 的大作中提到】

: SB完全不懂又在这胡喷
: “”你说算到底，你会下围棋吗？算到两方都pass，棋盘上还是非常tricky，有些地方
: 放会
: 减分，有些地方放会死。即使算到底，底有很多个，还是需要value network判断输赢
: 率来选择path。”
: MCT每步只在tree上建一个node
: 然后用monte-carlo simulation到底根本不需要评估直接返回结果
: 大量算到底的采样　在树中反馈
: UCB1保证1-0的结果快速收敛
: 蠢猪屁都不懂　你不会认为ＵＣＴ的算到底的意思是穷极变化吧

O**l
发帖数: 12923

你连复杂度都搞不清的玩意懂个鸡巴Ai
还 Valuenetwork细节尼玛你笑死我你搞得清Deep mind为啥没用Maxpooling
估计我说之前你Maxpooling是啥都没听说过吧
知道几个名词就跳大神的玩意丢人显眼

: 第一，和你谈AI完全是鸡同鸭讲。我已经说到value network里的细节，你非要
说一些

: 普遍MCTS的东西，就像我说电驱动车，你和我说马车，都是有4个轮子。也可以
走，可

: 是你非要强调是轮子，而不是电驱的作用电驱动车可以工作。

: 第二，你的嘴实在太恶心了。

: 请你绕道，别再这个贴谈你的高论，行不？真是多谢了。

【在 y********n 的大作中提到】

: 第一，和你谈AI完全是鸡同鸭讲。我已经说到value network里的细节，你非要说一些
: 普遍MCTS的东西，就像我说电驱动车，你和我说马车，都是有4个轮子。也可以走，可
: 是你非要强调是轮子，而不是电驱的作用电驱动车可以工作。
: 第二，你的嘴实在太恶心了。
: 请你绕道，别再这个贴谈你的高论，行不？真是多谢了。

y********n
发帖数: 4452

你可怜到即使一开始就不喜欢一个人，也要上去骂一通来显示你比别人厉害。那么需要
肯定自己，不管用什么不待见的方法，自己的脸皮都不要来证明自己比别人厉害。你在
社会上有多大打击啊？平时是不是给人各种看不起？需要肯定自己到这种病态的程度。
我可能是在现实中太满意自己的圈子了吧，你这种奇葩样子只让我觉得好笑加上可怜。
还有喜欢这样活着的人。
我承认，你骂人和恶心程度是我网上和现实生活里见到最厉害的。应该还有比你更病态
的，不过你去和他们比好了，我不需要和你这种人接触。偶尔看到还觉得讶异。跟你这
种人打交道久了就会惹一身臭了。

【在 O**l 的大作中提到】

: 你连复杂度都搞不清的玩意懂个鸡巴Ai
: 还 Valuenetwork细节尼玛你笑死我你搞得清Deep mind为啥没用Maxpooling
: 估计我说之前你Maxpooling是啥都没听说过吧
: 知道几个名词就跳大神的玩意丢人显眼
:
:
: 第一，和你谈AI完全是鸡同鸭讲。我已经说到value network里的细节，你非要
: 说一些
:
: 普遍MCTS的东西，就像我说电驱动车，你和我说马车，都是有4个轮子。也可以
: 走，可
:
: 是你非要强调是轮子，而不是电驱的作用电驱动车可以工作。

O**l
发帖数: 12923

神棍一谈具体就准备尿遁了
你的模拟大脑呢 valuenetwork呢
脸都给抽成猪头还在这瞎比比
大学都考不上的玩意在天天24小时泡买买提装神棍
继续报名词啊
这里的人大多数都是全奖来这读理工科PhD的哪个不比你成功不比你智商高
轮到的到你这二流子在这瞎比比
丢人现眼

【在 y********n 的大作中提到】

: 你可怜到即使一开始就不喜欢一个人，也要上去骂一通来显示你比别人厉害。那么需要
: 肯定自己，不管用什么不待见的方法，自己的脸皮都不要来证明自己比别人厉害。你在
: 社会上有多大打击啊？平时是不是给人各种看不起？需要肯定自己到这种病态的程度。
: 我可能是在现实中太满意自己的圈子了吧，你这种奇葩样子只让我觉得好笑加上可怜。
: 还有喜欢这样活着的人。
: 我承认，你骂人和恶心程度是我网上和现实生活里见到最厉害的。应该还有比你更病态
: 的，不过你去和他们比好了，我不需要和你这种人接触。偶尔看到还觉得讶异。跟你这
: 种人打交道久了就会惹一身臭了。

O**l
发帖数: 12923

楼猪这蠢猪不知道CNN是啥在这摆名词
尼玛这蠢猪不知道 CNN再玩出花来在围棋这个领域下还是嵌在MCTS的框架里运行的
这玩意估计连minimax tree alpha-beta pruning都没听说过

p****a
发帖数: 4829

你如果是做金融工程的，是怎样做到能够短期交易股票的？我认识做quant的买了股票
都不能3个月内卖出

【在 y********n 的大作中提到】

: 我在股版也发表了一些我对阿法狗的看法：
: http://www.mitbbs.com/article_t/Stock/36900091.html
: 我个人因为是做金融工程的，对于AI也略知一二。我其实以前有做过模拟大脑，而且方
: 法是更接近于人类的思维，想法，探讨的能力。不过因为要求时间浩大，所以先转做股
: 市套利，能先出人头地，自己活的舒服点，潇洒点。到目前已经有了一定规模，每个月
: 平均股市里有短期1-2万套利。工资和长期股市投资都没有算。可以不再追求每年更高
: 的收入，重新做我的模拟大脑。还有享受人生乐趣。
: 搞不懂那些一天到晚竖着脸对人的，别人说错了对你有没有影响，也可以好好说。自己
: 的心情好，看什么都顺眼。反过来也是。

y********n
发帖数: 4452

我们规定30天，所以没啥问题。我买卖一般都hold 1-2月。

【在 p****a 的大作中提到】

: 你如果是做金融工程的，是怎样做到能够短期交易股票的？我认识做quant的买了股票
: 都不能3个月内卖出

(共1页)

进入Go版参与讨论

相关主题
● 从第四盘棋看狗狗的弱点	● 阿法狗怎么做到每天练习几十万盘棋？
● 锵锵请的港大计算机系主任不懂啊	● 阿法狗第二局最令人震惊的地方在于
● 昨天的比赛至少是让先差距	● 我以前提到过阿法狗应该有更灵活的用时策略
● monte carlo tree search很神奇	● 阿法狗第四局最终并不是输在对妙手的漏算上
● 看大家讨论中比较少提这个 reinforcement learning	● 李世石表情很痛苦
● 阿法狗生怕人类还不够绝望	● 狗狗肯定破不了珍珑
● 写过程序的都知道	● Facebook’s AI tech mimics how humans learn
● 阿法狗下围棋离人类还差的远	● 神经网络的结构决定了他的极限

相关话题的讨论汇总
话题: ai话题: mcts话题: value话题: network话题: 阿法

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天