由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - alphago的原理
相关主题
25的诞生谷歌AlphaGo是科学欺诈? 三方面疑点引猜测(转)
Nature重磅封面:谷歌人工智能击败欧洲围棋冠军李世石在自己最强的地方已经失去信心
原来阿尔法下的是5秒版的ZENAlphaGo创始人:下个对手希望是中国柯洁 (转载)
罗洗河让四子公开挑战阿狗alphago如果真不懂征子,就部分证明了我的观点
本人弈城五段给大家分析一下吧AlphaGo的算法等技术分析
现在反悔里外不是人Alphago自己的评测:前50手不相上下
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?关于打劫的猜疑officially结束了
疑似阿尔法围棋测试账号金志锡:让我两个可能是好胜负
相关话题的讨论汇总
话题: alphago话题: 原理话题: 函数话题: 参数话题: 围棋
进入Go版参与讨论
1 (共1页)
O***O
发帖数: 1854
1
我的理解,阿尔法狗的程序就是一个函数:y=f(x),其中y和x都是矩阵或者矢量。y是
输出的棋子位置,x是盘面上的棋子位置。
函数f复杂无比。如果阿尔法狗用了3000万盘棋来标定,每盘棋100手,那么这个函数的
参数可能有几亿十几亿个。
最终,当这样大量的参数被优化,围棋之神就出来了。但是如果围棋的规则有微小变化
(比如贴目数量减一),这些参数可能不收敛,必须从头再次优化。
这么理解对吗?
D*******r
发帖数: 2323
2
不对。

【在 O***O 的大作中提到】
: 我的理解,阿尔法狗的程序就是一个函数:y=f(x),其中y和x都是矩阵或者矢量。y是
: 输出的棋子位置,x是盘面上的棋子位置。
: 函数f复杂无比。如果阿尔法狗用了3000万盘棋来标定,每盘棋100手,那么这个函数的
: 参数可能有几亿十几亿个。
: 最终,当这样大量的参数被优化,围棋之神就出来了。但是如果围棋的规则有微小变化
: (比如贴目数量减一),这些参数可能不收敛,必须从头再次优化。
: 这么理解对吗?

b***u
发帖数: 60
3
ANN不是这个原理。我学的时候是线性叠加的层网络。不知现在有何进步。

【在 O***O 的大作中提到】
: 我的理解,阿尔法狗的程序就是一个函数:y=f(x),其中y和x都是矩阵或者矢量。y是
: 输出的棋子位置,x是盘面上的棋子位置。
: 函数f复杂无比。如果阿尔法狗用了3000万盘棋来标定,每盘棋100手,那么这个函数的
: 参数可能有几亿十几亿个。
: 最终,当这样大量的参数被优化,围棋之神就出来了。但是如果围棋的规则有微小变化
: (比如贴目数量减一),这些参数可能不收敛,必须从头再次优化。
: 这么理解对吗?

m*****n
发帖数: 2152
4
完全不对。
我觉得你可以理解成,一个小孩被交给了围棋规则,和几张棋谱,然后自己和自己下了
上亿盘,训练了自己的大脑,然后来和9段下。

【在 O***O 的大作中提到】
: 我的理解,阿尔法狗的程序就是一个函数:y=f(x),其中y和x都是矩阵或者矢量。y是
: 输出的棋子位置,x是盘面上的棋子位置。
: 函数f复杂无比。如果阿尔法狗用了3000万盘棋来标定,每盘棋100手,那么这个函数的
: 参数可能有几亿十几亿个。
: 最终,当这样大量的参数被优化,围棋之神就出来了。但是如果围棋的规则有微小变化
: (比如贴目数量减一),这些参数可能不收敛,必须从头再次优化。
: 这么理解对吗?

1 (共1页)
进入Go版参与讨论
相关主题
金志锡:让我两个可能是好胜负本人弈城五段给大家分析一下吧
对我狗的崇拜要盲目现在反悔里外不是人
关于alphago的不合理招法田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?
人民日报:思想的尊严永远只属于人类!疑似阿尔法围棋测试账号
25的诞生谷歌AlphaGo是科学欺诈? 三方面疑点引猜测(转)
Nature重磅封面:谷歌人工智能击败欧洲围棋冠军李世石在自己最强的地方已经失去信心
原来阿尔法下的是5秒版的ZENAlphaGo创始人:下个对手希望是中国柯洁 (转载)
罗洗河让四子公开挑战阿狗alphago如果真不懂征子,就部分证明了我的观点
相关话题的讨论汇总
话题: alphago话题: 原理话题: 函数话题: 参数话题: 围棋