阿尔法狗 - CS版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

CS版 - 阿尔法狗

相关主题
● 神经网络到底是真的有用的技术还是伪科学?
● 计算神经系统科学（Computational Neuroscience)有
● 李开复批中国教育：老师教的专业自己都没读过时事述评
● 请教一个搜索问题
● 算法题求助
● 这就是传说中让理科生沉默，让文科生落泪的文史综合题 (转载)
● 说说看bioinformatics还能热几年?
● 计算智能 computational intelligence 算是cs的一种研究方向马？
● 请问一个遗传算法用于feature selection的问题
● 这里有人研究神经网络的吗？

相关话题的讨论汇总
话题: alphago话题: 人类话题: 训练话题: 阿尔法话题: 棋谱

进入CS版参与讨论

(共1页)

c********6
发帖数: 1

AlphaGo
AlphaGo 的原理并非基于穷举，而是基于两个神经网络所一起作用做出的决策，神经网
络如果简单来看，可以算作是人类对于神经系统的一种模拟，定义好神经元的数量和层
级，初始化权重和偏移，并通过训练数据对其进行训练，即观察它的输出和预期结果之
间的差异，并改进网络本身的参数等。之后神经网络就可以提高自己在解决问题时的表
现。这很类似人类神经系统能够从不断输入的外界数据和反馈中提高自己的表现。比如
学会手握住东西，学会走路，学会走路，学会说话一样。AlphaGo 采用了两个神经网路
，一个叫做价值网络，另一个是策略网络，两个网络共同决定了他的决策。而它最初的
训练数据，则是人类对局中海量的围棋棋谱。AlphaGo 通过学习棋谱到达比较高的水平
，之后再进行自我对弈，并用3000万盘自我对弈的棋谱来进行训练，就如同一个可以左
右互搏的大师，下上数千万局不会疲劳，并最终获得了提升。而人类终其一生也就数千
盘棋，是无法望其项背的。
不过这件事情并没有走到终点，因为就算是战胜了所有的人类选手，AlphaGo最早仍然
是基于人类对于围棋的理解而训练的，也就是说，人类其实之前所积累的智慧给了
AlphaGo关键性的智慧。

n*w
发帖数: 3393

alpha zero呢？

(共1页)

进入CS版参与讨论

相关主题
● 这里有人研究神经网络的吗？
● Google AlphaGo 人工智能挑战人类围棋冠军 (转载)
● google alphago的成就
● 人工智能金融创业
● 一只AlphaGo阿法狗相当于多少PC主机
● 人工智能
● 求教：matlab (转载)
● 周志华：关于强化学习策略
● Nature重磅封面：谷歌人工智能击败欧洲围棋冠军
● 本人弈城五段给大家分析一下吧

相关话题的讨论汇总
话题: alphago话题: 人类话题: 训练话题: 阿尔法话题: 棋谱

boards