AlphaGo 主要研发人员 David Silver - Go版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - AlphaGo 主要研发人员 David Silver

相关主题
● 现在最爽的是黄aja	● 史记阿狗列传
● 看大家讨论中比较少提这个 reinforcement learning	● 谁有阿发狗在Nature上的那篇paper
● 围棋人工智能Deep Learning就是在玩数学	● 李师师下假棋了么？
● 我来总结一下吧，AlphaGo 其实根本赢不了顶尖棋手	● 这版名怎么了？
● G搞围棋其实是找软柿子捏	● ●芝加哥美洲华裔博物舘需要志愿者参加文化节●
● BI发文说: AlphaGo is the favorite to beat Sedol	● 阿法狗的算法其实是给人留了很大面子啊
● 阿法狗第二局最令人震惊的地方在于	● Nature重磅封面：谷歌人工智能击败欧洲围棋冠军
● 如何打败ALPHAGO	● AlphaGo赢樊辉的意义

相关话题的讨论汇总
话题: silver话题: david话题: 电脑话题: poker话题: 一对一

进入Go版参与讨论

(共1页)

e********9
发帖数: 444

David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton，和几位国际知名的机器
学习专家。
也有非常强的GAMES Group，曾经做Checker程序打败世界冠军（比DeepBlue早）。
目前也在做Poker，跟世界级的高手比过，例如Laak，成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
AlphaGo绝对是很多年的积累。

b*******s
发帖数: 1919

玩在线的成绩如何？游戏币的也可以

究。

【在 e********9 的大作中提到】

: David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
: UofAlberta有Reinforcement Learning的奠基人Rich Sutton，和几位国际知名的机器
: 学习专家。
: 也有非常强的GAMES Group，曾经做Checker程序打败世界冠军（比DeepBlue早）。
: 目前也在做Poker，跟世界级的高手比过，例如Laak，成绩不错。
: DeepMind里也有Hinton的学生。
: Huang是并列第一的作者。
: AlphaGo绝对是很多年的积累。

b***k
发帖数: 622

还在做poker？interesting
我的两大爱好啊，哈哈，都要被电脑攻克了。

e********9
发帖数: 444

以前跟Laak几个人玩过一次
平均下来赢了
这种有概率的游戏胜负判断麻烦一些

h*********n
发帖数: 5789

听说，一对一的时候，电脑的胜率不错，但是一对多打poker的时候，不确定的因素太
多，电脑搞不定。

【在 e********9 的大作中提到】

: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

a****o
发帖数: 6612

poker 的选手reading很重要。职业选手对电脑的话，没有这方面的优势，也没有计算
优势。

【在 h*********n 的大作中提到】

: 听说，一对一的时候，电脑的胜率不错，但是一对多打poker的时候，不确定的因素太
: 多，电脑搞不定。

w***w
发帖数: 6301

是反过来，一对一比较难打，一对多比较简单。
因为台子上的人越多，牌的作用越大，技术发挥的空间越小。
反过来台子上的人越少，技术的作用越大。
最好的电脑曾经一对一和世界高手较量，以大劣势输了。
目前电脑可以在有限德州扑克的一对一中赢人类。
http://www.theverge.com/2015/1/8/7516219/Texas-Hold-Em-poker-so
但是在无限德州扑克的一对一中，电脑离世界高手还差的很远。
http://www.cardplayer.com/poker-news/18346-no-limit-hold-em-pok

【在 h*********n 的大作中提到】

: 听说，一对一的时候，电脑的胜率不错，但是一对多打poker的时候，不确定的因素太
: 多，电脑搞不定。

e********9
发帖数: 444

poker最大的问题是
有概率，那么目标函数里应该一定有期望
有期望的话，就很难评价输赢
要很多次才有统计意义
reading是个很好的point
不过online就无所谓了

b*******s
发帖数: 1919

Pokerstars 的那些 SitNGo、Tourney 这个程序上去能打个第几？游戏币的就可以，水
平不低
而且什么叫做平均下来赢了？输就输、赢就是赢不是吗，还有平均？胜负判断有什么麻
烦的，最后谁筹码多谁胜吗不是

【在 e********9 的大作中提到】

: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

n**n
发帖数: 626

我觉得电脑扑克应该也能搞定，只是方法不对路
[在 enjoylife9 ((^.^)) 的大作中提到：]
：
：David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
究。
：...........

相关主题
● BI发文说: AlphaGo is the favorite to beat Sedol	● 史记阿狗列传
● 阿法狗第二局最令人震惊的地方在于	● 谁有阿发狗在Nature上的那篇paper
● 如何打败ALPHAGO	● 李师师下假棋了么？
进入Go版参与讨论

w***w
发帖数: 6301

你这句话是本来我想说的。
在无限德州扑克一对一比赛中，斗的是双方（从对方过去的出牌中）摸索出对手出牌特
点。这个我觉得电脑应该比人脑更强。
因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
精力照顾到每个细节。
如果电脑的设计是强调牌，则没有抓住一对一的关键。
一对一打应该研究的是人。

【在 n**n 的大作中提到】

: 我觉得电脑扑克应该也能搞定，只是方法不对路
: [在 enjoylife9 ((^.^)) 的大作中提到：]
: ：
: ：David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
: 究。
: ：...........

b*******s
发帖数: 1919

唉，甭说那么多了，是骡子是马拉出去遛遛
前面说的PS上最低一级的 SitNGo，游戏币的，上去能不能打个第一？把把第一很多人
都可以

【在 w***w 的大作中提到】

: 你这句话是本来我想说的。
: 在无限德州扑克一对一比赛中，斗的是双方（从对方过去的出牌中）摸索出对手出牌特
: 点。这个我觉得电脑应该比人脑更强。
: 因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
: 精力照顾到每个细节。
: 如果电脑的设计是强调牌，则没有抓住一对一的关键。
: 一对一打应该研究的是人。

e********9
发帖数: 444

b*******s
发帖数: 1919

玩在线的成绩如何？游戏币的也可以

究。

【在 e********9 的大作中提到】

b***k
发帖数: 622

还在做poker？interesting
我的两大爱好啊，哈哈，都要被电脑攻克了。

e********9
发帖数: 444

以前跟Laak几个人玩过一次
平均下来赢了
这种有概率的游戏胜负判断麻烦一些

h*********n
发帖数: 5789

听说，一对一的时候，电脑的胜率不错，但是一对多打poker的时候，不确定的因素太
多，电脑搞不定。

【在 e********9 的大作中提到】

: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

a****o
发帖数: 6612

poker 的选手reading很重要。职业选手对电脑的话，没有这方面的优势，也没有计算
优势。

【在 h*********n 的大作中提到】

: 听说，一对一的时候，电脑的胜率不错，但是一对多打poker的时候，不确定的因素太
: 多，电脑搞不定。

w***w
发帖数: 6301

: 听说，一对一的时候，电脑的胜率不错，但是一对多打poker的时候，不确定的因素太
: 多，电脑搞不定。

e********9
发帖数: 444

相关主题
● 这版名怎么了？	● Nature重磅封面：谷歌人工智能击败欧洲围棋冠军
● ●芝加哥美洲华裔博物舘需要志愿者参加文化节●	● AlphaGo赢樊辉的意义
● 阿法狗的算法其实是给人留了很大面子啊	● 李师师敢赌一百万美元5：0 fan hui么
进入Go版参与讨论

b*******s
发帖数: 1919

: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

n**n
发帖数: 626

w***w
发帖数: 6301

b*******s
发帖数: 1919

唉，甭说那么多了，是骡子是马拉出去遛遛
前面说的PS上最低一级的 SitNGo，游戏币的，上去能不能打个第一？这个难度级很多
人都能把把第一

【在 w***w 的大作中提到】

e********9
发帖数: 444

UofAlberta 教授 Michael Bowling 2015 Science 论文
Heads-up Limit Hold'em Poker is Solved
是 Limit，不过，敢说solved，应该不错
这个地方可以去玩
http://poker.srv.ualberta.ca
(其实就是上面wmwmw提到的)

E***a
发帖数: 485

如果是solved，那当然谁都打不过，包括Laak，Phil Ivey也不行。但这只是有限下注
，而且是一对一。无限的就完全不一样了。就算有限注，多出几个人玩电脑就肯定
solve不了，这还不包括其他几个人合伙的情况。

【在 e********9 的大作中提到】

: UofAlberta 教授 Michael Bowling 2015 Science 论文
: Heads-up Limit Hold'em Poker is Solved
: 是 Limit，不过，敢说solved，应该不错
: 这个地方可以去玩
: http://poker.srv.ualberta.ca
: (其实就是上面wmwmw提到的)

a****o
发帖数: 6612

这个有概率在里面。靠运气也可以赢。但长期下来的期望值会输。

【在 E***a 的大作中提到】

: 如果是solved，那当然谁都打不过，包括Laak，Phil Ivey也不行。但这只是有限下注
: ，而且是一对一。无限的就完全不一样了。就算有限注，多出几个人玩电脑就肯定
: solve不了，这还不包括其他几个人合伙的情况。

b*******s
发帖数: 1919

刚上去玩了几把，把丫虐得找不着北。。。这也叫 Solved？？？

【在 e********9 的大作中提到】

(共1页)

进入Go版参与讨论

相关主题
● AlphaGo赢樊辉的意义	● G搞围棋其实是找软柿子捏
● 李师师敢赌一百万美元5：0 fan hui么	● BI发文说: AlphaGo is the favorite to beat Sedol
● 让两台AlphoGo对决，是不是基本就扯犊子了？	● 阿法狗第二局最令人震惊的地方在于
● 喆理围棋---关于Google人工智能围棋的访谈	● 如何打败ALPHAGO
● 现在最爽的是黄aja	● 史记阿狗列传
● 看大家讨论中比较少提这个 reinforcement learning	● 谁有阿发狗在Nature上的那篇paper
● 围棋人工智能Deep Learning就是在玩数学	● 李师师下假棋了么？
● 我来总结一下吧，AlphaGo 其实根本赢不了顶尖棋手	● 这版名怎么了？

相关话题的讨论汇总
话题: silver话题: david话题: 电脑话题: poker话题: 一对一

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天