由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - AlphaGo 主要研发人员 David Silver
相关主题
现在最爽的是黄aja史记 阿狗列传
看大家讨论中比较少提这个 reinforcement learning谁有阿发狗在Nature上的那篇paper
围棋人工智能Deep Learning就是在玩数学李师师下假棋了么?
我来总结一下吧,AlphaGo 其实根本赢不了顶尖棋手这版名怎么了?
G搞围棋其实是找软柿子捏●芝加哥美洲华裔博物舘需要志愿者参加文化节●
BI发文说: AlphaGo is the favorite to beat Sedol阿法狗的算法其实是给人留了很大面子啊
阿法狗第二局最令人震惊的地方在于Nature重磅封面:谷歌人工智能击败欧洲围棋冠军
如何打败ALPHAGOAlphaGo赢樊辉的意义
相关话题的讨论汇总
话题: silver话题: david话题: 电脑话题: poker话题: 一对一
进入Go版参与讨论
1 (共1页)
e********9
发帖数: 444
1
David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
学习专家。
也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
AlphaGo绝对是很多年的积累。
b*******s
发帖数: 1919
2
玩在线的成绩如何?游戏币的也可以

究。

【在 e********9 的大作中提到】
: David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
: UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
: 学习专家。
: 也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
: 目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
: DeepMind里也有Hinton的学生。
: Huang是并列第一的作者。
: AlphaGo绝对是很多年的积累。

b***k
发帖数: 622
3
还在做poker?interesting
我的两大爱好啊,哈哈,都要被电脑攻克了。
e********9
发帖数: 444
4
以前跟Laak几个人玩过一次
平均下来赢了
这种有概率的游戏胜负判断麻烦一些
h*********n
发帖数: 5789
5
听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
多,电脑搞不定。

【在 e********9 的大作中提到】
: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

a****o
发帖数: 6612
6
poker 的选手reading很重要。职业选手对电脑的话,没有这方面的优势,也没有计算
优势。

【在 h*********n 的大作中提到】
: 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
: 多,电脑搞不定。

w***w
发帖数: 6301
7
是反过来,一对一比较难打,一对多比较简单。
因为台子上的人越多,牌的作用越大,技术发挥的空间越小。
反过来台子上的人越少,技术的作用越大。
最好的电脑曾经一对一和世界高手较量,以大劣势输了。
目前电脑可以在有限德州扑克的一对一中赢人类。
http://www.theverge.com/2015/1/8/7516219/Texas-Hold-Em-poker-so
但是在无限德州扑克的一对一中,电脑离世界高手还差的很远。
http://www.cardplayer.com/poker-news/18346-no-limit-hold-em-pok

【在 h*********n 的大作中提到】
: 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
: 多,电脑搞不定。

e********9
发帖数: 444
8
poker最大的问题是
有概率,那么目标函数里应该一定有期望
有期望的话,就很难评价输赢
要很多次才有统计意义
reading是个很好的point
不过online就无所谓了
b*******s
发帖数: 1919
9
Pokerstars 的那些 SitNGo、Tourney 这个程序上去能打个第几?游戏币的就可以,水
平不低
而且什么叫做平均下来赢了?输就输、赢就是赢不是吗,还有平均?胜负判断有什么麻
烦的,最后谁筹码多谁胜吗不是

【在 e********9 的大作中提到】
: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

n**n
发帖数: 626
10
我觉得电脑扑克应该也能搞定,只是方法不对路
[在 enjoylife9 ((^.^)) 的大作中提到:]

:David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
究。
:...........
相关主题
BI发文说: AlphaGo is the favorite to beat Sedol史记 阿狗列传
阿法狗第二局最令人震惊的地方在于谁有阿发狗在Nature上的那篇paper
如何打败ALPHAGO李师师下假棋了么?
进入Go版参与讨论
w***w
发帖数: 6301
11
你这句话是本来我想说的。
在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特
点。这个我觉得电脑应该比人脑更强。
因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
精力照顾到每个细节。
如果电脑的设计是强调牌,则没有抓住一对一的关键。
一对一打应该研究的是人。

【在 n**n 的大作中提到】
: 我觉得电脑扑克应该也能搞定,只是方法不对路
: [在 enjoylife9 ((^.^)) 的大作中提到:]
: :
: :David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
: 究。
: :...........

b*******s
发帖数: 1919
12
唉,甭说那么多了,是骡子是马拉出去遛遛
前面说的PS上最低一级的 SitNGo,游戏币的,上去能不能打个第一?把把第一很多人
都可以

【在 w***w 的大作中提到】
: 你这句话是本来我想说的。
: 在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特
: 点。这个我觉得电脑应该比人脑更强。
: 因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
: 精力照顾到每个细节。
: 如果电脑的设计是强调牌,则没有抓住一对一的关键。
: 一对一打应该研究的是人。

e********9
发帖数: 444
13
David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
学习专家。
也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
查了一下huang的linkedin
台湾博士毕业后到UofAlberta做博士后,应该是跟Muller做Go
这家伙硕士博士读10多年,也不容易
两位主要研发人员10多年研究经验,AlphaGo绝对是很多年的积累。
b*******s
发帖数: 1919
14
玩在线的成绩如何?游戏币的也可以

究。

【在 e********9 的大作中提到】
: David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
: UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
: 学习专家。
: 也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
: 目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
: DeepMind里也有Hinton的学生。
: Huang是并列第一的作者。
: 查了一下huang的linkedin
: 台湾博士毕业后到UofAlberta做博士后,应该是跟Muller做Go
: 这家伙硕士博士读10多年,也不容易

b***k
发帖数: 622
15
还在做poker?interesting
我的两大爱好啊,哈哈,都要被电脑攻克了。
e********9
发帖数: 444
16
以前跟Laak几个人玩过一次
平均下来赢了
这种有概率的游戏胜负判断麻烦一些
h*********n
发帖数: 5789
17
听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
多,电脑搞不定。

【在 e********9 的大作中提到】
: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

a****o
发帖数: 6612
18
poker 的选手reading很重要。职业选手对电脑的话,没有这方面的优势,也没有计算
优势。

【在 h*********n 的大作中提到】
: 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
: 多,电脑搞不定。

w***w
发帖数: 6301
19
是反过来,一对一比较难打,一对多比较简单。
因为台子上的人越多,牌的作用越大,技术发挥的空间越小。
反过来台子上的人越少,技术的作用越大。
最好的电脑曾经一对一和世界高手较量,以大劣势输了。
目前电脑可以在有限德州扑克的一对一中赢人类。
http://www.theverge.com/2015/1/8/7516219/Texas-Hold-Em-poker-so
但是在无限德州扑克的一对一中,电脑离世界高手还差的很远。
http://www.cardplayer.com/poker-news/18346-no-limit-hold-em-pok

【在 h*********n 的大作中提到】
: 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
: 多,电脑搞不定。

e********9
发帖数: 444
20
poker最大的问题是
有概率,那么目标函数里应该一定有期望
有期望的话,就很难评价输赢
要很多次才有统计意义
reading是个很好的point
不过online就无所谓了
相关主题
这版名怎么了?Nature重磅封面:谷歌人工智能击败欧洲围棋冠军
●芝加哥美洲华裔博物舘需要志愿者参加文化节●AlphaGo赢樊辉的意义
阿法狗的算法其实是给人留了很大面子啊李师师敢赌一百万美元5:0 fan hui么
进入Go版参与讨论
b*******s
发帖数: 1919
21
Pokerstars 的那些 SitNGo、Tourney 这个程序上去能打个第几?游戏币的就可以,水
平不低
而且什么叫做平均下来赢了?输就输、赢就是赢不是吗,还有平均?胜负判断有什么麻
烦的,最后谁筹码多谁胜吗不是

【在 e********9 的大作中提到】
: 以前跟Laak几个人玩过一次
: 平均下来赢了
: 这种有概率的游戏胜负判断麻烦一些

n**n
发帖数: 626
22
我觉得电脑扑克应该也能搞定,只是方法不对路
[在 enjoylife9 ((^.^)) 的大作中提到:]

:David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
究。
:...........
w***w
发帖数: 6301
23
你这句话是本来我想说的。
在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特
点。这个我觉得电脑应该比人脑更强。
因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
精力照顾到每个细节。
如果电脑的设计是强调牌,则没有抓住一对一的关键。
一对一打应该研究的是人。

【在 n**n 的大作中提到】
: 我觉得电脑扑克应该也能搞定,只是方法不对路
: [在 enjoylife9 ((^.^)) 的大作中提到:]
: :
: :David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
: 究。
: :...........

b*******s
发帖数: 1919
24
唉,甭说那么多了,是骡子是马拉出去遛遛
前面说的PS上最低一级的 SitNGo,游戏币的,上去能不能打个第一?这个难度级很多
人都能把把第一

【在 w***w 的大作中提到】
: 你这句话是本来我想说的。
: 在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特
: 点。这个我觉得电脑应该比人脑更强。
: 因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
: 精力照顾到每个细节。
: 如果电脑的设计是强调牌,则没有抓住一对一的关键。
: 一对一打应该研究的是人。

e********9
发帖数: 444
25
UofAlberta 教授 Michael Bowling 2015 Science 论文
Heads-up Limit Hold'em Poker is Solved
是 Limit,不过,敢说solved,应该不错
这个地方可以去玩
http://poker.srv.ualberta.ca
(其实就是上面wmwmw提到的)
E***a
发帖数: 485
26
如果是solved,那当然谁都打不过,包括Laak,Phil Ivey也不行。但这只是有限下注
,而且是一对一。无限的就完全不一样了。就算有限注,多出几个人玩电脑就肯定
solve不了,这还不包括其他几个人合伙的情况。

【在 e********9 的大作中提到】
: UofAlberta 教授 Michael Bowling 2015 Science 论文
: Heads-up Limit Hold'em Poker is Solved
: 是 Limit,不过,敢说solved,应该不错
: 这个地方可以去玩
: http://poker.srv.ualberta.ca
: (其实就是上面wmwmw提到的)

a****o
发帖数: 6612
27
这个有概率在里面。靠运气也可以赢。但长期下来的期望值会输。

【在 E***a 的大作中提到】
: 如果是solved,那当然谁都打不过,包括Laak,Phil Ivey也不行。但这只是有限下注
: ,而且是一对一。无限的就完全不一样了。就算有限注,多出几个人玩电脑就肯定
: solve不了,这还不包括其他几个人合伙的情况。

b*******s
发帖数: 1919
28
刚上去玩了几把,把丫虐得找不着北。。。这也叫 Solved???

【在 e********9 的大作中提到】
: UofAlberta 教授 Michael Bowling 2015 Science 论文
: Heads-up Limit Hold'em Poker is Solved
: 是 Limit,不过,敢说solved,应该不错
: 这个地方可以去玩
: http://poker.srv.ualberta.ca
: (其实就是上面wmwmw提到的)

1 (共1页)
进入Go版参与讨论
相关主题
AlphaGo赢樊辉的意义G搞围棋其实是找软柿子捏
李师师敢赌一百万美元5:0 fan hui么BI发文说: AlphaGo is the favorite to beat Sedol
让两台AlphoGo对决,是不是基本就扯犊子了?阿法狗第二局最令人震惊的地方在于
喆理围棋---关于Google人工智能围棋的访谈如何打败ALPHAGO
现在最爽的是黄aja史记 阿狗列传
看大家讨论中比较少提这个 reinforcement learning谁有阿发狗在Nature上的那篇paper
围棋人工智能Deep Learning就是在玩数学李师师下假棋了么?
我来总结一下吧,AlphaGo 其实根本赢不了顶尖棋手这版名怎么了?
相关话题的讨论汇总
话题: silver话题: david话题: 电脑话题: poker话题: 一对一