e********9 发帖数: 444 | 1 David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
学习专家。
也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
AlphaGo绝对是很多年的积累。 |
b*******s 发帖数: 1919 | 2 玩在线的成绩如何?游戏币的也可以
究。
【在 e********9 的大作中提到】 : David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。 : UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器 : 学习专家。 : 也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。 : 目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。 : DeepMind里也有Hinton的学生。 : Huang是并列第一的作者。 : AlphaGo绝对是很多年的积累。
|
b***k 发帖数: 622 | 3 还在做poker?interesting
我的两大爱好啊,哈哈,都要被电脑攻克了。 |
e********9 发帖数: 444 | 4 以前跟Laak几个人玩过一次
平均下来赢了
这种有概率的游戏胜负判断麻烦一些 |
h*********n 发帖数: 5789 | 5 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
多,电脑搞不定。
【在 e********9 的大作中提到】 : 以前跟Laak几个人玩过一次 : 平均下来赢了 : 这种有概率的游戏胜负判断麻烦一些
|
a****o 发帖数: 6612 | 6 poker 的选手reading很重要。职业选手对电脑的话,没有这方面的优势,也没有计算
优势。
【在 h*********n 的大作中提到】 : 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太 : 多,电脑搞不定。
|
w***w 发帖数: 6301 | 7 是反过来,一对一比较难打,一对多比较简单。
因为台子上的人越多,牌的作用越大,技术发挥的空间越小。
反过来台子上的人越少,技术的作用越大。
最好的电脑曾经一对一和世界高手较量,以大劣势输了。
目前电脑可以在有限德州扑克的一对一中赢人类。
http://www.theverge.com/2015/1/8/7516219/Texas-Hold-Em-poker-so
但是在无限德州扑克的一对一中,电脑离世界高手还差的很远。
http://www.cardplayer.com/poker-news/18346-no-limit-hold-em-pok
【在 h*********n 的大作中提到】 : 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太 : 多,电脑搞不定。
|
e********9 发帖数: 444 | 8 poker最大的问题是
有概率,那么目标函数里应该一定有期望
有期望的话,就很难评价输赢
要很多次才有统计意义
reading是个很好的point
不过online就无所谓了 |
b*******s 发帖数: 1919 | 9 Pokerstars 的那些 SitNGo、Tourney 这个程序上去能打个第几?游戏币的就可以,水
平不低
而且什么叫做平均下来赢了?输就输、赢就是赢不是吗,还有平均?胜负判断有什么麻
烦的,最后谁筹码多谁胜吗不是
【在 e********9 的大作中提到】 : 以前跟Laak几个人玩过一次 : 平均下来赢了 : 这种有概率的游戏胜负判断麻烦一些
|
n**n 发帖数: 626 | 10 我觉得电脑扑克应该也能搞定,只是方法不对路
[在 enjoylife9 ((^.^)) 的大作中提到:]
:
:David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
究。
:........... |
|
|
w***w 发帖数: 6301 | 11 你这句话是本来我想说的。
在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特
点。这个我觉得电脑应该比人脑更强。
因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
精力照顾到每个细节。
如果电脑的设计是强调牌,则没有抓住一对一的关键。
一对一打应该研究的是人。
【在 n**n 的大作中提到】 : 我觉得电脑扑克应该也能搞定,只是方法不对路 : [在 enjoylife9 ((^.^)) 的大作中提到:] : : : :David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研 : 究。 : :...........
|
b*******s 发帖数: 1919 | 12 唉,甭说那么多了,是骡子是马拉出去遛遛
前面说的PS上最低一级的 SitNGo,游戏币的,上去能不能打个第一?把把第一很多人
都可以
【在 w***w 的大作中提到】 : 你这句话是本来我想说的。 : 在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特 : 点。这个我觉得电脑应该比人脑更强。 : 因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多 : 精力照顾到每个细节。 : 如果电脑的设计是强调牌,则没有抓住一对一的关键。 : 一对一打应该研究的是人。
|
e********9 发帖数: 444 | 13 David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。
UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器
学习专家。
也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。
目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。
DeepMind里也有Hinton的学生。
Huang是并列第一的作者。
查了一下huang的linkedin
台湾博士毕业后到UofAlberta做博士后,应该是跟Muller做Go
这家伙硕士博士读10多年,也不容易
两位主要研发人员10多年研究经验,AlphaGo绝对是很多年的积累。 |
b*******s 发帖数: 1919 | 14 玩在线的成绩如何?游戏币的也可以
究。
【在 e********9 的大作中提到】 : David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研究。 : UofAlberta有Reinforcement Learning的奠基人Rich Sutton,和几位国际知名的机器 : 学习专家。 : 也有非常强的GAMES Group,曾经做Checker程序打败世界冠军(比DeepBlue早)。 : 目前也在做Poker,跟世界级的高手比过,例如Laak,成绩不错。 : DeepMind里也有Hinton的学生。 : Huang是并列第一的作者。 : 查了一下huang的linkedin : 台湾博士毕业后到UofAlberta做博士后,应该是跟Muller做Go : 这家伙硕士博士读10多年,也不容易
|
b***k 发帖数: 622 | 15 还在做poker?interesting
我的两大爱好啊,哈哈,都要被电脑攻克了。 |
e********9 发帖数: 444 | 16 以前跟Laak几个人玩过一次
平均下来赢了
这种有概率的游戏胜负判断麻烦一些 |
h*********n 发帖数: 5789 | 17 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太
多,电脑搞不定。
【在 e********9 的大作中提到】 : 以前跟Laak几个人玩过一次 : 平均下来赢了 : 这种有概率的游戏胜负判断麻烦一些
|
a****o 发帖数: 6612 | 18 poker 的选手reading很重要。职业选手对电脑的话,没有这方面的优势,也没有计算
优势。
【在 h*********n 的大作中提到】 : 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太 : 多,电脑搞不定。
|
w***w 发帖数: 6301 | 19 是反过来,一对一比较难打,一对多比较简单。
因为台子上的人越多,牌的作用越大,技术发挥的空间越小。
反过来台子上的人越少,技术的作用越大。
最好的电脑曾经一对一和世界高手较量,以大劣势输了。
目前电脑可以在有限德州扑克的一对一中赢人类。
http://www.theverge.com/2015/1/8/7516219/Texas-Hold-Em-poker-so
但是在无限德州扑克的一对一中,电脑离世界高手还差的很远。
http://www.cardplayer.com/poker-news/18346-no-limit-hold-em-pok
【在 h*********n 的大作中提到】 : 听说,一对一的时候,电脑的胜率不错,但是一对多打poker的时候,不确定的因素太 : 多,电脑搞不定。
|
e********9 发帖数: 444 | 20 poker最大的问题是
有概率,那么目标函数里应该一定有期望
有期望的话,就很难评价输赢
要很多次才有统计意义
reading是个很好的point
不过online就无所谓了 |
|
|
b*******s 发帖数: 1919 | 21 Pokerstars 的那些 SitNGo、Tourney 这个程序上去能打个第几?游戏币的就可以,水
平不低
而且什么叫做平均下来赢了?输就输、赢就是赢不是吗,还有平均?胜负判断有什么麻
烦的,最后谁筹码多谁胜吗不是
【在 e********9 的大作中提到】 : 以前跟Laak几个人玩过一次 : 平均下来赢了 : 这种有概率的游戏胜负判断麻烦一些
|
n**n 发帖数: 626 | 22 我觉得电脑扑克应该也能搞定,只是方法不对路
[在 enjoylife9 ((^.^)) 的大作中提到:]
:
:David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研
究。
:........... |
w***w 发帖数: 6301 | 23 你这句话是本来我想说的。
在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特
点。这个我觉得电脑应该比人脑更强。
因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多
精力照顾到每个细节。
如果电脑的设计是强调牌,则没有抓住一对一的关键。
一对一打应该研究的是人。
【在 n**n 的大作中提到】 : 我觉得电脑扑克应该也能搞定,只是方法不对路 : [在 enjoylife9 ((^.^)) 的大作中提到:] : : : :David Silver 10多年前在University of Alberta读博做博士后期间开始围棋相关研 : 究。 : :...........
|
b*******s 发帖数: 1919 | 24 唉,甭说那么多了,是骡子是马拉出去遛遛
前面说的PS上最低一级的 SitNGo,游戏币的,上去能不能打个第一?这个难度级很多
人都能把把第一
【在 w***w 的大作中提到】 : 你这句话是本来我想说的。 : 在无限德州扑克一对一比赛中,斗的是双方(从对方过去的出牌中)摸索出对手出牌特 : 点。这个我觉得电脑应该比人脑更强。 : 因为电脑记录的更精确更客观。而且电脑可以记录对手每一个细节。人脑则没有那么多 : 精力照顾到每个细节。 : 如果电脑的设计是强调牌,则没有抓住一对一的关键。 : 一对一打应该研究的是人。
|
e********9 发帖数: 444 | 25 UofAlberta 教授 Michael Bowling 2015 Science 论文
Heads-up Limit Hold'em Poker is Solved
是 Limit,不过,敢说solved,应该不错
这个地方可以去玩
http://poker.srv.ualberta.ca
(其实就是上面wmwmw提到的) |
E***a 发帖数: 485 | 26 如果是solved,那当然谁都打不过,包括Laak,Phil Ivey也不行。但这只是有限下注
,而且是一对一。无限的就完全不一样了。就算有限注,多出几个人玩电脑就肯定
solve不了,这还不包括其他几个人合伙的情况。
【在 e********9 的大作中提到】 : UofAlberta 教授 Michael Bowling 2015 Science 论文 : Heads-up Limit Hold'em Poker is Solved : 是 Limit,不过,敢说solved,应该不错 : 这个地方可以去玩 : http://poker.srv.ualberta.ca : (其实就是上面wmwmw提到的)
|
a****o 发帖数: 6612 | 27 这个有概率在里面。靠运气也可以赢。但长期下来的期望值会输。
【在 E***a 的大作中提到】 : 如果是solved,那当然谁都打不过,包括Laak,Phil Ivey也不行。但这只是有限下注 : ,而且是一对一。无限的就完全不一样了。就算有限注,多出几个人玩电脑就肯定 : solve不了,这还不包括其他几个人合伙的情况。
|
b*******s 发帖数: 1919 | 28 刚上去玩了几把,把丫虐得找不着北。。。这也叫 Solved???
【在 e********9 的大作中提到】 : UofAlberta 教授 Michael Bowling 2015 Science 论文 : Heads-up Limit Hold'em Poker is Solved : 是 Limit,不过,敢说solved,应该不错 : 这个地方可以去玩 : http://poker.srv.ualberta.ca : (其实就是上面wmwmw提到的)
|