p**********m 发帖数: 143 | 1 到了87才意识到自己死惨了。
When I say 'thought' and 'realisation' I just mean the output of #AlphaGo
value net. It was around 70% at move 79 and then dived on move 87
https://twitter.com/demishassabis/status/708937560068739072 |
d****v 发帖数: 458 | |
a****t 发帖数: 7049 | 3 应该是个很少出现的棋盘吧(整体,不是说局部),training数据少。 |
k*l 发帖数: 2574 | 4 延时太多,反应慢。不是每步都重新算,应该没啥memory 效应的啊 |
p**********m 发帖数: 143 | 5 高估自己的胜率就是自大
【在 d****v 的大作中提到】 : 狗哪里有情感,哪里懂啥叫自大
|
h******k 发帖数: 13418 | 6 就是算法有死角,狗这下值了,终于人类高手给测出个大BUG。 |
d****v 发帖数: 458 | 7 或者叫八哥
【在 p**********m 的大作中提到】 : 高估自己的胜率就是自大
|
d*********2 发帖数: 48111 | 8 我怀疑吧, 狗是把每个position出现的落子, 结合最终胜率, 计算了一个grid网
络密度。
结果在78以后, 狗被trap在一堆低端局的胜负谱里面,
结果最后走出来87, 89这种业余手段来
【在 a****t 的大作中提到】 : 应该是个很少出现的棋盘吧(整体,不是说局部),training数据少。
|
t******l 发帖数: 10908 | 9 跟人类一样,臭子总是跟自大联系在一起的,俗称:“自大一点叫做臭”。。。
【在 p**********m 的大作中提到】 : 到了87才意识到自己死惨了。 : When I say 'thought' and 'realisation' I just mean the output of #AlphaGo : value net. It was around 70% at move 79 and then dived on move 87 : https://twitter.com/demishassabis/status/708937560068739072
|
t******l 发帖数: 10908 | 10 有可能。
但是改变这个就变成要狗冒更多风险,(同时追求两个优化目标,风险更大)。
那如何动态地在风险和稳妥中平衡,就又成为一个问题。
【在 d*********2 的大作中提到】 : 我怀疑吧, 狗是把每个position出现的落子, 结合最终胜率, 计算了一个grid网 : 络密度。 : 结果在78以后, 狗被trap在一堆低端局的胜负谱里面, : 结果最后走出来87, 89这种业余手段来
|