阿法狗应该如何使用自由时间？ - Go版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - 阿法狗应该如何使用自由时间？

相关主题
● 阿法狗第二局最令人震惊的地方在于	● Nature重磅封面：谷歌人工智能击败欧洲围棋冠军
● 仔细想了一下，阿法狗的算法在劫争上完全没有漏洞	● 说说我眼中阿尔法的棋力
● 阿法狗下围棋离人类还差的远	● 把deepmind在弈城的棋谱大概看了一遍
● 阿发狗仍然不是不可战胜	● 第三局估计也没啥可看了
● 哈比斯说没用高手期局训练啊	● 五盘下完之后
● 加塞不加塞倒是无所谓	● 说说human learning吧
● 问个围棋问题	● 其实李下得并不好
● 61手和峰峰	● 谁把weiqitv上五佳瞬间棋谱给alpha做做看

相关话题的讨论汇总
话题: 计算话题: 时间话题: 应手话题: 计算机话题: 思考

进入Go版参与讨论

1

(共1页)

D*******r 发帖数: 2323	1 一直对计算机如何使用自由支配时间有疑问。如果把时间平均到每一步肯定不好，比如说每步“想”两分钟，那么就会导致在只此一手的地方花费太长时间，而需要多计算的地方“想”得不够。如果根据找到得胜概率大于某个数，比如说60%的一手，那么也行不通，比如说布局阶段，任何一手都不能说有大于60%以上的胜率，那它就会无休止地思考下去直到时间用完？怎么根据棋局阶段，得胜概率，以及计算复杂需求来制定用时策略，实在是个难题。看来以后高手对局不但要有棋谱记录，还要有每一手的用时记录，这样计算机就能学习人类在什么情况下需要多算多思考的智慧。
s***u 发帖数: 80	2 平均用时问题也不大，因为计算的结果在后续局面也可以部分使用上，包括对手下棋的时候，计算机也在思考。另外，程序内部也可以判断当前局面是否出于困难，适当增加一些计算时间吧。【在 D*******r 的大作中提到】 : 一直对计算机如何使用自由支配时间有疑问。如果把时间平均到每一步肯定不好，比如 : 说每步“想”两分钟，那么就会导致在只此一手的地方花费太长时间，而需要多计算的 : 地方“想”得不够。如果根据找到得胜概率大于某个数，比如说60%的一手，那么也行 : 不通，比如说布局阶段，任何一手都不能说有大于60%以上的胜率，那它就会无休止地 : 思考下去直到时间用完？ : 怎么根据棋局阶段，得胜概率，以及计算复杂需求来制定用时策略，实在是个难题。看 : 来以后高手对局不但要有棋谱记录，还要有每一手的用时记录，这样计算机就能学习人 : 类在什么情况下需要多算多思考的智慧。
D*******r 发帖数: 2323	3 平均用时的缺陷还是很明显的。比如当前你有必应的一手，在这手之后，你的对手有10 种可能的应手，这个时候你不把必应的一手完成，而是花时间计算对这手后对方10种应手你应该如何对付，就不如你应完当前这手，等对手应完了以后再计算，这样对其它9 手的应手本不需要计算的。还有就是，当前的计算机围棋程序都是轮它下时才开始计算，它下完后等人类下时，它就是“休息”状态，如何使得计算机学会像人一样地去利用对手时间，也就是说，在对手在思考的时候，它不停止计算，它继续在预选对手可能的应手，并针对这些应手计算并把计算结果存入buffer里，如果人类的应手是它预计的其中一手，它就可以直接从 buffer里调用结果，或者根据buffer里的结果进行更深远的计算。如果人类的应手完全出乎意料，那么再重新计算。反正计算机不需要休息，它可以把所有的比赛时间（不管是分配给对手的还是分配给自己的）全部利用起来进行计算。【在 s***u 的大作中提到】 : 平均用时问题也不大，因为计算的结果在后续局面也可以部分使用上， : 包括对手下棋的时候，计算机也在思考。 : 另外，程序内部也可以判断当前局面是否出于困难，适当增加一些计算时间吧。
s***u 发帖数: 80	4 多少年前计算机程序就已经在利用对手的思考时间思考了。论文上一般把这个叫ponder search。好像。 10 9 【在 D*******r 的大作中提到】 : 平均用时的缺陷还是很明显的。比如当前你有必应的一手，在这手之后，你的对手有10 : 种可能的应手，这个时候你不把必应的一手完成，而是花时间计算对这手后对方10种应 : 手你应该如何对付，就不如你应完当前这手，等对手应完了以后再计算，这样对其它9 : 手的应手本不需要计算的。 : 还有就是，当前的计算机围棋程序都是轮它下时才开始计算，它下完后等人类下时，它 : 就是“休息”状态，如何使得计算机学会像人一样地去利用对手时间，也就是说，在对 : 手在思考的时候，它不停止计算，它继续在预选对手可能的应手，并针对这些应手计算 : 并把计算结果存入buffer里，如果人类的应手是它预计的其中一手，它就可以直接从 : buffer里调用结果，或者根据buffer里的结果进行更深远的计算。如果人类的应手完全 : 出乎意料，那么再重新计算。
D*******r 发帖数: 2323	5 哦，是不是研究性质的程序有这样的？现在的商业软件里好像没这么做的，还有就是我上面提到的用buffer预存前面的计算结果好像商业软件里也没这么做的，都是每步从当前局面重新算？【在 s***u 的大作中提到】 : 多少年前计算机程序就已经在利用对手的思考时间思考了。 : 论文上一般把这个叫ponder search。好像。 : : 10 : 9

1

(共1页)

进入Go版参与讨论

相关主题
● 谁把weiqitv上五佳瞬间棋谱给alpha做做看	● 哈比斯说没用高手期局训练啊
● 主要还是开发团队棋力太低	● 加塞不加塞倒是无所谓
● 人脑相对于人工智能的最大优势在于	● 问个围棋问题
● 我以前提到过阿法狗应该有更灵活的用时策略	● 61手和峰峰
● 阿法狗第二局最令人震惊的地方在于	● Nature重磅封面：谷歌人工智能击败欧洲围棋冠军
● 仔细想了一下，阿法狗的算法在劫争上完全没有漏洞	● 说说我眼中阿尔法的棋力
● 阿法狗下围棋离人类还差的远	● 把deepmind在弈城的棋谱大概看了一遍
● 阿发狗仍然不是不可战胜	● 第三局估计也没啥可看了

相关话题的讨论汇总
话题: 计算话题: 时间话题: 应手话题: 计算机话题: 思考

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)