s*****V 发帖数: 21731 | 1 2017年8月,deepmind跟暴雪合作推出SC2LE (StarCraft II Learning Environment),
提供了一个新的强化学习研究环境。SC2LE包括三个部分:
1. linux Starcraft II binary
2. Starcraft II api
3. pysc2,python接口,开始游戏,提取各种feature map
但是Deep当时的第一版ai很弱,连星际2最弱的内置的ai都打不过。但是1年过去,今天
没事关注了一下,发现
有不小的进展。4月份,南大的团队的分层结构的ai可以在限制条件下大概率打败7级AI
. (星际2 内置AI难度分1-10,10层, 1-7是无作弊AI。9月19号,腾讯的团队报告它们
的AI TStarBots可以在固定地图上打败10级AI,迄今为止成绩最好的星际2AI。 最新的
Berkeley Pieter Abbeel也出了一篇简略的文章,通过自学习打败5级AI. 这几个都是
分层结构,而且使用宏指令(macro action),即是把完成一个目的的几个指令group
在一起。不同的是南大是从replay里面学习的宏指令,而企鹅团队是人工手写的。
10级AI就是50%的业余人类玩家水平,感觉人工智能打败顶级玩家也不远了。
https://zhuanlan.zhihu.com/p/45044997
https://zhuanlan.zhihu.com/p/45560932 |
x****u 发帖数: 44466 | 2 人工智能早就可以打败人类了,目前难点是让电脑0知识自己玩出打败人类的办法
AI
【在 s*****V 的大作中提到】 : 2017年8月,deepmind跟暴雪合作推出SC2LE (StarCraft II Learning Environment), : 提供了一个新的强化学习研究环境。SC2LE包括三个部分: : 1. linux Starcraft II binary : 2. Starcraft II api : 3. pysc2,python接口,开始游戏,提取各种feature map : 但是Deep当时的第一版ai很弱,连星际2最弱的内置的ai都打不过。但是1年过去,今天 : 没事关注了一下,发现 : 有不小的进展。4月份,南大的团队的分层结构的ai可以在限制条件下大概率打败7级AI : . (星际2 内置AI难度分1-10,10层, 1-7是无作弊AI。9月19号,腾讯的团队报告它们 : 的AI TStarBots可以在固定地图上打败10级AI,迄今为止成绩最好的星际2AI。 最新的
|
s*****V 发帖数: 21731 | 3 你有出处么?据我所知到目前为止还没有
【在 x****u 的大作中提到】 : 人工智能早就可以打败人类了,目前难点是让电脑0知识自己玩出打败人类的办法 : : AI
|
g*******u 发帖数: 3948 | |
s*****V 发帖数: 21731 | 5 星际一比星际2简单吧。其实我觉得电脑打星际比下围棋容易,人类星际选手的水平估
计有6,7成都是靠操作水平,剩下的才是决策。决策本身并没有太难,至少跟围棋比起
来。对电脑来说,操作反而是可以比较容易train的,多线操作忙而不乱。比如采矿,
局部对战电脑短时间内就已经有职业水平。
5年之内,征服星际不是梦。
【在 g*******u 的大作中提到】 : 有本事打星际一
|
g*******u 发帖数: 3948 | 6 主要是围棋 规矩都是订好了的, 在规矩内干
星际 各种策略也要非常多。比如侦查反侦查。 欺骗性侦查 放大招。等等
我个人不信 5年内 可以打过顶级职业拳手
【在 s*****V 的大作中提到】 : 星际一比星际2简单吧。其实我觉得电脑打星际比下围棋容易,人类星际选手的水平估 : 计有6,7成都是靠操作水平,剩下的才是决策。决策本身并没有太难,至少跟围棋比起 : 来。对电脑来说,操作反而是可以比较容易train的,多线操作忙而不乱。比如采矿, : 局部对战电脑短时间内就已经有职业水平。 : 5年之内,征服星际不是梦。
|
s*****V 发帖数: 21731 | 7 侦查反侦查的效力没有你想那么大,电脑完全可以形成概率性决策,就是不会完全相信
侦查的结果。DM发起向星际进军才一年,已经达到目前的效果,基本相当于MCTS之前的
围棋AI最高水平。我觉得5年没问题,deepmind很久没发星际2文章了,估计在憋大招。
上面这些做的还是比较糙的,精品还要看DM.
【在 g*******u 的大作中提到】 : 主要是围棋 规矩都是订好了的, 在规矩内干 : 星际 各种策略也要非常多。比如侦查反侦查。 欺骗性侦查 放大招。等等 : 我个人不信 5年内 可以打过顶级职业拳手
|
g*******u 发帖数: 3948 | 8 星际2不知道 1的话 之前和石头打过 好像是一点也没有悬念的那种。
我不知道你打不打星际, 这个和围棋的概率还不太一样。
比如电脑自己猜
根据现在这个状况
30% 报狗 30% 地刺 30% 正常。
你只要选错一个就完蛋了。这几种可能的发展策略是完全不同的。这时候概率决策有完
全可能是错的。 而一旦错了 可能不给你机会弥补。 不像围棋 最起码可以走满步数
。
恰恰星际可以不相信概率啊 概率小10% 也可以赢。
电脑占优势的是操作 和多线。 这个不知道有没有限制。 尼玛 要是要是同时 5线操作
谁也干不了啊。
【在 s*****V 的大作中提到】 : 侦查反侦查的效力没有你想那么大,电脑完全可以形成概率性决策,就是不会完全相信 : 侦查的结果。DM发起向星际进军才一年,已经达到目前的效果,基本相当于MCTS之前的 : 围棋AI最高水平。我觉得5年没问题,deepmind很久没发星际2文章了,估计在憋大招。 : 上面这些做的还是比较糙的,精品还要看DM.
|
w***g 发帖数: 5958 | 9 是的。围棋有个棋盘,程序容易写得多。
但是对应的,现在正规军resource也多。
我觉得等着看结果挺有意思。
【在 g*******u 的大作中提到】 : 主要是围棋 规矩都是订好了的, 在规矩内干 : 星际 各种策略也要非常多。比如侦查反侦查。 欺骗性侦查 放大招。等等 : 我个人不信 5年内 可以打过顶级职业拳手
|
P****9 发帖数: 177 | 10 打了4年星际1,发现高手间对决侦查和骚扰太重要了。电脑的最大优势是多线操作。
【在 s*****V 的大作中提到】 : 侦查反侦查的效力没有你想那么大,电脑完全可以形成概率性决策,就是不会完全相信 : 侦查的结果。DM发起向星际进军才一年,已经达到目前的效果,基本相当于MCTS之前的 : 围棋AI最高水平。我觉得5年没问题,deepmind很久没发星际2文章了,估计在憋大招。 : 上面这些做的还是比较糙的,精品还要看DM.
|
|
|
w***g 发帖数: 5958 | 11 估计以后的军事发展方向就是拼AI了。
【在 P****9 的大作中提到】 : 打了4年星际1,发现高手间对决侦查和骚扰太重要了。电脑的最大优势是多线操作。
|
s*****V 发帖数: 21731 | 12 我星际1打过也经常看高手对决,高手对决都是打演练好的套路,什么双兵营开局,5农
民爆狗开局,玩极致的电脑根本不怕。而且这还是在限制电脑操作速度的前提下,不限
制操作速度电脑的微操人类更不是对手。按照游戏规则,操作速度是不应该限制的。如
果是纯粹概率,那电脑至少有一定的概率赢。
【在 g*******u 的大作中提到】 : 星际2不知道 1的话 之前和石头打过 好像是一点也没有悬念的那种。 : 我不知道你打不打星际, 这个和围棋的概率还不太一样。 : 比如电脑自己猜 : 根据现在这个状况 : 30% 报狗 30% 地刺 30% 正常。 : 你只要选错一个就完蛋了。这几种可能的发展策略是完全不同的。这时候概率决策有完 : 全可能是错的。 而一旦错了 可能不给你机会弥补。 不像围棋 最起码可以走满步数 : 。 : 恰恰星际可以不相信概率啊 概率小10% 也可以赢。 : 电脑占优势的是操作 和多线。 这个不知道有没有限制。 尼玛 要是要是同时 5线操作
|
s*****V 发帖数: 21731 | 13 通过分层决策,已经macro actions组合,可以大量减少决策空间。就好比人大脑只要
指挥喝水。下面神经拉动胳膊移动这个不用大脑操心。像企鹅的论文里面,他人工组合
了163个macro actions,每一个包含几个操作序列。 现在这些方案人工的痕迹还是很
重,现在就指望有一个通用的优化架构。
【在 w***g 的大作中提到】 : 是的。围棋有个棋盘,程序容易写得多。 : 但是对应的,现在正规军resource也多。 : 我觉得等着看结果挺有意思。
|
g*******u 发帖数: 3948 | 14 要是电脑也能出一些围棋看似特别傻 实际是特别高的 招式 出来的话 还是很有意思
但是你第一段对星际1的描述 感觉 你不太会打 我感觉。
【在 s*****V 的大作中提到】 : 我星际1打过也经常看高手对决,高手对决都是打演练好的套路,什么双兵营开局,5农 : 民爆狗开局,玩极致的电脑根本不怕。而且这还是在限制电脑操作速度的前提下,不限 : 制操作速度电脑的微操人类更不是对手。按照游戏规则,操作速度是不应该限制的。如 : 果是纯粹概率,那电脑至少有一定的概率赢。
|
w***g 发帖数: 5958 | 15 多谢解释!这么说来生物神经系统真是很牛。
目前多层CNN模仿了视觉中枢。你说的分层决策很明显跟
CNN在人脑的机制是一样的。
【在 s*****V 的大作中提到】 : 通过分层决策,已经macro actions组合,可以大量减少决策空间。就好比人大脑只要 : 指挥喝水。下面神经拉动胳膊移动这个不用大脑操心。像企鹅的论文里面,他人工组合 : 了163个macro actions,每一个包含几个操作序列。 现在这些方案人工的痕迹还是很 : 重,现在就指望有一个通用的优化架构。
|
c******n 发帖数: 16666 | 16 然 这些套路都是入门级别的 之后侦察反侦察 骚扰反骚扰 针对性攀科技树才是重点
话说AI这些真搞定了 那我们不是主动插管享受人生就 被动插管当电池了
【在 g*******u 的大作中提到】 : 要是电脑也能出一些围棋看似特别傻 实际是特别高的 招式 出来的话 还是很有意思 : 但是你第一段对星际1的描述 感觉 你不太会打 我感觉。
|
w*****r 发帖数: 197 | 17 最近听到个新词,explainable AI
: 估计以后的军事发展方向就是拼AI了。
【在 w***g 的大作中提到】 : 多谢解释!这么说来生物神经系统真是很牛。 : 目前多层CNN模仿了视觉中枢。你说的分层决策很明显跟 : CNN在人脑的机制是一样的。
|