星际2人工智能已经取得一些进展 - Programming版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 星际2人工智能已经取得一些进展

相关主题
● 推荐个免费的人工智能软件 Pachi	● 王垠：AlphaGo与人工智能zz (转载)
● chinese checker game	● 我想用ehcache存一些临时数据，怎么处理多线程比较好？
● 【CINASSUG】【CINAOUG】SQL Server 讲座第3课- BI技术交流 ag (转载)	● 仔细看了一下 alaphgo
● OpenGL能否方便实现自定义图形的移动,擦除和分层显示?	● 狗大师不玩围棋了 (转载)
● Web Seminar host by CINAOUG at 2011/05/02 7PM EST (转载)	● 陈经：Deepmind与暴雪开源接口，人工智能挑战星际争霸到哪一步
● Re: 什么叫活活堵死 (转载)	● Deepmind 的星际二挑战
● MCTS考试	● deepmind在星际争霸后面就是LoL
● 弱类型 server side	● 大家看过刘慈欣的诗云没有？

相关话题的讨论汇总
话题: ai话题: 星际话题: ii话题: starcraft话题: 打败

进入Programming版参与讨论

(共1页)

s*****V
发帖数: 21731

2017年8月，deepmind跟暴雪合作推出SC2LE (StarCraft II Learning Environment)，
提供了一个新的强化学习研究环境。SC2LE包括三个部分：
1. linux Starcraft II binary
2. Starcraft II api
3. pysc2，python接口，开始游戏，提取各种feature map
但是Deep当时的第一版ai很弱，连星际2最弱的内置的ai都打不过。但是1年过去，今天
没事关注了一下，发现
有不小的进展。4月份，南大的团队的分层结构的ai可以在限制条件下大概率打败7级AI
. (星际2 内置AI难度分1-10，10层， 1-7是无作弊AI。9月19号，腾讯的团队报告它们
的AI TStarBots可以在固定地图上打败10级AI，迄今为止成绩最好的星际2AI。最新的
Berkeley Pieter Abbeel也出了一篇简略的文章，通过自学习打败5级AI. 这几个都是
分层结构，而且使用宏指令（macro action），即是把完成一个目的的几个指令group
在一起。不同的是南大是从replay里面学习的宏指令，而企鹅团队是人工手写的。
10级AI就是50%的业余人类玩家水平，感觉人工智能打败顶级玩家也不远了。
https://zhuanlan.zhihu.com/p/45044997
https://zhuanlan.zhihu.com/p/45560932

x****u
发帖数: 44466

人工智能早就可以打败人类了，目前难点是让电脑0知识自己玩出打败人类的办法

AI

【在 s*****V 的大作中提到】

: 2017年8月，deepmind跟暴雪合作推出SC2LE (StarCraft II Learning Environment)，
: 提供了一个新的强化学习研究环境。SC2LE包括三个部分：
: 1. linux Starcraft II binary
: 2. Starcraft II api
: 3. pysc2，python接口，开始游戏，提取各种feature map
: 但是Deep当时的第一版ai很弱，连星际2最弱的内置的ai都打不过。但是1年过去，今天
: 没事关注了一下，发现
: 有不小的进展。4月份，南大的团队的分层结构的ai可以在限制条件下大概率打败7级AI
: . (星际2 内置AI难度分1-10，10层， 1-7是无作弊AI。9月19号，腾讯的团队报告它们
: 的AI TStarBots可以在固定地图上打败10级AI，迄今为止成绩最好的星际2AI。最新的

s*****V
发帖数: 21731

你有出处么？据我所知到目前为止还没有

【在 x****u 的大作中提到】

: 人工智能早就可以打败人类了，目前难点是让电脑0知识自己玩出打败人类的办法
:
: AI

g*******u
发帖数: 3948

有本事打星际一

s*****V
发帖数: 21731

星际一比星际2简单吧。其实我觉得电脑打星际比下围棋容易，人类星际选手的水平估
计有6，7成都是靠操作水平，剩下的才是决策。决策本身并没有太难，至少跟围棋比起
来。对电脑来说，操作反而是可以比较容易train的，多线操作忙而不乱。比如采矿，
局部对战电脑短时间内就已经有职业水平。
5年之内，征服星际不是梦。

【在 g*******u 的大作中提到】

: 有本事打星际一

g*******u
发帖数: 3948

主要是围棋规矩都是订好了的，在规矩内干
星际各种策略也要非常多。比如侦查反侦查。欺骗性侦查放大招。等等
我个人不信 5年内可以打过顶级职业拳手

【在 s*****V 的大作中提到】

: 星际一比星际2简单吧。其实我觉得电脑打星际比下围棋容易，人类星际选手的水平估
: 计有6，7成都是靠操作水平，剩下的才是决策。决策本身并没有太难，至少跟围棋比起
: 来。对电脑来说，操作反而是可以比较容易train的，多线操作忙而不乱。比如采矿，
: 局部对战电脑短时间内就已经有职业水平。
: 5年之内，征服星际不是梦。

s*****V
发帖数: 21731

侦查反侦查的效力没有你想那么大，电脑完全可以形成概率性决策，就是不会完全相信
侦查的结果。DM发起向星际进军才一年，已经达到目前的效果，基本相当于MCTS之前的
围棋AI最高水平。我觉得5年没问题，deepmind很久没发星际2文章了，估计在憋大招。
上面这些做的还是比较糙的，精品还要看DM.

【在 g*******u 的大作中提到】

: 主要是围棋规矩都是订好了的，在规矩内干
: 星际各种策略也要非常多。比如侦查反侦查。欺骗性侦查放大招。等等
: 我个人不信 5年内可以打过顶级职业拳手

g*******u
发帖数: 3948

星际2不知道 1的话之前和石头打过好像是一点也没有悬念的那种。
我不知道你打不打星际，这个和围棋的概率还不太一样。
比如电脑自己猜
根据现在这个状况
30% 报狗 30% 地刺 30% 正常。
你只要选错一个就完蛋了。这几种可能的发展策略是完全不同的。这时候概率决策有完
全可能是错的。而一旦错了可能不给你机会弥补。不像围棋最起码可以走满步数
。
恰恰星际可以不相信概率啊概率小10% 也可以赢。
电脑占优势的是操作和多线。这个不知道有没有限制。尼玛要是要是同时 5线操作
谁也干不了啊。

【在 s*****V 的大作中提到】

: 侦查反侦查的效力没有你想那么大，电脑完全可以形成概率性决策，就是不会完全相信
: 侦查的结果。DM发起向星际进军才一年，已经达到目前的效果，基本相当于MCTS之前的
: 围棋AI最高水平。我觉得5年没问题，deepmind很久没发星际2文章了，估计在憋大招。
: 上面这些做的还是比较糙的，精品还要看DM.

w***g
发帖数: 5958

是的。围棋有个棋盘，程序容易写得多。
但是对应的，现在正规军resource也多。
我觉得等着看结果挺有意思。

【在 g*******u 的大作中提到】

P****9
发帖数: 177

打了4年星际1，发现高手间对决侦查和骚扰太重要了。电脑的最大优势是多线操作。

【在 s*****V 的大作中提到】

相关主题
● MCTS考试	● 我想用ehcache存一些临时数据，怎么处理多线程比较好？
● 弱类型 server side	● 仔细看了一下 alaphgo
● 王垠：AlphaGo与人工智能zz (转载)	● 狗大师不玩围棋了 (转载)
进入Programming版参与讨论

w***g
发帖数: 5958

估计以后的军事发展方向就是拼AI了。

【在 P****9 的大作中提到】

: 打了4年星际1，发现高手间对决侦查和骚扰太重要了。电脑的最大优势是多线操作。

s*****V
发帖数: 21731

我星际1打过也经常看高手对决，高手对决都是打演练好的套路，什么双兵营开局，5农
民爆狗开局，玩极致的电脑根本不怕。而且这还是在限制电脑操作速度的前提下，不限
制操作速度电脑的微操人类更不是对手。按照游戏规则，操作速度是不应该限制的。如
果是纯粹概率，那电脑至少有一定的概率赢。

【在 g*******u 的大作中提到】

: 星际2不知道 1的话之前和石头打过好像是一点也没有悬念的那种。
: 我不知道你打不打星际，这个和围棋的概率还不太一样。
: 比如电脑自己猜
: 根据现在这个状况
: 30% 报狗 30% 地刺 30% 正常。
: 你只要选错一个就完蛋了。这几种可能的发展策略是完全不同的。这时候概率决策有完
: 全可能是错的。而一旦错了可能不给你机会弥补。不像围棋最起码可以走满步数
: 。
: 恰恰星际可以不相信概率啊概率小10% 也可以赢。
: 电脑占优势的是操作和多线。这个不知道有没有限制。尼玛要是要是同时 5线操作

s*****V
发帖数: 21731

通过分层决策，已经macro actions组合，可以大量减少决策空间。就好比人大脑只要
指挥喝水。下面神经拉动胳膊移动这个不用大脑操心。像企鹅的论文里面，他人工组合
了163个macro actions，每一个包含几个操作序列。现在这些方案人工的痕迹还是很
重，现在就指望有一个通用的优化架构。

【在 w***g 的大作中提到】

: 是的。围棋有个棋盘，程序容易写得多。
: 但是对应的，现在正规军resource也多。
: 我觉得等着看结果挺有意思。

g*******u
发帖数: 3948

要是电脑也能出一些围棋看似特别傻实际是特别高的招式出来的话还是很有意思
但是你第一段对星际1的描述感觉你不太会打我感觉。

【在 s*****V 的大作中提到】

: 我星际1打过也经常看高手对决，高手对决都是打演练好的套路，什么双兵营开局，5农
: 民爆狗开局，玩极致的电脑根本不怕。而且这还是在限制电脑操作速度的前提下，不限
: 制操作速度电脑的微操人类更不是对手。按照游戏规则，操作速度是不应该限制的。如
: 果是纯粹概率，那电脑至少有一定的概率赢。

w***g
发帖数: 5958

多谢解释！这么说来生物神经系统真是很牛。
目前多层CNN模仿了视觉中枢。你说的分层决策很明显跟
CNN在人脑的机制是一样的。

【在 s*****V 的大作中提到】

: 通过分层决策，已经macro actions组合，可以大量减少决策空间。就好比人大脑只要
: 指挥喝水。下面神经拉动胳膊移动这个不用大脑操心。像企鹅的论文里面，他人工组合
: 了163个macro actions，每一个包含几个操作序列。现在这些方案人工的痕迹还是很
: 重，现在就指望有一个通用的优化架构。

c******n
发帖数: 16666

然这些套路都是入门级别的之后侦察反侦察骚扰反骚扰针对性攀科技树才是重点
话说AI这些真搞定了那我们不是主动插管享受人生就被动插管当电池了

【在 g*******u 的大作中提到】

: 要是电脑也能出一些围棋看似特别傻实际是特别高的招式出来的话还是很有意思
: 但是你第一段对星际1的描述感觉你不太会打我感觉。

w*****r
发帖数: 197

最近听到个新词，explainable AI

: 估计以后的军事发展方向就是拼AI了。

【在 w***g 的大作中提到】

: 多谢解释！这么说来生物神经系统真是很牛。
: 目前多层CNN模仿了视觉中枢。你说的分层决策很明显跟
: CNN在人脑的机制是一样的。

(共1页)

进入Programming版参与讨论

相关主题
● 请大家推荐一个棋牌类人工智能programming的教材 (转载)	● Web Seminar host by CINAOUG at 2011/05/02 7PM EST (转载)
● Lisp gone....	● Re: 什么叫活活堵死 (转载)
● FP被彻底搞臭，始于80年代	● MCTS考试
● 请教图像识别的人工智能算法 (转载)	● 弱类型 server side
● 推荐个免费的人工智能软件 Pachi	● 王垠：AlphaGo与人工智能zz (转载)
● chinese checker game	● 我想用ehcache存一些临时数据，怎么处理多线程比较好？
● 【CINASSUG】【CINAOUG】SQL Server 讲座第3课- BI技术交流 ag (转载)	● 仔细看了一下 alaphgo
● OpenGL能否方便实现自定义图形的移动,擦除和分层显示?	● 狗大师不玩围棋了 (转载)

相关话题的讨论汇总
话题: ai话题: 星际话题: ii话题: starcraft话题: 打败

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天