由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 星际2人工智能已经取得一些进展
相关主题
推荐个免费的人工智能软件 Pachi王垠:AlphaGo与人工智能zz (转载)
chinese checker game我想用ehcache存一些临时数据,怎么处理多线程比较好?
【CINASSUG】【CINAOUG】SQL Server 讲座第3课- BI技术交流 ag (转载)仔细看了一下 alaphgo
OpenGL能否方便实现自定义图形的移动,擦除和分层显示?狗大师不玩围棋了 (转载)
Web Seminar host by CINAOUG at 2011/05/02 7PM EST (转载)陈经:Deepmind与暴雪开源接口,人工智能挑战星际争霸到哪一步
Re: 什么叫活活堵死 (转载)Deepmind 的星际二挑战
MCTS考试deepmind在星际争霸后面就是LoL
弱类型 server side大家看过刘慈欣的诗云没有?
相关话题的讨论汇总
话题: ai话题: 星际话题: ii话题: starcraft话题: 打败
进入Programming版参与讨论
1 (共1页)
s*****V
发帖数: 21731
1
2017年8月,deepmind跟暴雪合作推出SC2LE (StarCraft II Learning Environment),
提供了一个新的强化学习研究环境。SC2LE包括三个部分:
1. linux Starcraft II binary
2. Starcraft II api
3. pysc2,python接口,开始游戏,提取各种feature map
但是Deep当时的第一版ai很弱,连星际2最弱的内置的ai都打不过。但是1年过去,今天
没事关注了一下,发现
有不小的进展。4月份,南大的团队的分层结构的ai可以在限制条件下大概率打败7级AI
. (星际2 内置AI难度分1-10,10层, 1-7是无作弊AI。9月19号,腾讯的团队报告它们
的AI TStarBots可以在固定地图上打败10级AI,迄今为止成绩最好的星际2AI。 最新的
Berkeley Pieter Abbeel也出了一篇简略的文章,通过自学习打败5级AI. 这几个都是
分层结构,而且使用宏指令(macro action),即是把完成一个目的的几个指令group
在一起。不同的是南大是从replay里面学习的宏指令,而企鹅团队是人工手写的。
10级AI就是50%的业余人类玩家水平,感觉人工智能打败顶级玩家也不远了。
https://zhuanlan.zhihu.com/p/45044997
https://zhuanlan.zhihu.com/p/45560932
x****u
发帖数: 44466
2
人工智能早就可以打败人类了,目前难点是让电脑0知识自己玩出打败人类的办法

AI

【在 s*****V 的大作中提到】
: 2017年8月,deepmind跟暴雪合作推出SC2LE (StarCraft II Learning Environment),
: 提供了一个新的强化学习研究环境。SC2LE包括三个部分:
: 1. linux Starcraft II binary
: 2. Starcraft II api
: 3. pysc2,python接口,开始游戏,提取各种feature map
: 但是Deep当时的第一版ai很弱,连星际2最弱的内置的ai都打不过。但是1年过去,今天
: 没事关注了一下,发现
: 有不小的进展。4月份,南大的团队的分层结构的ai可以在限制条件下大概率打败7级AI
: . (星际2 内置AI难度分1-10,10层, 1-7是无作弊AI。9月19号,腾讯的团队报告它们
: 的AI TStarBots可以在固定地图上打败10级AI,迄今为止成绩最好的星际2AI。 最新的

s*****V
发帖数: 21731
3
你有出处么?据我所知到目前为止还没有

【在 x****u 的大作中提到】
: 人工智能早就可以打败人类了,目前难点是让电脑0知识自己玩出打败人类的办法
:
: AI

g*******u
发帖数: 3948
4
有本事打星际一
s*****V
发帖数: 21731
5
星际一比星际2简单吧。其实我觉得电脑打星际比下围棋容易,人类星际选手的水平估
计有6,7成都是靠操作水平,剩下的才是决策。决策本身并没有太难,至少跟围棋比起
来。对电脑来说,操作反而是可以比较容易train的,多线操作忙而不乱。比如采矿,
局部对战电脑短时间内就已经有职业水平。
5年之内,征服星际不是梦。

【在 g*******u 的大作中提到】
: 有本事打星际一
g*******u
发帖数: 3948
6
主要是围棋 规矩都是订好了的, 在规矩内干
星际 各种策略也要非常多。比如侦查反侦查。 欺骗性侦查 放大招。等等
我个人不信 5年内 可以打过顶级职业拳手

【在 s*****V 的大作中提到】
: 星际一比星际2简单吧。其实我觉得电脑打星际比下围棋容易,人类星际选手的水平估
: 计有6,7成都是靠操作水平,剩下的才是决策。决策本身并没有太难,至少跟围棋比起
: 来。对电脑来说,操作反而是可以比较容易train的,多线操作忙而不乱。比如采矿,
: 局部对战电脑短时间内就已经有职业水平。
: 5年之内,征服星际不是梦。

s*****V
发帖数: 21731
7
侦查反侦查的效力没有你想那么大,电脑完全可以形成概率性决策,就是不会完全相信
侦查的结果。DM发起向星际进军才一年,已经达到目前的效果,基本相当于MCTS之前的
围棋AI最高水平。我觉得5年没问题,deepmind很久没发星际2文章了,估计在憋大招。
上面这些做的还是比较糙的,精品还要看DM.

【在 g*******u 的大作中提到】
: 主要是围棋 规矩都是订好了的, 在规矩内干
: 星际 各种策略也要非常多。比如侦查反侦查。 欺骗性侦查 放大招。等等
: 我个人不信 5年内 可以打过顶级职业拳手

g*******u
发帖数: 3948
8
星际2不知道 1的话 之前和石头打过 好像是一点也没有悬念的那种。
我不知道你打不打星际, 这个和围棋的概率还不太一样。
比如电脑自己猜
根据现在这个状况
30% 报狗 30% 地刺 30% 正常。
你只要选错一个就完蛋了。这几种可能的发展策略是完全不同的。这时候概率决策有完
全可能是错的。 而一旦错了 可能不给你机会弥补。 不像围棋 最起码可以走满步数

恰恰星际可以不相信概率啊 概率小10% 也可以赢。
电脑占优势的是操作 和多线。 这个不知道有没有限制。 尼玛 要是要是同时 5线操作
谁也干不了啊。

【在 s*****V 的大作中提到】
: 侦查反侦查的效力没有你想那么大,电脑完全可以形成概率性决策,就是不会完全相信
: 侦查的结果。DM发起向星际进军才一年,已经达到目前的效果,基本相当于MCTS之前的
: 围棋AI最高水平。我觉得5年没问题,deepmind很久没发星际2文章了,估计在憋大招。
: 上面这些做的还是比较糙的,精品还要看DM.

w***g
发帖数: 5958
9
是的。围棋有个棋盘,程序容易写得多。
但是对应的,现在正规军resource也多。
我觉得等着看结果挺有意思。

【在 g*******u 的大作中提到】
: 主要是围棋 规矩都是订好了的, 在规矩内干
: 星际 各种策略也要非常多。比如侦查反侦查。 欺骗性侦查 放大招。等等
: 我个人不信 5年内 可以打过顶级职业拳手

P****9
发帖数: 177
10
打了4年星际1,发现高手间对决侦查和骚扰太重要了。电脑的最大优势是多线操作。

【在 s*****V 的大作中提到】
: 侦查反侦查的效力没有你想那么大,电脑完全可以形成概率性决策,就是不会完全相信
: 侦查的结果。DM发起向星际进军才一年,已经达到目前的效果,基本相当于MCTS之前的
: 围棋AI最高水平。我觉得5年没问题,deepmind很久没发星际2文章了,估计在憋大招。
: 上面这些做的还是比较糙的,精品还要看DM.

相关主题
MCTS考试我想用ehcache存一些临时数据,怎么处理多线程比较好?
弱类型 server side仔细看了一下 alaphgo
王垠:AlphaGo与人工智能zz (转载)狗大师不玩围棋了 (转载)
进入Programming版参与讨论
w***g
发帖数: 5958
11
估计以后的军事发展方向就是拼AI了。

【在 P****9 的大作中提到】
: 打了4年星际1,发现高手间对决侦查和骚扰太重要了。电脑的最大优势是多线操作。
s*****V
发帖数: 21731
12
我星际1打过也经常看高手对决,高手对决都是打演练好的套路,什么双兵营开局,5农
民爆狗开局,玩极致的电脑根本不怕。而且这还是在限制电脑操作速度的前提下,不限
制操作速度电脑的微操人类更不是对手。按照游戏规则,操作速度是不应该限制的。如
果是纯粹概率,那电脑至少有一定的概率赢。

【在 g*******u 的大作中提到】
: 星际2不知道 1的话 之前和石头打过 好像是一点也没有悬念的那种。
: 我不知道你打不打星际, 这个和围棋的概率还不太一样。
: 比如电脑自己猜
: 根据现在这个状况
: 30% 报狗 30% 地刺 30% 正常。
: 你只要选错一个就完蛋了。这几种可能的发展策略是完全不同的。这时候概率决策有完
: 全可能是错的。 而一旦错了 可能不给你机会弥补。 不像围棋 最起码可以走满步数
: 。
: 恰恰星际可以不相信概率啊 概率小10% 也可以赢。
: 电脑占优势的是操作 和多线。 这个不知道有没有限制。 尼玛 要是要是同时 5线操作

s*****V
发帖数: 21731
13
通过分层决策,已经macro actions组合,可以大量减少决策空间。就好比人大脑只要
指挥喝水。下面神经拉动胳膊移动这个不用大脑操心。像企鹅的论文里面,他人工组合
了163个macro actions,每一个包含几个操作序列。 现在这些方案人工的痕迹还是很
重,现在就指望有一个通用的优化架构。

【在 w***g 的大作中提到】
: 是的。围棋有个棋盘,程序容易写得多。
: 但是对应的,现在正规军resource也多。
: 我觉得等着看结果挺有意思。

g*******u
发帖数: 3948
14
要是电脑也能出一些围棋看似特别傻 实际是特别高的 招式 出来的话 还是很有意思
但是你第一段对星际1的描述 感觉 你不太会打 我感觉。

【在 s*****V 的大作中提到】
: 我星际1打过也经常看高手对决,高手对决都是打演练好的套路,什么双兵营开局,5农
: 民爆狗开局,玩极致的电脑根本不怕。而且这还是在限制电脑操作速度的前提下,不限
: 制操作速度电脑的微操人类更不是对手。按照游戏规则,操作速度是不应该限制的。如
: 果是纯粹概率,那电脑至少有一定的概率赢。

w***g
发帖数: 5958
15
多谢解释!这么说来生物神经系统真是很牛。
目前多层CNN模仿了视觉中枢。你说的分层决策很明显跟
CNN在人脑的机制是一样的。

【在 s*****V 的大作中提到】
: 通过分层决策,已经macro actions组合,可以大量减少决策空间。就好比人大脑只要
: 指挥喝水。下面神经拉动胳膊移动这个不用大脑操心。像企鹅的论文里面,他人工组合
: 了163个macro actions,每一个包含几个操作序列。 现在这些方案人工的痕迹还是很
: 重,现在就指望有一个通用的优化架构。

c******n
发帖数: 16666
16
然 这些套路都是入门级别的 之后侦察反侦察 骚扰反骚扰 针对性攀科技树才是重点
话说AI这些真搞定了 那我们不是主动插管享受人生就 被动插管当电池了

【在 g*******u 的大作中提到】
: 要是电脑也能出一些围棋看似特别傻 实际是特别高的 招式 出来的话 还是很有意思
: 但是你第一段对星际1的描述 感觉 你不太会打 我感觉。

w*****r
发帖数: 197
17
最近听到个新词,explainable AI


: 估计以后的军事发展方向就是拼AI了。



【在 w***g 的大作中提到】
: 多谢解释!这么说来生物神经系统真是很牛。
: 目前多层CNN模仿了视觉中枢。你说的分层决策很明显跟
: CNN在人脑的机制是一样的。

1 (共1页)
进入Programming版参与讨论
相关主题
请大家推荐一个棋牌类人工智能programming的教材 (转载)Web Seminar host by CINAOUG at 2011/05/02 7PM EST (转载)
Lisp gone....Re: 什么叫活活堵死 (转载)
FP被彻底搞臭,始于80年代MCTS考试
请教图像识别的人工智能算法 (转载)弱类型 server side
推荐个免费的人工智能软件 Pachi王垠:AlphaGo与人工智能zz (转载)
chinese checker game我想用ehcache存一些临时数据,怎么处理多线程比较好?
【CINASSUG】【CINAOUG】SQL Server 讲座第3课- BI技术交流 ag (转载)仔细看了一下 alaphgo
OpenGL能否方便实现自定义图形的移动,擦除和分层显示?狗大师不玩围棋了 (转载)
相关话题的讨论汇总
话题: ai话题: 星际话题: ii话题: starcraft话题: 打败