由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Deepmind 的星际二挑战
相关主题
陈经:Deepmind与暴雪开源接口,人工智能挑战星际争霸到哪一步卷积这东西真神了
deepmind在星际争霸后面就是LoLCNN transfer learning 为啥这么牛逼?
Web Service怎么让多个api call share 同一个 connection ??IBM 弄出个DDL,16天缩短到7小时,很暴力
机器学习能发现拓扑不变量,对称群之类的关系么deep learning现在还是冰山一角
怎么对付老邢的验证码?hinton的胶囊本版什么评价
装个机快被搞死了请教数据存储问题
feifei li 也去google再来推广下picpac
CNN网络之后一般还要加FNN?javascript function-ask for help
相关话题的讨论汇总
话题: 星际话题: deepmind话题: ml话题: 围棋话题: 电脑
进入Programming版参与讨论
1 (共1页)
s*****V
发帖数: 21731
1
周末没事瞄了一眼Deepmind论文,主要的是跟暴雪合作搭建了一个新的机器学习平台,
和 MINST和imageNet一样。强化学习结果不理想,只有一些MINI游戏有一些收获。后面
DM尝试跟AlphaGo一样的思路,想从BattleNet的Replay里面学习出来局面评估网络跟策
略网络,值网络gle frame prediction 准确率可以到60-70%, 下一步策略预测TOP1很
低 30%多,TOP 5可以到88%,但是空间准确率很低22%。 目前这个结果肯定是不理想,
就等各方高手跟进吧。
w***g
发帖数: 5958
2
意思是星际比围棋更难? 还是成果其实已经被美军控制了.

【在 s*****V 的大作中提到】
: 周末没事瞄了一眼Deepmind论文,主要的是跟暴雪合作搭建了一个新的机器学习平台,
: 和 MINST和imageNet一样。强化学习结果不理想,只有一些MINI游戏有一些收获。后面
: DM尝试跟AlphaGo一样的思路,想从BattleNet的Replay里面学习出来局面评估网络跟策
: 略网络,值网络gle frame prediction 准确率可以到60-70%, 下一步策略预测TOP1很
: 低 30%多,TOP 5可以到88%,但是空间准确率很低22%。 目前这个结果肯定是不理想,
: 就等各方高手跟进吧。

L****8
发帖数: 3938
3
星际状态空间应该比围棋大

【在 w***g 的大作中提到】
: 意思是星际比围棋更难? 还是成果其实已经被美军控制了.
n*****3
发帖数: 1584
4
I think 星际 is not that well defined like GO.
and deepmind is London based

【在 w***g 的大作中提到】
: 意思是星际比围棋更难? 还是成果其实已经被美军控制了.
i******l
发帖数: 270
5
围棋每下一步都可以在全局来看效果
星际的目标是在随时变化的,虽然最终的目标是消灭对手。
但是最终目标在不同阶段要分解成不同子目标,并随时调整
优先级。电脑现在做一件事情,都难以知道效果是正是负。
比如电脑策略是攀科技,早早采气,被人农民溜进来瞄一眼,
目标马上就要调整了,对方可能暴兵一波流,必须要防。

【在 n*****3 的大作中提到】
: I think 星际 is not that well defined like GO.
: and deepmind is London based

h**********e
发帖数: 4328
6
星际的ai微操怎么算啊
能多线程骚扰的话很占优势的

【在 s*****V 的大作中提到】
: 周末没事瞄了一眼Deepmind论文,主要的是跟暴雪合作搭建了一个新的机器学习平台,
: 和 MINST和imageNet一样。强化学习结果不理想,只有一些MINI游戏有一些收获。后面
: DM尝试跟AlphaGo一样的思路,想从BattleNet的Replay里面学习出来局面评估网络跟策
: 略网络,值网络gle frame prediction 准确率可以到60-70%, 下一步策略预测TOP1很
: 低 30%多,TOP 5可以到88%,但是空间准确率很低22%。 目前这个结果肯定是不理想,
: 就等各方高手跟进吧。

l******n
发帖数: 9344
7
ai会被限制到与人差不多的amp,现在公布的是180
多线程对电脑其实是很难的,因为多线程就涉及多目标网络以及这些网络怎么影响最终
的局势评估,这个是现在的难点
星际是不完全信息的博弈,和围棋这种完全信息的完全不是一个难度等级的

【在 h**********e 的大作中提到】
: 星际的ai微操怎么算啊
: 能多线程骚扰的话很占优势的

g****t
发帖数: 31659
8
增强学习框架基本上就是70年代开始的预测控制。我以前老板是交大的席教授,他写了
国内第一本这方面专著,中间有一章就是用Ann.
根据我调试预测控制的经验。
假如我做这个项目,第一件事
是让人每x秒走一步,算法每一秒走一步,这样做做看
能不能赢。
从机器比人的反馈快10倍开始一步步调整算法。
谋求从x=10开始逐渐收敛到x=1。
当然,技术和技术的实现是不可分的。过去的经验不一定
和现在的实际雷同。不是说算法看着像就是一回事。
g****t
发帖数: 31659
9
电脑内部有个模型可以近似优化出一个策略,优化目标是
对未来到时间T1为止的时间窗内我的操作
对胜利有巨大的正贡献。
然后把操作序列应用于T2窗口收集反馈信息
Update模型。这个策略以前叫预测控制已经成功应用
很多年。商业软件也很多。现在改名叫增强学习...
这个T1,T2起到类似于炒股200天线,50天线交叉
方法里的200,50的作用。实际上是不确定性的表示。


: 围棋每下一步都可以在全局来看效果

: 星际的目标是在随时变化的,虽然最终的目标是消灭对手。

: 但是最终目标在不同阶段要分解成不同子目标,并随时调整

: 优先级。电脑现在做一件事情,都难以知道效果是正是负。

: 比如电脑策略是攀科技,早早采气,被人农民溜进来瞄一眼,

: 目标马上就要调整了,对方可能暴兵一波流,必须要防。



【在 i******l 的大作中提到】
: 围棋每下一步都可以在全局来看效果
: 星际的目标是在随时变化的,虽然最终的目标是消灭对手。
: 但是最终目标在不同阶段要分解成不同子目标,并随时调整
: 优先级。电脑现在做一件事情,都难以知道效果是正是负。
: 比如电脑策略是攀科技,早早采气,被人农民溜进来瞄一眼,
: 目标马上就要调整了,对方可能暴兵一波流,必须要防。

h**********e
发帖数: 4328
10
嗯看来是有限制
另外我说的“多线程骚扰”
跟计算的多线程没任何关系呵呵

【在 l******n 的大作中提到】
: ai会被限制到与人差不多的amp,现在公布的是180
: 多线程对电脑其实是很难的,因为多线程就涉及多目标网络以及这些网络怎么影响最终
: 的局势评估,这个是现在的难点
: 星际是不完全信息的博弈,和围棋这种完全信息的完全不是一个难度等级的

相关主题
装个机快被搞死了卷积这东西真神了
feifei li 也去googleCNN transfer learning 为啥这么牛逼?
CNN网络之后一般还要加FNN?IBM 弄出个DDL,16天缩短到7小时,很暴力
进入Programming版参与讨论
g*******u
发帖数: 3948
11
这个打过星际的大约能知道
暂时看不可能赢人类。
这他妈实现了真的就是人工智能了。
星际完全可以等同于实战啊
d******c
发帖数: 2407
12
过去说围棋难,主要是个组合数量大,和象棋,跳棋比。但都是规则完善的博弈,不同
棋之间没有本质差别。
星际复杂在于层次多,微操是一个层面,战术,战略又是两个层面。战略层面的问题,
恐怕围棋的策略是不行的。
星际还是和实战再差几个层次,因为规则毕竟是公司制定的,更新是按版本的。现实是
规则随时可以被参与者修改,只要你能做到。
d******c
发帖数: 2407
13
有些搞ML的人是属于无知者无畏,没经历过AI的困难时期,在ML/deep learning火的时
候才进来,就以为什么都可以做了。
比如有google summer code项目根据python代码预测结果的。
还有人脸识别预测是不是犯罪分子,是不是gay的。
还有改行的都开始要学ML的,专门立志搞自动驾驶当成一个专业的。
技术行业实际是fashion industry.
g****t
发帖数: 31659
14
星际争霸和实战差距还是很远的。战斗单元太少了。
帝国时代8个人可以有1600个战斗单元,复杂的多。可能比得上春秋时代的战争了。
很多年前我把全国冠军和帝国时代韩国比赛第四名从广东
叫到家里玩过一个多星期。

【在 g*******u 的大作中提到】
: 这个打过星际的大约能知道
: 暂时看不可能赢人类。
: 这他妈实现了真的就是人工智能了。
: 星际完全可以等同于实战啊

k***5
发帖数: 583
15
哈哈,这可是无数consultant公司目前的骗钱利器。贴个ML/Deep Learning的标签,
PPT就可以去忽悠其他大公司的funding了。

【在 d******c 的大作中提到】
: 有些搞ML的人是属于无知者无畏,没经历过AI的困难时期,在ML/deep learning火的时
: 候才进来,就以为什么都可以做了。
: 比如有google summer code项目根据python代码预测结果的。
: 还有人脸识别预测是不是犯罪分子,是不是gay的。
: 还有改行的都开始要学ML的,专门立志搞自动驾驶当成一个专业的。
: 技术行业实际是fashion industry.

g****t
发帖数: 31659
16
那是人家本身有渠道。不是ML的原因。没有ML,还可以拿别的去拿钱。

【在 k***5 的大作中提到】
: 哈哈,这可是无数consultant公司目前的骗钱利器。贴个ML/Deep Learning的标签,
: PPT就可以去忽悠其他大公司的funding了。

g*******u
发帖数: 3948
17
反正我觉得 如果电脑可以玩星际比人好。 那叫人工智能我就服了。
反正我是不信。
比如摄像头看屏幕 然后机器 进行操作。
这玩意要是可以 那就是模糊认识啊。 非常多的应用问题就解决了啊。
围棋, 之前我虽然也是怀疑,但是毕竟规则还是简单。

【在 g****t 的大作中提到】
: 星际争霸和实战差距还是很远的。战斗单元太少了。
: 帝国时代8个人可以有1600个战斗单元,复杂的多。可能比得上春秋时代的战争了。
: 很多年前我把全国冠军和帝国时代韩国比赛第四名从广东
: 叫到家里玩过一个多星期。

g*******u
发帖数: 3948
18
对啊 电脑怎么实现类似于人的 1024 xxx操作呢?

【在 h**********e 的大作中提到】
: 嗯看来是有限制
: 另外我说的“多线程骚扰”
: 跟计算的多线程没任何关系呵呵

a9
发帖数: 21638
19
这就台巴子还计算机模拟反攻大陆?

台,
后面
跟策
TOP1很
想,

【在 w***g 的大作中提到】
: 意思是星际比围棋更难? 还是成果其实已经被美军控制了.
g****t
发帖数: 31659
20
数据足够多,完全是可能的。
如果数据不够多,那么规则可能不是identifiable的。
因为 rules set1,rules set2可能产生相同的图像集。
那电脑就没办法分辨出来1,2两套规则。

【在 g*******u 的大作中提到】
: 反正我觉得 如果电脑可以玩星际比人好。 那叫人工智能我就服了。
: 反正我是不信。
: 比如摄像头看屏幕 然后机器 进行操作。
: 这玩意要是可以 那就是模糊认识啊。 非常多的应用问题就解决了啊。
: 围棋, 之前我虽然也是怀疑,但是毕竟规则还是简单。

相关主题
deep learning现在还是冰山一角再来推广下picpac
hinton的胶囊本版什么评价javascript function-ask for help
请教数据存储问题大家在linux下面用什么C++的IDE呢?
进入Programming版参与讨论
h*i
发帖数: 3446
21
当然了。围棋的棋局状态全部已知,而星际只知道部分状态,你不知道对手在干什么。
所以不是一个等级的难度。

【在 w***g 的大作中提到】
: 意思是星际比围棋更难? 还是成果其实已经被美军控制了.
s*****V
发帖数: 21731
22
APM封顶180,其实APM不是最关键的,很多操作比如开矿APM 高也没有,也就局部战斗
有点优势。

【在 h**********e 的大作中提到】
: 星际的ai微操怎么算啊
: 能多线程骚扰的话很占优势的

s*****V
发帖数: 21731
23
星级比围棋难,星际离真实世界只有一步之遥了。

【在 w***g 的大作中提到】
: 意思是星际比围棋更难? 还是成果其实已经被美军控制了.
z*********n
发帖数: 1451
24

星际难多了,最基本一点,它是即时战略,也就是两家的操作是同时进行的。很多时候
你只能用对手上一秒的状态做决定,那就会导致两人过门,都往左或者都往右,结果都
走不了的情况。这种情况在回合制游戏里根本不可能发生。
另一个方面,星际里你的信息对方是不知道的,不像围棋,你有一个上帝视角,随时直
到全局动态。
而且,星际很像真实世界的一点是,不确定性。比如你野兵营,对方在地图上随机乱找
,在2分钟前找到了,对方基本就输了,2~3分钟,大家都游戏,3分钟没发现,你就可
能挂了。这真的是纯运气。
最后,星际里有蝴蝶效应(当然不是说围棋里没有)。很多时候,你的一个微小的改变
,比如这个枪兵位置上的慢了点,就会导致全盘的不利。可以考虑下面这个例子:如果
10个A对20个B,最后B剩5个A全灭,那么10个A对19个B,就有可能A剩4个,B全灭。一点
小的失利会滚雪球被快速放大到全局。

【在 w***g 的大作中提到】
: 意思是星际比围棋更难? 还是成果其实已经被美军控制了.
z*********n
发帖数: 1451
25

这个我也看了,还下载了那些library,星际2粉丝可惜我不懂DL(作为一个CS科班,表
示基本的ML常识还是有的)
请问lz,如果我想业余时间,研究或者了解这个project相关东西(比如读懂论文),怎
么入门比较好?

【在 s*****V 的大作中提到】
: 周末没事瞄了一眼Deepmind论文,主要的是跟暴雪合作搭建了一个新的机器学习平台,
: 和 MINST和imageNet一样。强化学习结果不理想,只有一些MINI游戏有一些收获。后面
: DM尝试跟AlphaGo一样的思路,想从BattleNet的Replay里面学习出来局面评估网络跟策
: 略网络,值网络gle frame prediction 准确率可以到60-70%, 下一步策略预测TOP1很
: 低 30%多,TOP 5可以到88%,但是空间准确率很低22%。 目前这个结果肯定是不理想,
: 就等各方高手跟进吧。

z*********n
发帖数: 1451
26

暴雪开放了API,电脑不需要点鼠标。
API模仿鼠标操作(并不是直接控制单位),类似 var s = select(Rectangle); s.
Move(Point).
当然这个APM上1000也是松松的。

【在 g*******u 的大作中提到】
: 对啊 电脑怎么实现类似于人的 1024 xxx操作呢?
1 (共1页)
进入Programming版参与讨论
相关主题
javascript function-ask for help怎么对付老邢的验证码?
大家在linux下面用什么C++的IDE呢?装个机快被搞死了
准备面试一个java-based position,有什么书推荐一下?feifei li 也去google
How difficult is it to write your own sprintf ?CNN网络之后一般还要加FNN?
陈经:Deepmind与暴雪开源接口,人工智能挑战星际争霸到哪一步卷积这东西真神了
deepmind在星际争霸后面就是LoLCNN transfer learning 为啥这么牛逼?
Web Service怎么让多个api call share 同一个 connection ??IBM 弄出个DDL,16天缩短到7小时,很暴力
机器学习能发现拓扑不变量,对称群之类的关系么deep learning现在还是冰山一角
相关话题的讨论汇总
话题: 星际话题: deepmind话题: ml话题: 围棋话题: 电脑