由买买提看人间百态

topics

全部话题 - 话题: 蒙特卡罗
首页 上页 1 2 3 4 5 6 7 8 9 下页 末页 (共9页)
g*****n
发帖数: 420
1
darkforest那个围棋程序说处理不好打劫和模仿棋,应该是有这个问题的,darkforest
也是用的神经网络+蒙特卡罗
g*****n
发帖数: 420
2
darkforest那个围棋程序说处理不好打劫和模仿棋,应该是有这个问题的,darkforest
也是用的神经网络+蒙特卡罗
D*******r
发帖数: 2323
3
来自主题: Go版 - 打劫就是拼计算量
主要是这个找劫财没法用policy network和value network去选点,它得到全盘任何一
个非禁着点去计算是否是劫财,而蒙特卡罗算法是会漏掉很多劫材的。除非得单为打劫
写一个module来处理打劫。
L********d
发帖数: 3820
4
来自主题: Go版 - 现在最爽的是黄aja
蒙特卡罗tree search是他的想法,DNN应该不是
D*******r
发帖数: 2323
5
来自主题: Go版 - 第三局估计也没啥可看了
他跟我说的根本就是两个问题,我在说阿狗的快速摆棋形势判断算法,他在说蒙特卡罗
存储计算分支要多少存储空间,这根本就是两码事。在阿狗的distributed system上,
这根本就是在两个不同的机子上做的。
o***8
发帖数: 46
6
什么热点,人家论文已经说得很清楚了, policy网是根据当前局面对每个合法落子位置
都做出评估,然后选若干点用蒙特卡罗树搜索往下算胜率。无论你怎么下,对这个过程
本身没有影响,根本谈不上什么扩大热点数。
s***y
发帖数: 357
7
来自主题: Go版 - 五路尖冲
其实就是一些似是而非的棋。大概就是把棋牌上各个差不多看上去像围棋形状的点跳出
来试算。 所以alpha go 不懂什么几路肩冲,要是你棋子放到5路,他就算6路肩冲,反
正他觉得肩冲是棋就算呗。其实这个棋可能就是算最后就是个第二个最好的选点胜率稍
微好那么一点,比如 1.这手五路肩冲51%,2.上面扳50.8%, 3.下面打入50.6%.等等
然后各种棋手就惊了,好像这个五路肩冲是个多大的妙手似的,李师师看上去都傻了,
以为有诈。想了半天走了一个什么贴。其实也不见得有什么好的。
我估计要是同样的局面,再让alpha go的蒙特卡罗算一次也许就走别的了。
关键是,有些人居然还要向机器学习,这太搞笑了,你人能一步算几十个点么,这怎么
学?人的选点建立在更深远的逻辑上,虽然不一定选出最好的,但是在最好的前几手没
问题。
s***y
发帖数: 357
8
来自主题: Go版 - 五路尖冲
其实就是一些似是而非的棋。大概就是把棋牌上各个差不多看上去像围棋形状的点跳出
来试算。 所以alpha go 不懂什么几路肩冲,要是你棋子放到5路,他就算6路肩冲,反
正他觉得肩冲是棋就算呗。其实这个棋可能就是算最后就是个第二个最好的选点胜率稍
微好那么一点,比如 1.这手五路肩冲51%,2.上面扳50.8%, 3.下面打入50.6%.等等
然后各种棋手就惊了,好像这个五路肩冲是个多大的妙手似的,李师师看上去都傻了,
以为有诈。想了半天走了一个什么贴。其实也不见得有什么好的。
我估计要是同样的局面,再让alpha go的蒙特卡罗算一次也许就走别的了。
关键是,有些人居然还要向机器学习,这太搞笑了,你人能一步算几十个点么,这怎么
学?人的选点建立在更深远的逻辑上,虽然不一定选出最好的,但是在最好的前几手没
问题。
f******i
发帖数: 485
9
来自主题: Go版 - 五路尖冲
要不是狗下的我看有几人会说这是妙手
更像蒙特卡罗搞出的野点
r******i
发帖数: 1445
10
80%的胜率是蒙特卡罗法的结果,意思相当于如果两个业余选手从此处下100盘,估计有
80盘本方能赢。
像大多数棋类程序一样,狗狗估计是不做对手的profiling。搜索树靠policy神经网络
生成后,搜索的算法应该仍然是min-max法。这种方法总是假设对方是自己,然后考虑
对方会有什么应手。
t******l
发帖数: 10908
11
个人觉得属实。胜率是对数学统计概率模型而言,所以应该是该点开始是对狗咬狗而言
的概率,或者狗模咬狗模的估计。人不容易建立数学模型,估计不会费事估计对人的概
率。

:80%的胜率是蒙特卡罗法的结果,意思相当于如果两个业余选手从此处下100盘,估计
有80盘本方能赢。
r******i
发帖数: 1445
12
80%的胜率是蒙特卡罗法的结果,意思相当于如果两个业余选手从此处下100盘,估计有
80盘本方能赢。
像大多数棋类程序一样,狗狗估计是不做对手的profiling。搜索树靠policy神经网络
生成后,搜索的算法应该仍然是min-max法。这种方法总是假设对方是自己,然后考虑
对方会有什么应手。
t******l
发帖数: 10908
13
个人觉得属实。胜率是对数学统计概率模型而言,所以应该是该点开始是对狗咬狗而言
的概率,或者狗模咬狗模的估计。人不容易建立数学模型,估计不会费事估计对人的概
率。

:80%的胜率是蒙特卡罗法的结果,意思相当于如果两个业余选手从此处下100盘,估计
有80盘本方能赢。
p*********d
发帖数: 524
14
算法在强大的运算能力面前或并不复杂
遗传 退火 蚁群 蒙特卡罗 本质都差不多
s*****t
发帖数: 1661
15
不太懂机器学习。 但是对于复杂函数,蒙特卡罗算法虽然最后都收敛,但是到达手链
状态之前需要的烧入步数,相差非常大的。。。
股沟这么搞,应该是想测试他们算法对于初始值的依赖程度的高低吧。。。说没有依赖
,那数学上是不成立的。。。
D*******r
发帖数: 2323
16
别扯了,没有神经网络靠蒙特卡罗搜索的围棋软件出来已经有十多年了,最好的今年一
月被连笑打到让六子。
围棋盘上下一手的可选点有上百个,上百个点下面又有上百个分支,哪些需要计算哪些
根本不用考虑,你告诉我蛮力计算怎么解决?
D*******r
发帖数: 2323
17
杀大龙有一些其实计算未必复杂,但是需要手数很多,而机器是没法通过棋形判断死活
的,它必须一直摆到对方没气时,才能确认能杀棋。
但是蒙特卡罗搜索不能一直往深处搜索,那样计算量太大。于是假设一条大龙需要30手
棋才能收完气杀死,但是阿法狗算了25手,对方大龙还没死,于是它就误以为大龙杀不
死,于是放弃那条搜索路线。
这么多盘棋,阿法狗虽然力量强大,但是却从不杀大龙,可能就是这个原因。
D*******r
发帖数: 2323
18
对呀,问题就在这里,杀大龙的那条枝因为进行了20步评分不高(因为龙没死),所以
那条枝就被剪了,去搜索别的评分高的枝了。
我们都知道,杀龙而杀不死最损自己的空,所以杀龙是蒙特卡罗搜索最容易被剪掉的枝。
m*****n
发帖数: 3575
m*****n
发帖数: 3575
l****z
发帖数: 29846
21
monte carlo方法好像早都有的吧. 很多其他围棋软件也用了这个方法的.
Alphago不是依靠monte carlo才赢的吧. 是另外一个方法才能大量精简了二叉树, 所以
速度才快很多.
l*****i
发帖数: 20533
22
七拼八凑,不知所云。
A*******e
发帖数: 2419
23
比如在某一步,百万分支里只有一条输棋路径,那胜率很高,但对手恰恰选了这一条
A*******e
发帖数: 2419
24
O**l
发帖数: 12923
25
如果没有bias simulation足够就不会 对手胜率越高mini层的simulaiton次数越多
a****t
发帖数: 7049
26
如果有这种棋,人自己也发现不了
s*****V
发帖数: 21731
27
怎么不会,最后的simulation是不考虑岔路的模拟对局,本身结果就不一定可靠
O**l
发帖数: 12923
28
谁他妈跟你说不可靠的
UCB是可以数学上证明converge的
你他妈当MCT是monte carlo啊
A*******e
发帖数: 2419
29
昨天李世石不就发现了?
b*******8
发帖数: 37364
30
围棋从头到尾最佳对局,可能就在这小概率里面。每一步必须都走对。
所以这个算法是用来对付人的,不是用来探索围棋上帝的,肯定有个天花板。
s*****V
发帖数: 21731
31
用多少次模拟可以converge, 不要告诉我是无穷次,请提供文献不要瞎鸡巴扯淡。
O**l
发帖数: 12923
32
总状态空间的百万分之一
自己搜 mogo 2007的论文
你他妈MCT是啥都不知道 就能在这喷真是醉了
估计围棋也不会下
A*******e
发帖数: 2419
33
就是。工程问题和数学问题差别还是挺大的。
s*****V
发帖数: 21731
34
总状态空间多大?傻逼人品太差,我会下你去吃屎么?
O**l
发帖数: 12923
35
你这工作都没有傻逼 24小时泡菌斑的傻粪
屁都不懂在这瞎比比 一热点就凑热闹 浪费粮食
总状态空间在那个局部有多大 搞笑
s*****V
发帖数: 21731
36
你丫屁都不懂,你难道不知道simulation要跑到终局。建议版主封禁这条疯狗省得污染
版面。
h*h
发帖数: 27852
37
【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
第四局李世石的78手L11挖被大家誉为“神之一手”,在DarkForest的策略网络输出里
排第31位,而J11靠排第10位。因此我觉得可能是AlphaGo没有算到这一步。如果对方下
了一手机器没算到的棋,则蒙特卡罗搜索树会清空,然后重新开始搜索,不应该会太快
做出结论。李喆六段告诉我K10这一手是秒下,那有可能是时间管理子系统在搜索树清
空时有程序上的漏洞,因此过早地将搜索结果返回了。这个比较容易修正。
另一种可能是,AlphaGo的估值网络出了问题。因为估值网络的权重是0.5,而不管快速
走子花了多少步,它的权值也是0.5。对于一个局面,估值网络只得到一个数,而从这
个局面往下走子,走多后会得到很多个数,统计上应该更为重要,但是AlphaGo不是这
样想的,直接对半加权了。所以如果估值网络对某个局面得到的结果不对,则会极大地
影响对该局面的胜率估计。注意这里得到很多个数的原因是按照文章,叶结点在积累了
一定盘数后(40)才展开,而不是第一次访问就展开,以提高DCNN的效率。DarkForest
没有用到估值网络,在L1... 阅读全帖
a*****g
发帖数: 19398
38
AlphaGo(阿法狗)研发团队中,陈御天(前排左三)来自中国围棋之乡——浙江天台。
浙江在线杭州3月14日讯近日,谷歌人工智能AlphaGo(阿法狗)与韩国棋手李世石
的围棋“人机大战”颇受关注。
从AlphaGo连胜三场到李世石扳回一局,目前在世界职业围棋排名网站GoRatings.
org上,AlphaGo已排名世界第四,仅次于中国柯洁、韩国朴永训以及日本井山裕太。
随着这一场博弈进入白热化,人们对AlphaGo背后团队的好奇度也与日俱增。浙江
在线记者得到消息,设计出阿法狗的幕后团队中,有一位浙江人——来自“围棋之乡”
天台的陈御天。他是当年的台州高考理科状元,中国围棋队总教练俞斌的老乡,人工智
能背后的大脑!!
陈御天陈御天
陈御天幼儿园与围棋结缘
天台围棋文化底蕴深厚
陈御天是天台城关后洋陈巷人。父母对这个独生儿子既疼爱又严格,幼儿园开始,
就要求每天做完作业才可以玩。
下午2点多,姨妈赵璐璐说起外甥陈御天,也是掩不住的自豪。
赵璐璐说,因为养成了良好的学习习惯,陈御天读书真能做到“两耳不闻窗外事,
一心只读圣贤书”。任何嘈杂,他都能“处乱不惊”。
从小到大,陈御天没上过什... 阅读全帖
D*******r
发帖数: 2323
39
围棋棋力的高低不是全局的胜负,而是做死活题了?
黑森林只用价值网络,完全不用蒙特卡罗搜索就能达到业五,相当于一个九段只能走0.
1秒的快棋。柯洁只能走0.1秒的快棋,我也可以切柯洁几盘。
w**a
发帖数: 3510
40
穷举?
d*****n
发帖数: 754
41
这没人知道啥是发阳论
r****y
发帖数: 26819
42
这话太过了。。。
D*******r
发帖数: 2323
43
哈哈,看棋拼棋涨三段嘛,所以光看拼棋,我得算业6水平了。 :)
AI围棋,不管是zen还是crazy stone,甚至包括阿法狗,都是不会下落后的棋,一旦落
后就瞎搞,这块现在是一个巨大的短板。不过我想修复这个并不难,引入动态贴目即可
,比如说落后10目时,目标调整为追到落后8目即成功,在落后8目的概率达到65%以上
时,在把目标调整为追赶到落后5目,总之,要耐心一点点追赶,不要一落后,就丧心
病狂地走无理手。
AI的算法决定了它是不以大龙死活来判断胜负,所以你会发现和它下棋,它杀棋追杀两
手它就不杀了,因为它觉得局面平衡并且它有一定优势了,它就不杀棋了,这会给人杀
棋不强的印象。
昨天晚上,拿天顶5的30秒在我16核的台机上跑,和手机上的champion Go PK,分先两
盘天顶全输了,让两子champion Go有一度形势还不错,但是一条手数叫多的杀棋它没
算到底它就当是活棋,而天顶因为落后只有杀棋的路了,所以赢算杀棋把champion Go
的龙给屠了。
其实那个杀棋并不难,基本就是一本道,只因手数较多,AI的蒙特卡罗算法不会算到底
就会有漏算。据说阿法狗是最多算25步,cha... 阅读全帖
D*******r
发帖数: 2323
44
来自主题: Go版 - 六弟让五哥两子
要看你的4核的主频是不是比16核的高。
主要耗CPU的还是蒙特卡罗搜索,而田渊栋说蒙特卡洛搜索和剪枝在分布式上不容易做
,也许同一机子上多核多线程搜没问题?不知道天顶的单机版是如何利用多核多线程蒙
特卡罗搜索的。
D*******r
发帖数: 2323
45
还是要有专门的GPU来做蒙特卡罗搜索剪枝,家用台式机计算60秒和120秒差别已经不大
了,大概也就是能多算一步的样子。
f********r
发帖数: 3155
46
来自主题: GunsAndGears版 - 终于给Tikka换了个枪托
恭喜。为什么没换个蒙特卡罗托?
D***e
发帖数: 48486
47
来自主题: Pingpong版 - 又顺利挂给外朋了
现实版的例子
我J儿一位球友老太太,跟比例金一波儿国家队的,世界网球最高排名第十三,三次全
美冠军,擅长土场吧,拿过蒙特卡罗和加拿大Open的冠军
看她打乒乓球球,基本就是在打网球
l**2
发帖数: 726
48
来自主题: Pingpong版 - 【马伊琍体接龙】且行且珍惜
关于休斯顿,只宁愿留下Galviston抓螃蟹的记忆。
----------------------------------------------------------------
发信人: feidunzi (肥顿子), 信区: Guang_Xi
标 题: 别了,休士顿。别了,分子动力学
发信站: BBS 未名空间站 (Thu Apr 3 22:26:27 2014, 美东)
很多年前当我还在纽约读博士的时候,在纽约布鲁克林区某地下室蜗居的我偶然之间,
读到了文学城某一位耆老前辈的文章。这位网名叫做“围观生活”的前辈(以下简称围
观)在他的签名档里面这样写到:“如果站在安全距离之外围观生活,生活就变得十分
搞笑。”
当时还在当mitbbs传说中的“下室索男”的我仅仅对这句话一笑了之。显然涉
世未深的楼主此时仅仅感叹于"围观生活“前辈的精妙文笔和诙谐,但是对文字后面的
妻离子散,事业处处碰壁的辛酸却是不以为然。最搞笑的情节莫过于”围观“在他妻子
嫌弃他做无钱又无房的物理千老离他而去的时候,才华横溢却又身处火坑专业的“围观
”在院子里烧掉他所有四大力学的教科书,用熊熊的火焰... 阅读全帖
v*x
发帖数: 4785
49
【 以下文字转载自 SportsNews 讨论区 】
发信人: Onews (OverseasNews), 信区: SportsNews
标 题: [TYPT]美国艳星希尔顿进军F1车坛
发信站: BBS 未名空间站 (Sun Apr 29 23:05:42 2007), 转信
据美国媒体最新报道,豪门艳妇希尔顿有望在摩纳哥蒙特卡罗站赞助世爵F1车队。如果希尔顿的计划顺利实施,那么这无疑让F1又增加了大大的亮点。
现年26岁的希尔顿是希尔顿集团的继承人之一。希尔顿是一个十足的千金小姐、亿万富翁。而F1则是公认的有钱人玩儿的运动,所以在这一点上来说,希尔顿完全有能力玩儿转F1,这对她来说还是首次经历。
本次希尔顿将提供车队现金赞助,双方的合作预计将从摩纳哥站开始,届时美丽妖娆的希尔顿也会出现在赛场内,这对F1车队以及车迷来说,都是一件好事。
w*******d
发帖数: 3714
50
直接学蒙特卡罗,在曼哈顿搞一条街道赛多好,冲过时代广场算终点哈哈
不过这年头街道是有点多,除了MC,还有新加坡瓦伦西亚,真是烦人。。
首页 上页 1 2 3 4 5 6 7 8 9 下页 末页 (共9页)