第4页 - 关于蒙特卡罗的讨论汇总 - 话题女王

全部话题 - 话题: 蒙特卡罗

g*****n
发帖数: 420

来自主题: Go版 - 狗狗不让打劫，是程序还不够完善？

darkforest那个围棋程序说处理不好打劫和模仿棋，应该是有这个问题的，darkforest
也是用的神经网络+蒙特卡罗

g*****n
发帖数: 420

来自主题: Go版 - 狗狗不让打劫，是程序还不够完善？

darkforest那个围棋程序说处理不好打劫和模仿棋，应该是有这个问题的，darkforest
也是用的神经网络+蒙特卡罗

D*******r
发帖数: 2323

来自主题: Go版 - 打劫就是拼计算量

主要是这个找劫财没法用policy network和value network去选点，它得到全盘任何一
个非禁着点去计算是否是劫财，而蒙特卡罗算法是会漏掉很多劫材的。除非得单为打劫
写一个module来处理打劫。

L********d
发帖数: 3820

来自主题: Go版 - 现在最爽的是黄aja

蒙特卡罗tree search是他的想法，DNN应该不是

D*******r
发帖数: 2323

来自主题: Go版 - 第三局估计也没啥可看了

他跟我说的根本就是两个问题，我在说阿狗的快速摆棋形势判断算法，他在说蒙特卡罗
存储计算分支要多少存储空间，这根本就是两码事。在阿狗的distributed system上，
这根本就是在两个不同的机子上做的。

o***8
发帖数: 46

来自主题: Go版 - 打败阿狗的方法探讨，热点扩散法

什么热点，人家论文已经说得很清楚了, policy网是根据当前局面对每个合法落子位置
都做出评估，然后选若干点用蒙特卡罗树搜索往下算胜率。无论你怎么下，对这个过程
本身没有影响，根本谈不上什么扩大热点数。

s***y
发帖数: 357

来自主题: Go版 - 五路尖冲

其实就是一些似是而非的棋。大概就是把棋牌上各个差不多看上去像围棋形状的点跳出
来试算。所以alpha go 不懂什么几路肩冲，要是你棋子放到5路，他就算6路肩冲，反
正他觉得肩冲是棋就算呗。其实这个棋可能就是算最后就是个第二个最好的选点胜率稍
微好那么一点，比如 1.这手五路肩冲51%，2.上面扳50.8%, 3.下面打入50.6%.等等
然后各种棋手就惊了，好像这个五路肩冲是个多大的妙手似的，李师师看上去都傻了，
以为有诈。想了半天走了一个什么贴。其实也不见得有什么好的。
我估计要是同样的局面，再让alpha go的蒙特卡罗算一次也许就走别的了。
关键是，有些人居然还要向机器学习，这太搞笑了，你人能一步算几十个点么，这怎么
学？人的选点建立在更深远的逻辑上，虽然不一定选出最好的，但是在最好的前几手没
问题。

s***y
发帖数: 357

来自主题: Go版 - 五路尖冲

f******i
发帖数: 485

来自主题: Go版 - 五路尖冲

要不是狗下的我看有几人会说这是妙手
更像蒙特卡罗搞出的野点

r******i
发帖数: 1445

来自主题: Go版 - 为什么狗狗在判断赢李九段这点上这么迟钝呢？

80%的胜率是蒙特卡罗法的结果，意思相当于如果两个业余选手从此处下100盘，估计有
80盘本方能赢。
像大多数棋类程序一样，狗狗估计是不做对手的profiling。搜索树靠policy神经网络
生成后，搜索的算法应该仍然是min-max法。这种方法总是假设对方是自己，然后考虑
对方会有什么应手。

t******l
发帖数: 10908

来自主题: Go版 - 为什么狗狗在判断赢李九段这点上这么迟钝呢？

个人觉得属实。胜率是对数学统计概率模型而言，所以应该是该点开始是对狗咬狗而言
的概率，或者狗模咬狗模的估计。人不容易建立数学模型，估计不会费事估计对人的概
率。

：80%的胜率是蒙特卡罗法的结果，意思相当于如果两个业余选手从此处下100盘，估计
有80盘本方能赢。
：

r******i
发帖数: 1445

来自主题: Go版 - 为什么狗狗在判断赢李九段这点上这么迟钝呢？

t******l
发帖数: 10908

来自主题: Go版 - 为什么狗狗在判断赢李九段这点上这么迟钝呢？

p*********d
发帖数: 524

来自主题: Go版 - 李师石要了解狗的算法才是公平

算法在强大的运算能力面前或并不复杂
遗传退火蚁群蒙特卡罗本质都差不多

s*****t
发帖数: 1661

来自主题: Go版 - 阿法狗生怕人类还不够绝望

不太懂机器学习。但是对于复杂函数，蒙特卡罗算法虽然最后都收敛，但是到达手链
状态之前需要的烧入步数，相差非常大的。。。
股沟这么搞，应该是想测试他们算法对于初始值的依赖程度的高低吧。。。说没有依赖
，那数学上是不成立的。。。

D*******r
发帖数: 2323

来自主题: Go版 - 阿法狗生怕人类还不够绝望

别扯了，没有神经网络靠蒙特卡罗搜索的围棋软件出来已经有十多年了，最好的今年一
月被连笑打到让六子。
围棋盘上下一手的可选点有上百个，上百个点下面又有上百个分支，哪些需要计算哪些
根本不用考虑，你告诉我蛮力计算怎么解决？

D*******r
发帖数: 2323

来自主题: Go版 - 我觉得阿法狗的bug是不愿意杀大龙

杀大龙有一些其实计算未必复杂，但是需要手数很多，而机器是没法通过棋形判断死活
的，它必须一直摆到对方没气时，才能确认能杀棋。
但是蒙特卡罗搜索不能一直往深处搜索，那样计算量太大。于是假设一条大龙需要30手
棋才能收完气杀死，但是阿法狗算了25手，对方大龙还没死，于是它就误以为大龙杀不
死，于是放弃那条搜索路线。
这么多盘棋，阿法狗虽然力量强大，但是却从不杀大龙，可能就是这个原因。

D*******r
发帖数: 2323

来自主题: Go版 - 我觉得阿法狗的bug是不愿意杀大龙

对呀，问题就在这里，杀大龙的那条枝因为进行了20步评分不高（因为龙没死），所以
那条枝就被剪了，去搜索别的评分高的枝了。
我们都知道，杀龙而杀不死最损自己的空，所以杀龙是蒙特卡罗搜索最容易被剪掉的枝。

m*****n
发帖数: 3575

来自主题: Go版 - AlphaGo相关技术：蒙特卡罗(Monte Carlo)方法简介

顶一下

m*****n
发帖数: 3575

来自主题: Go版 - AlphaGo相关技术：蒙特卡罗(Monte Carlo)方法简介

顶一下

l****z
发帖数: 29846

来自主题: Go版 - AlphaGo相关技术：蒙特卡罗(Monte Carlo)方法简介

monte carlo方法好像早都有的吧. 很多其他围棋软件也用了这个方法的.
Alphago不是依靠monte carlo才赢的吧. 是另外一个方法才能大量精简了二叉树, 所以
速度才快很多.

l*****i
发帖数: 20533

来自主题: Go版 - AlphaGo相关技术：蒙特卡罗(Monte Carlo)方法简介

七拼八凑，不知所云。

A*******e
发帖数: 2419

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

比如在某一步，百万分支里只有一条输棋路径，那胜率很高，但对手恰恰选了这一条

A*******e
发帖数: 2419

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

顶

O**l
发帖数: 12923

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

如果没有bias simulation足够就不会对手胜率越高mini层的simulaiton次数越多

a****t
发帖数: 7049

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

如果有这种棋，人自己也发现不了

s*****V
发帖数: 21731

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

怎么不会，最后的simulation是不考虑岔路的模拟对局，本身结果就不一定可靠

O**l
发帖数: 12923

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

谁他妈跟你说不可靠的
UCB是可以数学上证明converge的
你他妈当MCT是monte carlo啊

A*******e
发帖数: 2419

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

昨天李世石不就发现了？

b*******8
发帖数: 37364

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

围棋从头到尾最佳对局，可能就在这小概率里面。每一步必须都走对。
所以这个算法是用来对付人的，不是用来探索围棋上帝的，肯定有个天花板。

s*****V
发帖数: 21731

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

用多少次模拟可以converge，不要告诉我是无穷次，请提供文献不要瞎鸡巴扯淡。

O**l
发帖数: 12923

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

总状态空间的百万分之一
自己搜 mogo 2007的论文
你他妈MCT是啥都不知道就能在这喷真是醉了
估计围棋也不会下

A*******e
发帖数: 2419

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

就是。工程问题和数学问题差别还是挺大的。

s*****V
发帖数: 21731

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

总状态空间多大？傻逼人品太差，我会下你去吃屎么？

O**l
发帖数: 12923

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

你这工作都没有傻逼 24小时泡菌斑的傻粪
屁都不懂在这瞎比比一热点就凑热闹浪费粮食
总状态空间在那个局部有多大搞笑

s*****V
发帖数: 21731

来自主题: Go版 - 蒙特卡罗是不是有天生缺陷？

你丫屁都不懂，你难道不知道simulation要跑到终局。建议版主封禁这条疯狗省得污染
版面。

h*h
发帖数: 27852

来自主题: Go版 - zt【FACEBOOK 围棋软件专家田渊栋博士对第四盘分析】

【FACEBOOK 围棋软件专家田渊栋博士对第四盘分析】
第四局李世石的78手L11挖被大家誉为“神之一手”，在DarkForest的策略网络输出里
排第31位，而J11靠排第10位。因此我觉得可能是AlphaGo没有算到这一步。如果对方下
了一手机器没算到的棋，则蒙特卡罗搜索树会清空，然后重新开始搜索，不应该会太快
做出结论。李喆六段告诉我K10这一手是秒下，那有可能是时间管理子系统在搜索树清
空时有程序上的漏洞，因此过早地将搜索结果返回了。这个比较容易修正。
另一种可能是，AlphaGo的估值网络出了问题。因为估值网络的权重是0.5，而不管快速
走子花了多少步，它的权值也是0.5。对于一个局面，估值网络只得到一个数，而从这
个局面往下走子，走多后会得到很多个数，统计上应该更为重要，但是AlphaGo不是这
样想的，直接对半加权了。所以如果估值网络对某个局面得到的结果不对，则会极大地
影响对该局面的胜率估计。注意这里得到很多个数的原因是按照文章，叶结点在积累了
一定盘数后（40）才展开，而不是第一次访问就展开，以提高DCNN的效率。DarkForest
没有用到估值网络，在L1... 阅读全帖

a*****g
发帖数: 19398

来自主题: Go版 - 阿尔法幕后的陈御天台州高考理科状元清华电子系

AlphaGo（阿法狗）研发团队中，陈御天（前排左三）来自中国围棋之乡——浙江天台。
浙江在线杭州3月14日讯近日，谷歌人工智能AlphaGo（阿法狗）与韩国棋手李世石
的围棋“人机大战”颇受关注。
从AlphaGo连胜三场到李世石扳回一局，目前在世界职业围棋排名网站GoRatings.
org上，AlphaGo已排名世界第四，仅次于中国柯洁、韩国朴永训以及日本井山裕太。
随着这一场博弈进入白热化，人们对AlphaGo背后团队的好奇度也与日俱增。浙江
在线记者得到消息，设计出阿法狗的幕后团队中，有一位浙江人——来自“围棋之乡”
天台的陈御天。他是当年的台州高考理科状元，中国围棋队总教练俞斌的老乡，人工智
能背后的大脑！！
陈御天陈御天
陈御天幼儿园与围棋结缘
天台围棋文化底蕴深厚
陈御天是天台城关后洋陈巷人。父母对这个独生儿子既疼爱又严格，幼儿园开始，
就要求每天做完作业才可以玩。
下午2点多，姨妈赵璐璐说起外甥陈御天，也是掩不住的自豪。
赵璐璐说，因为养成了良好的学习习惯，陈御天读书真能做到“两耳不闻窗外事，
一心只读圣贤书”。任何嘈杂，他都能“处乱不惊”。
从小到大，陈御天没上过什... 阅读全帖

D*******r
发帖数: 2323

来自主题: Go版 - 此文在弈客已掀起喧然大波，已有职业棋手对其抨击

围棋棋力的高低不是全局的胜负，而是做死活题了？
黑森林只用价值网络，完全不用蒙特卡罗搜索就能达到业五，相当于一个九段只能走0.
1秒的快棋。柯洁只能走0.1秒的快棋，我也可以切柯洁几盘。

w**a
发帖数: 3510

来自主题: Go版 - 用蒙特卡罗树形法解得出发阳论吗？

穷举？

d*****n
发帖数: 754

来自主题: Go版 - 用蒙特卡罗树形法解得出发阳论吗？

这没人知道啥是发阳论

r****y
发帖数: 26819

来自主题: Go版 - 用蒙特卡罗树形法解得出发阳论吗？

这话太过了。。。

D*******r
发帖数: 2323

来自主题: Go版 - 妈蛋的，难怪最近拿不住LEVEL 10了

哈哈，看棋拼棋涨三段嘛，所以光看拼棋，我得算业6水平了。 :)
AI围棋，不管是zen还是crazy stone，甚至包括阿法狗，都是不会下落后的棋，一旦落
后就瞎搞，这块现在是一个巨大的短板。不过我想修复这个并不难，引入动态贴目即可
，比如说落后10目时，目标调整为追到落后8目即成功，在落后8目的概率达到65%以上
时，在把目标调整为追赶到落后5目，总之，要耐心一点点追赶，不要一落后，就丧心
病狂地走无理手。
AI的算法决定了它是不以大龙死活来判断胜负，所以你会发现和它下棋，它杀棋追杀两
手它就不杀了，因为它觉得局面平衡并且它有一定优势了，它就不杀棋了，这会给人杀
棋不强的印象。
昨天晚上，拿天顶5的30秒在我16核的台机上跑，和手机上的champion Go PK，分先两
盘天顶全输了，让两子champion Go有一度形势还不错，但是一条手数叫多的杀棋它没
算到底它就当是活棋，而天顶因为落后只有杀棋的路了，所以赢算杀棋把champion Go
的龙给屠了。
其实那个杀棋并不难，基本就是一本道，只因手数较多，AI的蒙特卡罗算法不会算到底
就会有漏算。据说阿法狗是最多算25步，cha... 阅读全帖

D*******r
发帖数: 2323

来自主题: Go版 - 六弟让五哥两子

要看你的4核的主频是不是比16核的高。
主要耗CPU的还是蒙特卡罗搜索，而田渊栋说蒙特卡洛搜索和剪枝在分布式上不容易做
，也许同一机子上多核多线程搜没问题？不知道天顶的单机版是如何利用多核多线程蒙
特卡罗搜索的。

D*******r
发帖数: 2323

来自主题: Go版 - 天顶六已具有阿十三的水准

还是要有专门的GPU来做蒙特卡罗搜索剪枝，家用台式机计算60秒和120秒差别已经不大
了，大概也就是能多算一步的样子。

f********r
发帖数: 3155

来自主题: GunsAndGears版 - 终于给Tikka换了个枪托

恭喜。为什么没换个蒙特卡罗托？

D***e
发帖数: 48486

来自主题: Pingpong版 - 又顺利挂给外朋了

现实版的例子
我J儿一位球友老太太，跟比例金一波儿国家队的，世界网球最高排名第十三，三次全
美冠军，擅长土场吧，拿过蒙特卡罗和加拿大Open的冠军
看她打乒乓球球，基本就是在打网球

l**2
发帖数: 726

来自主题: Pingpong版 - 【马伊琍体接龙】且行且珍惜

关于休斯顿，只宁愿留下Galviston抓螃蟹的记忆。
----------------------------------------------------------------
发信人: feidunzi (肥顿子), 信区: Guang_Xi
标题: 别了，休士顿。别了，分子动力学
发信站: BBS 未名空间站 (Thu Apr 3 22:26:27 2014, 美东)
很多年前当我还在纽约读博士的时候，在纽约布鲁克林区某地下室蜗居的我偶然之间，
读到了文学城某一位耆老前辈的文章。这位网名叫做“围观生活”的前辈（以下简称围
观）在他的签名档里面这样写到：“如果站在安全距离之外围观生活,生活就变得十分
搞笑。”
当时还在当mitbbs传说中的“下室索男”的我仅仅对这句话一笑了之。显然涉
世未深的楼主此时仅仅感叹于"围观生活“前辈的精妙文笔和诙谐，但是对文字后面的
妻离子散，事业处处碰壁的辛酸却是不以为然。最搞笑的情节莫过于”围观“在他妻子
嫌弃他做无钱又无房的物理千老离他而去的时候，才华横溢却又身处火坑专业的“围观
”在院子里烧掉他所有四大力学的教科书，用熊熊的火焰... 阅读全帖

v*x
发帖数: 4785

来自主题: Racing版 - [TYPT]美国艳星希尔顿进军F1车坛

【以下文字转载自 SportsNews 讨论区】
发信人: Onews (OverseasNews), 信区: SportsNews
标题: [TYPT]美国艳星希尔顿进军F1车坛
发信站: BBS 未名空间站 (Sun Apr 29 23:05:42 2007), 转信
据美国媒体最新报道,豪门艳妇希尔顿有望在摩纳哥蒙特卡罗站赞助世爵F1车队。如果希尔顿的计划顺利实施,那么这无疑让F1又增加了大大的亮点。
现年26岁的希尔顿是希尔顿集团的继承人之一。希尔顿是一个十足的千金小姐、亿万富翁。而F1则是公认的有钱人玩儿的运动,所以在这一点上来说,希尔顿完全有能力玩儿转F1,这对她来说还是首次经历。
本次希尔顿将提供车队现金赞助,双方的合作预计将从摩纳哥站开始,届时美丽妖娆的希尔顿也会出现在赛场内,这对F1车队以及车迷来说,都是一件好事。

w*******d
发帖数: 3714

来自主题: Racing版 - 美国重返F1赛历！德州2012年举办F1美国站 (转载)

直接学蒙特卡罗，在曼哈顿搞一条街道赛多好，冲过时代广场算终点哈哈
不过这年头街道是有点多，除了MC，还有新加坡瓦伦西亚，真是烦人。。

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天