由买买提看人间百态

topics

全部话题 - 话题: reinforces
首页 上页 1 2 3 4 5 6 7 8 9 10 (共10页)
s*****V
发帖数: 21731
1
来自主题: Military版 - 大致思路是用reinforcement
这比alphaGo简单多了吧
d*****u
发帖数: 17243
2
来自主题: Military版 - 大致思路是用reinforcement
不完全是一类问题。
当然总的来说我也觉得这个简单多了,所以一所大学实验室几个author就弄出来。
m**********e
发帖数: 12525
3
来自主题: Military版 - 大致思路是用reinforcement
四川佬一惊一乍太鸡巴搞笑了
这问题很简单,就是定义一个势函数,同一面上颜色一致的块越多势越低,
然后定义温度,再定义与温度相关的随机转到,最后用monte carlo方法退
火搜索,
这个问题,难点在于怎么定义potential,别的都是我们吃剩下的
你妈的,你们的AI其实就我们物理学家发明的这么几招
a****o
发帖数: 6612
4
来自主题: Military版 - 大致思路是用reinforcement
魔方复原是NP问题,而且难度的增加是随魔方的阶数增加。三阶魔方的话,就更简单了。
魔方的任何一种解法,验算只需要P的难度。三阶魔方,暴力就可以解。
围棋是EXP问题。即使你给出下一步的解法,其验算的难度和计算下一步的难度是一样
的。
m**********e
发帖数: 12525
5
来自主题: Military版 - 大致思路是用reinforcement
这是个屁问题,就是定义一个potential,然后寻找Potential的global min,
可以用annealing,也可以用GA,多如牛毛,
你妈的,也就码农还当个屁

了。
d*****u
发帖数: 17243
6
来自主题: Military版 - 大致思路是用reinforcement
不懂的东西不要乱评论。Potential function方法大概5年前就过时了。(当然不是说
不存在了,而是换了一种思路)。
还有这只是一篇Arxiv paper,没人说是重大成果,一惊一乍的是你。
d*****u
发帖数: 17243
7
来自主题: Military版 - 大致思路是用reinforcement
别扯了。任何监督学习问题当然都是优化问题,问题是那么多变量你具体靠什么优化,
这才是核心。
m**********e
发帖数: 12525
8
来自主题: Military版 - 大致思路是用reinforcement
行了,
这算法是orphan的,只能准对特定事件,屁的AI
你们四川佬水平太差,看到现象看不穿本质
a****o
发帖数: 6612
9
来自主题: Military版 - 大致思路是用reinforcement
魔方是个NP问题,如果给出一个答案,那么验证这个答案的难度是魔方的阶数的多次方
程。三阶魔方的解,不需要AI就能搞出来。
如果AI能够给出一个证明,任何一个三阶魔方,最多多少步就能复原,那么这个解还有
点意思。
我记得好像数学上已经证明了,最多是不到25步,(可能最多是20步)。那么平均30步
的话,那么基本上可以认为这个AI根本还不够。--当然,我不清楚一步是怎么定义的。
我的理解是任何一层的90度的转动。
d*****u
发帖数: 17243
10
来自主题: Military版 - 大致思路是用reinforcement
你们山越永远不开化,只会模仿从未超越。
任何神经网络模型都是针对具体的数据来训练,解决具体的问题。所以你说的都是废话
屁话。
a****o
发帖数: 6612
11
来自主题: Military版 - 大致思路是用reinforcement
这个结果不算什么成果。如果能够给出一个严格正确的证明三阶魔方复原的最多步数,
倒是可以说是一个重大成果了。
d***u
发帖数: 943
12
来自主题: Military版 - 大致思路是用reinforcement

了这个露点的检测就活了,真有点儿智能的意思了。
d*****u
发帖数: 17243
13
来自主题: Military版 - 大致思路是用reinforcement
他们的成果是训练出来一个可以解这个问题的模型。以前大概没有人用机器学习的方法
做过。
成果大不大看具体方法的新颖程度。比如去年有个用神经网络解数独的,虽然是没人做
过,但是他的方法没啥新意,投稿就被拒了。
m**********e
发帖数: 12525
14
来自主题: Military版 - 大致思路是用reinforcement
应该是严格证明三阶魔方的最大步数
d*****u
发帖数: 17243
15
来自主题: Military版 - 大致思路是用reinforcement
机器学习(不一定神经网络)都要求对新数据做出预测。
所以测试数据一般跟训练数据没有一样的。
a****o
发帖数: 6612
16
来自主题: Military版 - 大致思路是用reinforcement
三阶魔方的所有可能状态,在考虑对称性的情况下,我觉得是个非常有限的数目。应该
可以暴力求出来。那么,每一个状态复原的步数,也可以求出来。
虽然不是全局优化,对于三阶魔方来说,平均步数太多。而且不知道最多步数是多少。
这个最多步数应该是接近或者等于现在已经证明的任何一个魔方的最多复原步数的一个
上限。
a****o
发帖数: 6612
17
来自主题: Military版 - 大致思路是用reinforcement
是。应该是最多只需要多少步。
d***u
发帖数: 943
18
来自主题: Military版 - 大致思路是用reinforcement

最短路径好像已经证明是26步,好像Rubic自己证明的
UCI这个方法我没看出来能证明最短路径
d*****u
发帖数: 17243
19
来自主题: Military版 - 大致思路是用reinforcement
简单的暴力恐怕还是有点难。
如果上限是20步,要实验的状态还是很多的。

发帖数: 1
20
来自主题: Military版 - 大致思路是用reinforcement
三阶的最多七步

★ 发自iPhone App: ChinaWeb 1.1.4
d***u
发帖数: 943
21
来自主题: Military版 - 大致思路是用reinforcement

这个我知道,我是说从这个意义上叫它智能也有一定道理,只是和人的智能不一样而已
不只是函数模拟curve fitting, 也可以根据新情况自学习了
a****o
发帖数: 6612
22
来自主题: Military版 - 大致思路是用reinforcement
魔方的对称性很强啊。8个顶点位置,每个位置三个状态,12个中间位置,每个位置两
个状态。不考虑任何对称性,总数目是5.19E20

发帖数: 1
23
来自主题: Military版 - 大致思路是用reinforcement
最终的联想推理创造,不一定是类人的
映射到机器域,可能就是差值,有误差预测
d*****u
发帖数: 17243
24
来自主题: Military版 - 大致思路是用reinforcement
你这个是每一步的状态吧(我没验算)。
简单的暴力解法要找出每个状态下的合理Decision
而不知道技巧的时候这个Decision的合理性只能通过彻底解决来验证,所以还是步长的
指数次(但是每个decision是有限的,不是状态数为底)
s*****V
发帖数: 21731
25
来自主题: Military版 - 大致思路是用reinforcement
魔方只有简单的几条rule,深度学习理论上学习出来这几条规则不是很难。跟围棋相比
,魔方的难度是魔方的rule distribution很sharp,错一点就不行。 网络可以生成大
量的successful path, 然后任意一个start point 进行search, 只有能达到其中一个
就可以。但是神经网络是统计模型,一般不会是100%的选一个,所以搞出来不一定是最
短路径
w***u
发帖数: 17713
26
来自主题: Military版 - 大致思路是用reinforcement
不通过SO(3)搞矩阵,暴力学习还是很牛的,反正是某些方面超越了人类。

发帖数: 1
27
来自主题: Military版 - 大致思路是用reinforcement
应该问最慢多少步
答案是20
u********s
发帖数: 1047
28
中国商飞宣布,由于在测试中发现C919升降舵所使用的碳纤维复合材料发生剥落问题,
现已停止测试飞行。
中国商用飞机公司(COMAC)已经停飞C919飞行试验机以进行修改,这一工作将在
飞行测试计划中花费大约三个月的时间。
尽管如此,该公司已经重申了在2020年获得认证的目标。据两位业内人士透露,迄
今为止已进行试飞的两款原型机的尾翼和襟翼均已改装。
其中一位消息人士表示,在飞机尾部的工作特别是对碳纤维增强塑料升降舵上观察
到的分层反应(The work on the tail is specifically a response to
delamination observed on the carbon-fiber reinforced plastic elevators, one
of the sources said.)。消息来源补充说,对襟翼的修改与强度有关。
另一位消息人士说,油箱也正在改装。他并补充说,这架飞机自4月份以来一直在
地面上停场,并可能会在那里停场到7月份。
对前两架原型机的更改可能会应用于COMAC正在构建的其他四架飞行... 阅读全帖

发帖数: 1
29
hehe, reinforcement of wrong ideas
s***h
发帖数: 487
30
来自主题: Military版 - 维密的衣服质量那么差
所有的内衣内裤,都只有边缘是 reinforced,布料中间部分 structural integrity
都很差,用力从当中一撕基本就成为 crotchless 。。。 当然好一点的女生内裤在
crotch 部分有两层,但撕两次又不难的 。。。


: 你买了别人撕也一样容易烂,

: 还是买不容易烂的省钱,放心

c******o
发帖数: 1277
31
星光, 你看看这个:
https://www.youtube.com/watch?v=dMF2i3A9Lzw
这就是一个AI现在火的方向。 当然关键是成本还在大幅下降,要是人人在laptop上可
以做,那是不是能影响很多?
像多人德扑这种有明确规则的,reinforced deep learning 绝对没问题,就是多训练
的事。这个难道比开车难? 现在自动驾驶就比大部分人好其实。
关键是现在正属于上升期,很多门槛都在大幅度的下降,想想以后是个人轻松就能做这
些。。。
s******r
发帖数: 5309
32
Robert Mueller just snagged his golden goose
Manafort's lawyer says he 'accepted responsibility' with plea deal
Lawyer Kevin Downing said Paul Manafort is accepting responsibility "for
conduct that dates back many years," with his plea deal on Sept. 14. (
Reuters)
By Aaron Blake
September 14 at 1:34 PM
It took longer than Robert S. Mueller III probably wanted — and longer than
Paul Manafort probably should have waited — but Mueller on Friday finally
landed his golden goose.
Manafort’s plea deal ... 阅读全帖

发帖数: 1
33
搞神经科学,计算机和控制的几票人长时间发展出来的
包括神经网络跟统计也没太大关系,你非要说最小二乘也是统计,梯度下降也是统计,
我也无语鸟
s***h
发帖数: 487
34
工业界目前大部分还是 supervised 为主。
s***h
发帖数: 487
35
叔的理想是 learnable mathematics solver,集学习历史和前瞻预见之大成。
当然先上班吃饱肚子再说,理想主要是吹牛压压妹纸身 。。。

发帖数: 1
36
learnable solver有人在搞,也是用RL
说白了就是用RL学步长和方向


: 叔的理想是 learnable mathematics solver,集学习历史和前瞻预见之大成。

: 当然先上班吃饱肚子再说,理想主要是吹牛压压妹纸身 。。。

b***y
发帖数: 14281

发帖数: 1
38
逻辑要搞明白,你用了这些方法,不是说人就成你的了


: https://en.m.wikipedia.org/wiki/Regression_analysis

: ★ 发自iPhone App: ChinaWeb 1.1.4


发帖数: 1
39
那你说什么是统计?

发帖数: 1
40
不晓得
5682827


: 那你说什么是统计?

T*******x
发帖数: 8565
41
统计,从样本,以统计的方法,得到目标量对输入的依赖关系。统计的方法有什么呢?
linear regression,... 还有啥?
w*******2
发帖数: 2199
42
统计,起码要有population and samples
麻痹牛顿法,共轭提督法, 和统计有个鸡巴关系
是统计解题用到了这些优化方法,而不是反过来
s*****t
发帖数: 987
43
来自主题: Military版 - deep learning还没走多远

为什么 deep reinforcement learning 走不下去了呢? 是很难收敛?
s*****t
发帖数: 987
44
来自主题: Military版 - deep learning还没走多远

为什么 deep reinforcement learning 走不下去了呢? 是很难收敛?
b***y
发帖数: 14281
45
来自主题: Military版 - deep learning还没走多远
错。人脑先天就会做的事情很少。绝大多数技能都是后天学习的。新出生的娃只有三四
个本能。没娃的锁男真是没经验。
其实其他都不重要,最关健的还是神经元的数量。人脑有大约一千亿个神经元,计算机
想要模拟那几乎不可能。
另外一个关键是人的学习是完全浸入式的,有各种不同的sensor去reinforce,比如观
察一个娃学习语言,为什么娃能写的这么快这么好计算机就是做不到呢?关键人学习的
时候有生活体验反复不断的验证,包括视觉听觉触觉以及各种不同的反馈,计算机根本
模拟不到万分之一。

★ 发自iPhone App: ChinaWeb 1.1.4
b***y
发帖数: 14281
46
来自主题: Military版 - deep learning还没走多远
婴儿刚生出来时视觉很差,上下左右颠倒,还没有颜色的概念,连对焦都不太行,所以
只能看清固定距离里的物体,太远太近的都看不清。我不认为婴儿刚生下来的时候能分
清楚背景和物体,所有这些都是以后reinforce learn的。不过据说先天本能里面对人
脸和光线的变化比较敏感。婴儿大概一两个月以后才有比较自主有目的性的观察。
基本上人脑生下来的时候就是光机一个,只有一些内脏功能是固化的。手脚运动这些都
是后天学的。几个月大的婴儿有一段时间很喜欢看自己的手和脚,就是因为那个时候才
发现这两玩意儿受自己控制。

★ 发自iPhone App: ChinaWeb 1.1.4
b**e
发帖数: 3199
47
来自主题: Military版 - 高科技出口管制的意思
具体包括以下领域
The representative general categories
of technology for which Commerce
currently seeks to determine whether
there are specific emerging technologies
that are essential to the national security
of the United States include:
(1) Biotechnology, such as:
(i) Nanobiology;
(ii) Synthetic biology;
(iv) Genomic and genetic engineering;
or
(v) Neurotech.
(2) Artificial intelligence (AI) and
machine learning technology, such as:
(i) Neural networks and deep learning
(e.g., brain modelling, time s... 阅读全帖
b********n
发帖数: 38600
48
来自主题: Military版 - 中国的所谓技术基本靠偷。
While Trump and his minions rant on about China engaging in "unfair trade",
the elephants in the corner of the Oval Office are the US-based
multinational corporations that persuaded the USA to sign international
trade agreements that allowed the multinationals to move their factories out
of the USA and into low-wage, low-tax, low-regulation, litigation-free,
human-rights-advocates-free, and pollution-tolerant countries like Mexico
and China, while allowing tariff-free access to the US markets fo... 阅读全帖
b********n
发帖数: 38600
49
but if the price is any significant loss of China's independence and
sovereignty, I doubt China will pay that price.
While Trump and his minions rant on about China engaging in "unfair trade",
the elephants in the corner of the Oval Office are the US-based
multinational corporations that persuaded the USA to sign international
trade agreements that allowed the multinationals to move their factories out
of the USA and into low-wage, low-tax, low-regulation, litigation-free,
human-rights-advocate... 阅读全帖
b********n
发帖数: 38600
50
While Trump and his minions rant on about China engaging in "unfair trade",
the elephants in the corner of the Oval Office are the US-based
multinational corporations that persuaded the USA to sign international
trade agreements that allowed the multinationals to move their factories out
of the USA and into low-wage, low-tax, low-regulation, litigation-free,
human-rights-advocates-free, and pollution-tolerant countries like Mexico
and China, while allowing tariff-free access to the US markets fo... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 (共10页)