r**h 发帖数: 1288 | 1 嗯,如果不用牛顿法,至少也要gradient descent |
|
t*********h 发帖数: 941 | 2 stochastic gradient descent? |
|
t*********h 发帖数: 941 | 3 stochastic gradient descent? |
|
c********s 发帖数: 12 | 4 我刚刚面过两轮amazon research scientist intern。 两轮都是技术问(forecasting
group)。 基本上都是time series, regression, machine learning的东西。 NN
, tree, random forest, gradient decent, backprobagation, missing data
imputation, bagging, lasso, etc都要知道。 会问的比较细, 还有一些case
study。 |
|
J*****s 发帖数: 110 | 5 我(CS)面过小公司的data scientist, 面得都是我不知道的统计的:
What's Operating Point?
Sampling types for streaming and batch data?
What are Lift Charts? What is Lift?
What insight is found in Recall–Precision Curves?
What are hidden decision trees?
Stochastic Gradient Descent |
|
c*******r 发帖数: 610 | 6 如果是prediction,那么我个人理解它只是数据挖掘的一个分支。 有很多已存在的挖掘
算法可以用来做prediction. 数据挖掘和机器学习以及统计等多个学科关系紧密。
看数据类型以及具体问题的context,通常有supervised learning(SL), unsupervised
learning (USL). SL 是基于有些已经分好类的数据建立一个模型,然后对未知数据进
行分类,也就是prediction, 有很多算法了,比如naive bayes, logistic
regression(名字是regression, 但是是supervised分类)Bayesian networks,
random forests (stochastic gradient descent random forest), knn, decision
tree, ....(太多了);USL的训练数据没有提前分好类,需要通过一些模型来把数据分
到不同的group中。很多算法比如k-means clustering之类的。
还有很多高深算法比如什么Conditional Random F... 阅读全帖 |
|
i**********8 发帖数: 27 | 7 作数据分析和模型有很多年了, 也有一些模型在以前几家公司的 production 上转, 近
年递了几个专利申请, 也有需要评审才能接收的 journal 文章待发, 几乎每天都能收
到 LinkedIn 上 recruiter 的位置推荐和邀请, 感觉 Google 招人可能有一些特别的
筛选条件, 这么多年从没有 Google 的recruiter 联系过我. 对 Google 一直挺景仰,
希望能有机会进去工作, 看来只有靠内推.
个人背景非CS, 非统计, 猜测可能是 Google 不喜欢的原因. 业界经历主要包括
Social Network - recommendation engine, Ads Targeting - real time (Patent
pending), Digital / Internet Marketing, Marketing efficiency optimization (
paper accepted), Credit Risk modeling, 会用 SQL, SAS, C++, Perl, Shell
Script, Pig, Hi... 阅读全帖 |
|
c***z 发帖数: 6348 | 8
要赞就赞烙印,人家确实团结,妈的
然后是要有策略,人家也没有说我什么,而是就事论事的说他觉得candidate答得没问
题。就是不知道为啥要和我私底下argue,我明明已经解释过了为什么答得不合适。
PS:我挑的问题,一个是neural network的原理,relation between back
propagation and gradient descent;一个是处理noisy data的时候怎么区别signal (
fraud) and noise (bad data);一个是rare event怎么处理。FICO来的烙印明显没有
处理过这种情况,只能试图把我绕晕。就这样还是principal呢,烙印牛逼。
PS2:其实真正kill烙印的地方是丫显示出想要climb the ladder,我们小地方没有什
么可以climb的。同学们可以参考一下,小地方就不要太强调自己的ambition了。 |
|
s******u 发帖数: 550 | 9 随便说几句,可以考虑定义下vector, matrix
你的linear regression是用gradient-based method写的吗,可以分开写求导的,也就
是查找方向的函数,
前面仁兄说的,io和计算分开,同时很多命名真的很让人头疼
现在看起来,非常难以理解,现在linear regression的实现open source应该有很多,
自己搜搜看别人怎么写的
我上学的时候用的是matlab的optimization box,你也可以去看看人家怎么写的 |
|
d**********3 发帖数: 1186 | 10 Hello All Members,
We will hold SQL PASS Career Talk on Jun 9th.
(Jun 9, 2015 9:00 PM - 10:30 PM CST)
Please register for How to Start the Career as Data Scientist on Jun 9, 2015
9:00 PM CDT at:
https://attendee.gotowebinar.com/register/5891367287069457410
After registering, you will receive a confirmation email containing
information about joining the webinar.
------------------------------------------------------
About this Session,
How to Start the Career as Data Scientist
In this talk, Yong,... 阅读全帖 |
|
l******t 发帖数: 660 | 11 【 以下文字转载自 DataSciences 讨论区 】
发信人: derekdai1213 (derek.dai), 信区: DataSciences
标 题: How to Start the Career as Data Scientist
发信站: BBS 未名空间站 (Sat Jun 6 18:08:39 2015, 美东)
Hello All Members,
We will hold SQL PASS Career Talk on Jun 9th.
(Jun 9, 2015 9:00 PM - 10:30 PM CST)
Please register for How to Start the Career as Data Scientist on Jun 9, 2015
9:00 PM CDT at:
https://attendee.gotowebinar.com/register/5891367287069457410
After registering, you will receive a confirmation email containing
info... 阅读全帖 |
|
g*******n 发帖数: 2198 | 12 【 以下文字转载自 Faculty 讨论区 】
发信人: goldenman (戈登曼), 信区: Faculty
标 题: 借版问个least square的问题
发信站: BBS 未名空间站 (Wed May 18 18:50:25 2016, 美东)
http://math.stackexchange.com/questions/1664018/is-there-an-ite
主要两个问题
1.U比较大的时候 没法直接算的时候怎么处理 LSMR只能解决Sparse的时候 如果不是
Sparse 是不是没办法了
2.后半个问题 如何iteratively得到theta, LSMR虽然简化了算法 但还是要存整个U
如果U过大 有memory问题的话怎么处理 我看下面的回答 用gradient descent根据
error function来算,但error function还是需要以前的data y_i u_i 有没有办法在
新的data进来的时候只用现有的data来update theta同时minimize error of whole
history, 比如theta_(i... 阅读全帖 |
|
w*********m 发帖数: 4740 | 13 先去把这些概念搞清楚,overfitting, feature selection, confidence interval,
bagging, boosting, deep learning, maximum likelihood, EM algorithm, monte
carlo simulation, gibbs sampling, loss function, gradient descent, etc. |
|
M***6 发帖数: 895 | 14 实现gradient descent 算法。应该主要还是会问你简历的相关的。 |
|
m****s 发帖数: 18160 | 15 【 以下文字转载自 ME 讨论区 】
发信人: ltx8 (rug bear), 信区: ME
标 题: PhD opportunity available at Missouri S&T
发信站: BBS 未名空间站 (Sat Mar 23 15:49:34 2013, 美东)
PhD opportunity available at Missouri S&T. The project will focus
"Control of Additive Manufacturing Processes".
Project details are listed below:
Drs. Bristow and Landers at Missouri S&T have a project funded by the
National Science Foundation on the control of Additive Manufacturing (AM)
processes. This research seeks to create and analyze a Repetitive P... 阅读全帖 |
|
u***s 发帖数: 612 | 16 Green materail is not necessarily better. For example, I found a "green glue
" to substitute formeldehyde-based glue. But after reading its gradients, I
decided not to use it. Sure it doesn't have formeldehyde, but it could
contain so many other kinds bad chemicals, just not known yet.
during |
|
C*******d 发帖数: 15836 | 17 Yes, it is better than a whole lot with big gradient.
For people with small side lot, it should be OK, although it is always an
inconvenience to go between front and back yards, say for mowing and
gardening. But for people with significant side lot, like me, it is a much
bigger problem. |
|
p********5 发帖数: 7433 | 18 https://gouttreatmentsite.com/
They have a very good medicine. But now it is back ordered.
You may try to buy some from its 8 gradients from Puritan pride. May help.
*******
Are Urcinol's ingredients safe and effective?
The all-natural ingredients in Urcinol have been shown to be safe and
effective through clinical studies and have been recommended by healthcare
professionals.
Active Ingredients:
Turmeric Root (Curcumin):
An anti-inflammatory that is more powerful than Cortisone which safely
red |
|
c********e 发帖数: 496 | 19 anything with gradients like salicylic acid or cantharidin.
it comes back and forth many times. |
|
g*****j 发帖数: 1211 | 20 Active gradient in the product you mentioned: grape seeds, natural green tea
and Perilla frutescens seeds.
There is no evidence that such supplement can treatment allergy. There are
many effective treatment for allergy. Have you seen a doctor? |
|
S****a 发帖数: 2568 | 21 如果是新生儿,这个问题要特别小心,有可能会演变成moderate或severe degree,所
以要定期复查。开胸手术修复瓣膜或许是需要的。一般认为儿童有轻度pulmonary
valve stenosis是不影响生活的。
is
gradient
11
residual
5
.
regurgitation
catherization
mm |
|
b***p 发帖数: 1398 | 22 depends on the annulus size, it is possible to implant sapien3 20mm thv
during the open heart surgery. the s3 can be further expanded as the infant
grows, which could minimize the number of open heart surgeries.
is
gradient |
|
b********o 发帖数: 592 | 23 "one-a-day" has pretty much similar gradients as prescribed one |
|
b*****5 发帖数: 477 | 24 I'm drinking it. Not sure whether I have the right amount. How much do u
use for each I gradient?
★ 发自iPhone App: ChineseWeb - 中文网站浏览器 |
|
c*******u 发帖数: 12899 | 25 ☆─────────────────────────────────────☆
bb12345 (bb) 于 (Thu Aug 2 11:17:34 2012, 美东) 提到:
我的diet控制后的fasting还是100多,医生让吃glyburide。这个对baby是不是不好啊
?但是insulin会造成low blood sugar也不好。OB说glyburide没有坏处。很犹豫该咋
办?
☆─────────────────────────────────────☆
az (哥哥小弟和弟弟大哥) 于 (Thu Aug 2 11:21:16 2012, 美东) 提到:
insulin控制量不行吗?我打的胰岛素,医生说胰岛素是唯一无副作用的,因为本来就
是人体分泌的嘛
☆─────────────────────────────────────☆
bb12345 (bb) 于 (Thu Aug 2 11:33:12 2012, 美东) 提到:
怎么知道打得正好不多不少?
是有专门的monitor system?你打得insulin?
☆─────... 阅读全帖 |
|
c*******g 发帖数: 1 | 26 最近发现 大河家东西有大幅度下调,特别是我留意的宝宝产品。
加之Amazon mom 的 20% coupon (BABY2013) 给宝宝买东西可以省不少钱啊
Philips AVENT Microwave Steam Sterilizer 降价 9%
http://goo.gl/Le2cg
Evenflo Modern 300 High Chair, Trivet Blue 降价 9%
http://goo.gl/ofOt2
Chicco Cortina Keyfit 30 Travel System, Fuego 降价 15%
http://goo.gl/C9zJ7
DaVinci Alpha Mini Rocking Crib - Cherry 降价 8%
http://goo.gl/QgxO7
Baby Aspen Snug As A Bug Snuggle Sack, 0-6 Months 降价 22%
http://goo.gl/EGuWk
Evenflo Big Kid High Back SI Car Seat Booster, Amelia 降价 15%
http:... 阅读全帖 |
|
t*******r 发帖数: 22634 | 27 好吧,那是你们数学家的事。
俺们马工更关心收敛速度,conjugated gradient solver 啥的,反正老板不会让程序
跑无穷多时间。
另外记得 IEEE floating point standard 的 Inf 和 NaN 好像是符合分配率的。。。 |
|
t*******r 发帖数: 22634 | 28 我擦,steepest descendent 和 conjugated gradient 的 convergence 能一样么?。
。。当然站着说话不腰疼的挖沙工工头,总是可以对天以豪迈的姿势宣言: "秀才也是
才。。。"。。。 |
|
t*******r 发帖数: 22634 | 29 我家娃不学钢琴。
但泛泛而言,陪的最重要的目的,不在于父母学个啥,而是在于建立父母的换位思考能
力。conjugated gradient 不是说说就完了,得是 implementable。换位思考也是一样。
这个同时也是教娃 sense of purpose。
当然,酱油体育的话,父母的确可以顺便一起健身。。。 |
|
n**********4 发帖数: 2719 | 30 哈哈conjugate gradient都上来了。。
样。 |
|
t*******r 发帖数: 22634 | 31 有限元数值求解解偏微分方程组。
具体特殊方程还有更快速的解法,比如有限空间内的泊松方程,可以用离散 FFT 解,
快许多个数量级。
实际上,变量数目太大的线性方程,也不会直接去矩阵求逆,因为太慢太费内存。。。
一般用 linear conjugated gradient method 迭代求近似解。。。 |
|
t*******r 发帖数: 22634 | 32 计算机也做连续数学的,比如有限元解偏微分方程组,比如 conjugated gradient
method 做 non-linear optimization,等等。。。
当然,“真正的连续” 和 “真正的无限”,是理论连续数学家最后的防线。。。不过
信息学家 请 物理学家 cosmology 学家 在 后院 barbecue 了一回。。。
cosmology 学家酒后吐真言说:
“尼玛我们的 cosmos 多半既不是无限的也不是无限可分的。。。”
“其实这还不是真正问题。真正的问题在于,宇宙尺度大一号,或者量子尺度小一号,
基本都是要换模型的。你丫换模型能连续么?。。。”
“当然当然,也有疯子在搞 theory of everything,不过也很有可能最终落成个
theory of nothing 的下场。。。”
“我们退一步说,就算 theory of everything 搞定了,您说了,人类就不发现
新东东了?。。。发现了新东东,你丫不是还得换模型。。。”
“所以我跟你说,真正的无限和真正的连续,就是真正的扯淡!!!!。。。
你们信息学家扯那个蛋干啥,喝酒喝酒。。。” |
|
t******l 发帖数: 10908 | 33 有点这个意思。现代计算机,通过把 meat-computable 降级成 machine-computable,
有点 branch 了 高大上型的数学 vs 小矮挫型的马工学。
简单的,就好比 AMC 10 里的不等式题这种,代数思想不出错,按部就班就下来了。
稍微复杂点的,小学扣篮题延伸,不管啥多面体,按部就班一个一个环拆开,也就
下来了。不需要特别圆滚滚的球,老板爱啥形状,就做啥形状。
这些最后的目的,貌似主要都是电算。如果是电算的话,首先是严谨的思维和正确的
估计(因为最终不是自己手算)。电算里连数学归纳法证明都很少,类似的也都是递
归展开。(其中一个原因,也就是电算最终要算出个玩意儿出来,那玩意儿是啥,算
以前一般不知道)。你要是方法太巧妙了,这计算机也不一定能会意。
另外电算还要求表述是直接明了,否则没法马 code,计算机 take 不了太复杂的
抽象符号。(所以马工的非专业型的纯算法面试题,一般初中生都基本能看懂题目。
当然不一定能解。)
而工业界里电算解矩阵这种,很少用特别取巧的办法。即使线性矩阵一般都是迭代
求解(因为大矩阵迭代求近似解,更快。反正工业界都是近似,精... 阅读全帖 |
|
|
t******l 发帖数: 10908 | 35 如果撇开不谈 business 上的问题(business 首先是混,很多东西不一定做得出来),
谈下一代的教育的问题。从这个角度,比如就说这个 Conjugated Gradient 解方程:
马工要解决的是现实世界的问题,这些问题没有证明素数定理那么单纯。我们就先
退一万步,就算 CG solver 能够解出线性方程的理论解,你说现实世界有多少实际
能出货的问题,可以直接建模成无约束条件的线性方程组(鸡兔同笼、小明小芳除外)?
所以通常遇到问题客户大怒的时候,一般都不是 CG 的解的精确度差个多少个百分点。
常常遇到的情况,是客户要把菜放在锅里,而 CG 把结果解在马桶里(很多模型对
实际 constraint 的 handling 就是不对的,没办法,practically computable
/ implementable 的问题,常常也就是赌中率高点低点的差别)。
很多时候目前的 technology 还不一定有啥必杀的好办法。实在不行就只能跟客户说,
你就自己动手把菜从马桶里捞出来,随便洗洗再扔回锅里,烧成一碟回锅肉其实也能
出货卖。然后赌竞争对手的解也在马桶里,或者好点... 阅读全帖 |
|
t******l 发帖数: 10908 | 36 我自己来回答这个 self-awareness 的事儿吧。
我觉得,跟 wiki 上心理学研究病人不同。正常 “理性经济人” 的大脑,是不会给自
己(也包括自家娃,或者 close 的人),给一个客观 overall 的打分的。
原因很简单,我们的 evolution,不会让大脑 dump 自己而 depression,也不会让大
脑过度自恋而把人生都花在镜子前面,或者浪费在天天盼望跟情人打炮上面。
所以为了达到上面的目的,我们的大脑修改自己的记忆,不让自己对自己有一个客观的
overall 的打分。但是,大脑还是好比从 priority list 里面挑出最 make sense 的
任务去办。而剩下的是好是坏都视而不见。
或者比方说,大脑只看自己的一阶导数确定 steepest descend 或者 conjugated
gradient,而忽略自己的函数值本身。
话, |
|
t******l 发帖数: 10908 | 37 或者说,军医学的简化模型的思想的大方向并不错。
但是军医学有可能出的问题,就好比马工系的开会型老板,时而不时冒出来一句比如:
你们 conjugated gradient solver 能不能先把五百万 x 变量们统统先解完到精确值
,然后回过头来再解五百万 y 变量。多么 clean 的解决方案不是?
:这个 working memory 测试的 false positive / negative 的原因,是因为实践中
的 working memory 的效率,是 largely rely on chunking / encoding 的;而
:chunking / encoding 又 largely rely on schema,以及 perceptual memory 等等
其他的 implicit memory。 |
|
v***r 发帖数: 1046 | 38 【 以下文字转载自 Biology 讨论区 】
发信人: valar (和光同尘), 信区: Biology
标 题: 请教一个彩图转黑白梯度的问题
发信站: BBS 未名空间站 (Tue Nov 15 17:19:01 2011, 美东)
彩图是用HSV colormap代表不同的数据大小,已经存成tiff文件了。现在想把图转成黑
白梯度,但是HSV colormap转化gradient时,极大值和极小值都变成深黑的。哪位制图
达人指点迷津,不胜感激! |
|
d********y 发帖数: 6566 | 39 最近想开个plan,有这些免费的blackberry手机。请问哪款最好?
http://wireless.amazon.com/b/404251011/ref=upgradewidget_br_ph_
BlackBerry Torch 9800 Phone, White (AT&T)
BlackBerry Bold 9000 Phone, Black (AT&T)
BlackBerry Curve 9300 Phone, Grey (AT&T)
BlackBerry Pearl 9100 Phone, Red Gradient (AT&T)
BlackBerry Curve 8520 Phone (AT&T) |
|
f*******w 发帖数: 407 | 40 找人做两个网页,有意者请进
比常见的稍微复杂一点,但应该不会太难。请站内联系。
Prefer to be done using JavaScript and php.
Page # 1: a dynamic table with functions to add/delete row and column. The
content of the table, cell values, row/column titles, are all retrieved from
database. There is an "add new column"/"add new row" button at the corners
of the table. Clicking the button, the table will add column/row to the
existing table. The content of the cells of the added column/row are to
selected from drop down list shown in the ce... 阅读全帖 |
|
z*********z 发帖数: 163 | 41 Lol, should form a downward slope first. (a gradient drop) |
|
X****i 发帖数: 1877 | 42
No contradiction.
This is real life example.
I was not expecting short-squeeze when price was 21?
i.e. above 200 in the teens.
But later when I realize that TSLA was moving higher,
I know short squeeze is on and in that case, you ride
it via the uptrend line.
A review of past peak suggests 230 area as the probable
new peak. So I will use a tighter (i.e. higher gradient)
uptrend line, if necessary, as price nears that area, in
order to sell/short again.
Situation like this happens, and that's ... 阅读全帖 |
|
C*****5 发帖数: 8812 | 43 那个其实也只是介绍了forward/backward prop和gradient descent的基本概念,而且
都是shallow network,深的常用的cnn,rnn好像都没讲到。 |
|
J*X 发帖数: 1001 | 44 去哪里能下载到历史数据和一些比较重要的feature? |
|
|
g*********e 发帖数: 14401 | 46 跟boosting 有啥关系?你model先准备好 |
|
C*****5 发帖数: 8812 | 47 最近新出个library自动提取一堆feature的自己去找找,送进xgboost算算看。当作业
吧,反正算不出什么有用的东西。
数据pandas里自带的玩玩也够了。
你看,这不买nvda行吗?以后计算机教学都不写hello
world了,直接从mnist开始。 |
|
发帖数: 1 | 48 难道boosting 不就是一种树方法吗?大牛给科普一下。我道行浅。他没数据怎么搞模
,没法validate啊?真的道行浅,希望指点一二。现在器人操盘太厉害我也是努力跟上
潮流。
: 跟boosting 有啥关系?你model先准备好
|
|
发帖数: 1 | 49 啥library, 房哥给个名字吧
: 最近新出个library自动提取一堆feature的自己去找找,送进xgboost算算看。
当作业
: 吧,反正算不出什么有用的东西。
: 数据pandas里自带的玩玩也够了。
: 你看,这不买nvda行吗?以后计算机教学都不写hello
: world了,直接从mnist开始。
|
|
g*********e 发帖数: 14401 | 50 Boosting 是指把若干个算法的结果归总来决策吧 |
|