S******y 发帖数: 1123 | 1 I am trying to under this -
Example of generative learning - in email spam
detection :
First, we learn what a spam email is like
(features...)
Then, when an email comes in, we immediately decides
whether it is a spam mail (based on what we learned
about spam mail or not..) |
|
|
b*****9 发帖数: 8922 | 3 ☆─────────────────────────────────────☆
mgtd (gener) 于 (Wed Aug 4 13:40:22 2010, 美东) 提到:
本人应届小硕,数学本科金融硕士,无任何工作经验
面临两个选择:
1.国开行某东南沿海发达地区省分行的业务员
2.董事长助理是一个太阳能制造企业的董事长助理,该公司在美国上市不久
纸面上的待遇1《2,个人比较犹豫
请教大家的意见
主要踌躇在
1算是体制内,但没背景的话未来也就是个业务,将来跳槽到其他银行,业绩压
力会很大
2起点比较好,但放弃金融业转投制造业让我心里多少有些狠不下来,而且未来的前景
不明
朗。不清楚将来能做什么
求拍砖
☆─────────────────────────────────────☆
mgtd (gener) 于 (Wed Aug 4 14:00:33 2010, 美东) 提到:
没人理啊。。。。不会吧。。。
☆─────────────────────────────────────☆
sutter (大公子) 于 (Wed Aug 4 14:04... 阅读全帖 |
|
b********y 发帖数: 559 | 4 两轮电面,今天被拒,我也不知道这算典型还是非典型,写出来大家看看吧。
第一轮:2个老美
先聊project,明显没有兴趣,于是直接开始问题目。
C++问题
1 map and hashmap difference
2 static variable 定义在member function里, is it thread safe
3 exception定义在constructor里会怎么样,定义在destructor 里会怎么样
4 能不能定义an array of smart pointers
machine learning 问题
1. difference between generative and discriminative model?
两种类型给个几个例子
什么情况用generative,什么情况用discriminative model,sample size大/小的话各
用什么
2. 我generative model给了naive bayes的例子,于是接着问我naive bayes的
assumption是啥,回答features are conditionall... 阅读全帖 |
|
d*****u 发帖数: 17243 | 5 这倒让我想起一个问题。
美国认知科学领域一直有generative学派和connectionist学派
前者注重逻辑化、符号化表达,后者注重网络化、统计性原理。
Chomsky是generative学派的主要人物之一,他对美国的心理学、语言学、AI等有重要
影响,但可能这种影响也造成某些领域二三十年停止不前。 |
|
|
|
Q*******1 发帖数: 91 | 8 怎么确定是否被学校坑了。给你看一个学校的课程表,你看看会不会被坑呢。
%%%%%%%%%%%%%%%这个是bgsu的课程设置
Fall
MSA 5020 Regression Analysis
MSA 5400 Database Management
MSA 5470 Exploratory Data Analysis
MSA 6010 Decision Optimization
MSA 6701 Analytics Project I
Spring
MSA 5160 Time-Series Analysis and Forecasting
MSA 5600 Business Intelligence
MSA 6440 Data Mining
MSA 6500 Big Data Analytics
MSA 6702 Analytics Project II
Summer
MSA 6450 Advanced Data Analytics
MSA 6600 Project Management
MSA 6703 Analytics Project III
%%%%%%%%%%%%%这个是S... 阅读全帖 |
|
Q*******1 发帖数: 91 | 9 怎么确定是否被学校坑了。给你看一个学校的课程表,你看看会不会被坑呢。
%%%%%%%%%%%%%%%这个是bgsu的课程设置
Fall
MSA 5020 Regression Analysis
MSA 5400 Database Management
MSA 5470 Exploratory Data Analysis
MSA 6010 Decision Optimization
MSA 6701 Analytics Project I
Spring
MSA 5160 Time-Series Analysis and Forecasting
MSA 5600 Business Intelligence
MSA 6440 Data Mining
MSA 6500 Big Data Analytics
MSA 6702 Analytics Project II
Summer
MSA 6450 Advanced Data Analytics
MSA 6600 Project Management
MSA 6703 Analytics Project III
%%%%%%%%%%%%%这个是S... 阅读全帖 |
|
j*******t 发帖数: 223 | 10 machine learning 前两问正好对应两篇paper。
第一篇是On discriminative vs generative classifier: a comparison of logistic
regression and naive bayes.
讲述两种类型model的优劣的,基本结论是discriminative model的error更低但是学习
过程慢,generative model正相反。
第二篇是the optimality of naive bayes,主要讲解为什么很多数据即使不满足naive
bayes的conditional independence的假设学习结果仍然不错。一个主要原因为很多
dependence可能相互抵消。
LZ有兴趣可以看看。 |
|
a*****g 发帖数: 19398 | 11 Attention, Students: Put Your Laptops Away
From NPR STAFF. James Doubek
As laptops become smaller and more ubiquitous, and with the advent of
tablets, the idea of taking notes by hand just seems old-fashioned to many
students today. Typing your notes is faster - which comes in handy when
there's a lot of information to take down. But it turns out there are still
advantages to doing things the old-fashioned way.
For one thing, research shows that laptops and tablets have a tendency to be
distract... 阅读全帖 |
|
d******e 发帖数: 7844 | 12 你的逻辑很神奇。
Probabilistic Models又不是解决问题的唯一方法,自然有它适用的范围,像图像和文
本,这种通常被认为存在一个generative process或者近似的generative process,我
用Bayesian有什么可指责的?什么问题都拿来套用当然不行,很多人乱做model,只能说
他们不严肃,并不是Probabilistic models有什么错。
同样,统计也不是什么问题都能解决,你这种极端的例子说白了就是抬杠。你去看看生
物里面传统的t检验管不管用?我需要的是解决问题,我管你本质的model是什么样,我
就这么建模,行得通就OK了。先解决问题,再去探讨本质,这种风格随处可见。
Machine Learning和统计都是工具罢了,能不能真正解决问题不是看工具灵不灵,而是
看用工具的人。
btw:把SVM只当成QP的同学,还是不要对机器学习来妄加评论了,呵呵 |
|
d*****u 发帖数: 62 | 13 我用过的书里面我觉得Ronnie Cann 的 Formal Semantics最好,这本书从一开始很简
单直观的东西讲起来,慢慢地建立一个越来越完备的语义系统。这本书是以蒙太古的语
义学为内容的,而且是英国人写的,所以有很多的地方和美国这边以Semantics in
Generative Grammar的符号什么不是很一样,但是这两本书比较起来我觉得初学者更应
该看Cann的书。很多人搞了半天语义学都有同样的问题,就是语义学到底做什么的?
Cann的书就讲得很清楚,semantics in generative grammar一上来就从语义解释规则
和语义组合原则上手,有点让人在技术细节里面迷失方向的感觉。
还有一本备受推崇的教科书,就是荷兰人Gamut写的两卷本的Logic, Language, and
Meaning,大概比Cann的书深一些,但是系统性很好。也是很多人强烈推荐的。
Chierchia and McConnell-Ginet的教科书也值得一看。但是这本书有点散,有的地方
比较罗索,不过这本书讲了一些语用学的东西以及一些别的书不讲的内容,适合作为一个主要的参考书。 |
|
S**b 发帖数: 1883 | 14 没有学过generative grammar? 语言学语法学这两门学科在20世纪没有人比乔姆斯基更
有影响力了吧?
当代学理科的不知道乔姆斯基就是侮辱自己的智商了。 |
|
|
J*******3 发帖数: 1651 | 16 http://www.indianexpress.com/news/us-offers-help-for-next-gener
美国已表示愿意与印度开发下一代航母技术,参观委副书记,国防部长阿什顿·卡特说
,星期三。
提供技术,电磁飞机弹射系统,将是一个质的飞跃,目前依赖于俄罗斯的滑雪发射技术
为印度海军。
无论是印度运营商,INS维克拉姆帝亚,在11月的到来,和维克兰特号,正在兴建中的
高知县,可以滑雪推出轻型战斗机。但EMALS将有可能推出重型飞机,包括早期预警系
统,加油机和运输,从未来船舶。印度尚未冻结计划建设维克兰特后的第二土著载体设
计。
卡特说,美国热衷于开发和合作生产国防装备与印度布拉莫斯行的,一枚导弹由印度和
俄罗斯联合开发,并出口到第三国提供。这样一种技术,可以共享下的国防科技倡议是
EMALS,卡特说。 “美国开发和部署该系统,并提供技术,印度有航母,并正在考虑使
更多的,”他说。
此外,共同发展提供下一代反坦克导弹,“卡特说。
标枪系统提供印度已经多年,但它从来没有进行切割,由于美国法律的限制,技术转让
,指导大部分印度的新的国防采购的一个关键因素。但卡特说,工... 阅读全帖 |
|
b********n 发帖数: 38600 | 17 http://nymag.com/thecut/2013/07/texting-exes-social-media-gener
All My Exes Live in Texts: Why the Social Media Generation Never Really
Breaks Up
BY MAUREEN O'CONNOR
I have 700 friends on Facebook, 36 of whom I consider exes. Not all are ex-
boyfriends—in the eleven years that “boyfriend” has been a name for men
in my life, I have referred to nine as “boyfriends.” The rest are men I
dated casually, guys I dated disastrously, make-out buddies, one-night
stands, vacation flings, and a few boys I n... 阅读全帖 |
|
|
j******s 发帖数: 42 | 19 一开始也有同感,觉得共和党真够搞笑,都有奥巴马8年的前车之鉴了,怎么又出了个
黑人,怎么可能有人选他。
但是看了他的采访和观点后,发觉此人颇有智慧,Trump和Hillary和他不是一个级别的。
现在最新的几乎所有民调,他都已经领先了Trump:
Carson's 29 percent is followed by Donald Trump at 23 percent, Marco Rubio
at 11 percent, Ted Cruz at 10 percent and Jeb Bush at 8 percent.
同时赶超了Hillary
http://www.realclearpolitics.com/epolls/2016/president/us/gener |
|
L****8 发帖数: 3938 | 20 【 以下文字转载自 Programming 讨论区 】
发信人: Liber8 (Space-Time continuum), 信区: Programming
标 题: 100伪币悬赏:CNN这个东西本质上处理不了形变
发信站: BBS 未名空间站 (Wed Nov 22 00:14:51 2017, 美东)
物体大形变 只能通过 data augmentation 进行题海战术 记住所有变化
物体形变 本身是连续变化 Lagrangian view
但是变成图像 用像素描述物体 就是 Eulerian view,所有的基本距离度量,在像素
空间内统统失效。
举个例子: 在MNIST数据集上
很多基于deformable model的算法 可以获得非常高的准确度 用很少的训练样本 完全
不用data augmentation
如果用DNN,那就非得data augmentation 才能获胜
100伪币悬赏 ---------------------------------------------
图像是一个三角形的瀑布从上而下流
两个任务
1)请设计一个多入单出的DNN regre... 阅读全帖 |
|
d*****u 发帖数: 17243 | 21 不知道有没有人做这类问题。
现在神经网络主要用来做分类和回归,或者一些generative model
用来搞证明也许是一个新的方向,你可以试试。
神经网络的本质是一个灵活的高维输入函数 |
|
发帖数: 1 | 22 deep learning其实就是 maximum likely hood estimation
已知一组observation (training)
然后去估计参数,什么样的参数,让出现这组observation的概率最大。数学基础非常
solid,不容怀疑。
当然和人类思维没半毛钱关系。
应用很广,不止是图像识别,自然语言处理。最近的Generative Adverserial Network
(GAN)就非常牛逼,可以以假乱真了。还有我见过有人用deep neural nets解简单的
Schrodinger equation。 |
|
k******a 发帖数: 2436 | 23 This seems to be the main thing for the Chengdu designers. Apparently, they
wanted to make the airplane’s equiva- lent body of rotation as narrow as
possi- ble. And they needed to make provision for internal carriage of
weapons, which is a characteristic feature for fifth gener- ation fighters.
In actual fact, the J-20 has much smoother cross section distribution
diagram than the F-22A Raptor, the F-35 Lightning II and the Sukhoi T-50 (
PAK FA or FGFA). Apparently, it required quite an ef- fort ... 阅读全帖 |
|
g**1 发帖数: 10330 | 24 http://www.indianexpress.com/news/us-offers-help-for-next-gener
US offers help for next generation aircraft carrier
The United States has offered to develop the next generation aircraft
carrier technology with India, visiting deputy secretary of defence Ashton
Carter said Wednesday.
The technology on offer, Electro Magnetic Aircraft Launch System, will be a
quantum leap for the Indian Navy that currently relies on the Russian ski-
launch technology. |
|
|
|
r***l 发帖数: 9084 | 27 http://www.realclearpolitics.com/epolls/2016/president/us/gener
起码目前看trump是共和党里面赢希拉里可能性最小的,压根就没领先过。
所以我说本版也不要太鄙视共和党的establishment, 更不要太自信觉的trump可以平趟
老太婆。像楼上说的,trump有死忠,希拉里也有死忠,这里很多人是希拉里的hater,
trump可能有更多的hater. 要是trump民调领先希拉里,共和党高层对trump的敌意也不
会那么大,明摆着如果trump选上提名人,共和党赢general election的几率不大的。
共和党高层也不喜欢cruz,看看目前民调就知道了,cruz vs. hillary基本是胶着,而
退选的rubio领先希拉里4%, 州长领先7%!
现实就是选trump去,小概率赢希拉里,但大家能痛快一下嘴和耳朵,最后可能输的裤
子都没了,州长或者如婊去,听不到什么埋在心里很久想说不敢说的话,但最后可以进
白宫庆祝胜利。
其实话说回来,但美国毕竟是民主国家,总统又不能一个人说了算,议会通不过还是白
搭。trump... 阅读全帖 |
|
|
|
|
|
|
w********r 发帖数: 1397 | 33 check if any leaks in your A/C system or the compressor still works to gener
ate cold air. |
|
B*Z 发帖数: 7062 | 34 很奇怪,居然这个没人贴。Highlights:
1. GM sales gained 1% -> recall和质量有关系么?
2. VW sales dropped 22% -> nm再不买vw,德国工程师不给你长翅膀了。
http://www.latimes.com/business/la-fi-hy-june-auto-sales-gm-for
140630-story.html
Business
June auto sales defy predictions; Chrysler has best June in 7 years
June auto sales
A row of 2014 Ford Motor Co. Focus vehicles sit on display at Uftring Ford i
n East Peoria, Ill. While most of the industry posted gains, Ford's sales fe
ll in June. (Daniel Acker / Bloomberg)
Jerry Hirsch contac... 阅读全帖 |
|
|
c**********l 发帖数: 606 | 36 I agree that we are in the hard asset phase in the hard vs. soft asset cycle
, greatly thanks to money printing. So your point of gold may outperform
stock and/or bond is well taken.
but we don't know it for sure. assuming gold and stock and bond all have
similar volatility and expcted return, by combining all of them, you will
still have the same expected return, but much lower standard dev. that's the
advantage of a balanced portfolio, vs. all-in a single asset.
the assumption is quite gener |
|
a*****2 发帖数: 423 | 37 找工作好难!好难啊!
如果大牛们组里需要界面设计师,或者前端开发 可不可以refer一下小妹我?
我的情况:
国内top10学校毕业,工科背景,但学的是数字媒体设计那一类的 有点偏视觉设计又有
点偏技术
现在在美国纽约的某设计学院读设计与技术专业,
教育背景都是有点强调编程的,所以作为设计师我编程水平还不错,前端开发曾经国内
工作时还被提拔为lead(虽然总共才3个人lead...)但不能跟cs背景的人比,那就输的
惨绝人寰
我找工作的迷茫就是 我特别喜欢跟视觉相关的一切,编程也都是关于可以看得见的部
分,比如界面(html和css) 交互动画(比如鼠标点了个啥,然后一个东西以某种动画
的方式呈现出来)或者是generative design(就是webgl 画好多particle做各种计算
机生成图像) 但是找工作的方向很窄 感觉好苦恼啊
大家帮帮我 纽约小公司很多,找了一圈在h1b问题上碰够足够的壁后 我觉得还是要找
大公司! 请在大公司工作的大牛们随手帮我推个荐,搞不好就能改变我的命运哎
如果有援手 我私信把我的resume和个人网站发去
大家对我这一行找工作有没有些指点啊 我... 阅读全帖 |
|
b*****o 发帖数: 715 | 38 现在ML的趋势就是不把model看成一个黑箱,比如大多数的generative model就是对
feature做某些限制,或者加上某种prior,从而有效的缩小目标空间。 就这个意义上
,feature和model是一体的。 |
|
b********y 发帖数: 559 | 39 感觉反了吧?我倒是觉得generative model学习过程会更慢,因为你需要 X的
distribution,这个是很难learn出来的。需要data sample足够多,而且过程复杂,比
如HMM,Gaussian mixture model 都比较复杂,但是naive bayes是个特例,因为有
independent 的假设。
第二个问题我面试完也想到了 :P,比如text mining的时候classify text的时候words
independency就可以忽略不计。
他们主要是做NLP的,所以问的问题都往那里靠。
logistic
naive |
|
j*******t 发帖数: 223 | 40 也许是我没说清楚,原话是
The results of the previous section imply that even through the
discriminative logistic regression has a lower asymptotic error, the
generative naive bayes classifier may also converge more quickly to its
higher asymptotic error. |
|
b********y 发帖数: 559 | 41 paper我还没看,但是我感觉是不是算logistic regression PK naive bayes的特例?
可以expand到所有的discriminative 和generative model都有这样的特性么? |
|
j*******t 发帖数: 223 | 42 这种比较很难完全公正,因为据我所知似乎没有同一个模型既是discriminative 又是
generative model,所以没法用完全一样的模型比较,只能用两个代表性的模型来比较
。那个paper比较短,而且比较通俗,LZ可以看看。 |
|
b********y 发帖数: 559 | 43 这2种model本身就是完全不同的分类,肯定是没有那个model同属于2类的。但是根据他
们的分类同种model有共性,我的理解是Generative model用的是joint distribution
要take care P(X,Y)所以一般比较复杂,需要数据量大,discriminative model只需要
考虑P(Y|X), 忽略X分布,所以是对问题的简化。并不能说discriminative 的error一
定小之类的收敛更快之类的。但是在数据量小的时候应该是prefer用discriminative的
。 |
|
|
x*******1 发帖数: 28835 | 45 对,就是这么简单,一下子就可以鉴别很多人。 讲讲怎么测试,更是区分度更高。
Junit, TestNG,Mockit, 有的candiadate 还用clojure 给出generative testing。
不太相信光是Leetcode能给出这样的答案。
data |
|
t****n 发帖数: 313 | 46 因为本来就不是。现在还谈什么regression, generative story那是老学究。 |
|
a*****h 发帖数: 36 | 47 本着国人互助以及传递正能量的真理,发一下我个人找工作过程中整理的machine
learning相关面经以及一些心得总结。楼主的背景是fresh CS PhD in computer
vision and machine learning, 非牛校。
已经有前辈总结过很多machine learning的面试题(传送门: http://www.mitbbs.com/article/JobHunting/32808273_0.html),此帖是对其的补充,有一小部分是重复的。面经分两大块:machine learning questions 和 coding questions.
Machine learning related questions:
- Discuss how to predict the price of a hotel given data from previous
years
- SVM formulation
- Logistic regression
- Regularization
- Cost function of neural networ... 阅读全帖 |
|
a*****h 发帖数: 36 | 48 本着国人互助以及传递正能量的真理,发一下我个人找工作过程中整理的machine
learning相关面经以及一些心得总结。楼主的背景是fresh CS PhD in computer
vision and machine learning, 非牛校。
已经有前辈总结过很多machine learning的面试题(传送门: http://www.mitbbs.com/article/JobHunting/32808273_0.html),此帖是对其的补充,有一小部分是重复的。面经分两大块:machine learning questions 和 coding questions.
Machine learning related questions:
- Discuss how to predict the price of a hotel given data from previous
years
- SVM formulation
- Logistic regression
- Regularization
- Cost function of neural networ... 阅读全帖 |
|
g******1 发帖数: 295 | 49 【 以下文字转载自 JobMarket 讨论区 】
发信人: gofor011 (gofor011), 信区: JobMarket
标 题: [内推] Research Associate (clinical laboratory, next generation sequencing)
发信站: BBS 未名空间站 (Wed Dec 7 23:42:20 2016, 美东)
email resume to arthurbuffet At hotmail dot com if interested
https://boards.greenhouse.io/guardanthealth/jobs/525188#.WEjjvrIrLIU
About the Role
We are looking for a Research Associate team member who will partner with
the successful delivery of world-class in vitro diagnostic (IVD) quality
products fo... 阅读全帖 |
|
l**********6 发帖数: 4 | 50 general contrator 10余年工作经验 活细,讲诚信。可做加建改建,厨房浴室,水木
电气,阳台楼梯,内外油漆,各式地板。联系电话:510-866-3334.联系人:刘先生 |
|