由买买提看人间百态

topics

全部话题 - 话题: 建模
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
r*****8
发帖数: 2560
1
来自主题: Translation版 - 请问生物研究人员……
分成2句说比较好。首先,要知道这个单位到底是做什么的?
电子材料可以合成、测量、分析。
电子设备可以操纵、测量。
建模,也许材料可以建模,设备怎么建模?
不知道他们做哪些项目,没法翻译。
j****u
发帖数: 1413
2
原文阅读请点击:http://www.ustcif.org/default.php/content/3042
相关阅读:《中国科大咨询业校友调查》http://www.ustcif.org/default.php/content/2445
近日,《中国科大咨询业校友调查》[1]引起关注。部分毕业生询问如何进入咨询业?
中国科大新创校友基金会向25位供职(或曾供职,下同)于著名咨询机构的25名校友发
出调查问卷。他们系统解析了中国科大理工科学子进入咨询业所需具备的素质、技能甚
至罗列的参考书。我们对咨询业校友反馈做了初步归纳,并在文后附上所有校友的调查
回答原文。
过去数年,新创基金会还曾发布《美国德州石油行业校友调查》、《Austin工业界校友
分布》、《从LinkedIn观察留美中国科大校友行业分布》、《揭秘中国科大律师军团》
并发起生命医学健康、化学行业夏令营。而新创基金会在未来一年来还将发布至少五个
学科与行业调查。
科大学子职业思考普遍迟缓,自身不够主动也是重要原因,我们期望本调查能对科大学
子有助益。
一:进入咨询行业需要哪些素质?
(一)软实力
(1)核心
思维能力:不仅聪... 阅读全帖
f*******d
发帖数: 637
3
【 以下文字转载自 Biology 讨论区 】
发信人: celler (celler), 信区: Biology
标 题: 浅谈生物信息的职业发展规划
发信站: BBS 未名空间站 (Sun Dec 19 14:37:27 2010, 美东)
这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
我觉得职业发展应该是广、深必备。
广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
广而不深的后果是没有确定的研究方向,总是给别人作工具;
深而不广的后果是在当今数据爆炸的时代发展机会少。
难点有以下几点,难度依次增加:
1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些
场合更高效一些。
2. 学习各种生物知识:一方面是书本知识,其主要功夫是在业余时间的利用上;另一
方面是实践知识,来自于生物实验室,交流为主。
3. 同时还得学习相关数学知识:这绝对是个难... 阅读全帖
g*****l
发帖数: 424
4
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
G***l
发帖数: 355
5
来自主题: Programming版 - 也谈OOP跟FP之争
这个贴子说的很好。我以前就说过,从建模角度来说OO描述data和data之间的关系很好
,但是描述behavior就有所不足。Design pattern里面,绝大多数都是用来弥补OO在
behavior建模上的不足的,这里面绝大多数FP都不需要。FP描述data没有OO简单直接,
但是当模型复杂的时候,behavior建模上强太多了。
关于继承我也很赞同。interface继承是类似FP的,因为interface只是标识了(多个)
function的signature。在OO里依赖一个interface,几乎和FP里依赖一个或者多个函数
type一样。class的继承完全不同。不知道你们有没有这个发现。我自己的经验是,用
java, c++, c#写OO的code这么多年来,interface的继承还在用,但是class的继承用
的是越来越少了。
G***l
发帖数: 355
6
来自主题: Programming版 - 也谈OOP跟FP之争
我说design pattern主要是解决oo里对behavior建模的不足有什么不对?哪里乱喷了。
gof二十几个,十几个是behavioral,creational,这两个都是行为。那剩下几个所谓结
构性的,只是用某种oo的结构解决behavior模型的问题,adapter,decorator,bridge这
些,哪个不是用来补充对behavior的建模的?可能只有composite,flyweight这两三个
关于data更多点。flyweight还是关于share data的,重点在share,还是一种对
behavior的建模。
e***m
发帖数: 92
7
来自主题: Programming版 - 设计一个大计算量的并行架构
谢谢大家的回复。
虽然建模要周期性的重复进行,但每次建完模,就需要立即知道模型以决定系统是不是
正常,所以对latency的要求很高。这可以被看作是一个实时监控系统。
相对于计算量来说,数据量并不大。因为是每两个数据源之间要做一次建模。如果有N
个数据源的话,就有N^2个建模。
我确实需要一个司令部来把数据源分发到不同的机器上,而且还要收集计算结果。
不太想用SPARK,因为这个问题里并没有太多的iteration,也没有什么中间变量要缓存
。SPARK可能不合适。当然,我没实战用过SPARK,不知对不对。另外,我一直觉得这个
问题很具体,对性能要求很高,不用SPARK而是直接从底层实现可能会更优化一些。
z****e
发帖数: 54598
8
来自主题: Programming版 - 设计一个大计算量的并行架构
需要汇总数据,所以用vert.x比较容易解决这个需求
其他server的话,汇总数据要自己写,bus要自己建,vert.x自己就有bus
可以直接用
然后latency这个需求,这个用异步可以很容易解决
看看rxjava的subscribe,把你需要callback的部分放到subscribe中去就好了
这样一旦建模完成就可以callback回来,然后你要怎么弄就怎么弄了
唯一的问题是这两个刚做出来没多久,可以参考的文档不多
不过本身你这个需求就比较另类,没有太多的轮子可以直接用
所以如果不怕文档少的话,就放手做吧
spark用起来比vertx麻烦不少,而且spark主要是建模容易
跟hdfs等数据源的接口比较容易做
如果你是自己建模的话,不用spark也没啥大不了的
做吧

N
r********s
发帖数: 149
9
来自主题: Biology版 - 外行也来读读汤超的cell文章
那看来我们得到了一些实验结果,提出了一个hypothesis,然后再建一个model,也是建
模了?可是,我们根本就不需要什么数学计算。
你用什么生物不都是dsDNA来反驳,有点强词夺理,这个所谓的模型的配对不止是适合
DNA的吧,是那些碱基的配对吧?碱基和DNA还是不太一样的吧?生物特异性是不
错,可是那是在另外一个层次上的,具体到遗传基因方面,所有的生物几乎都应该是一
样的吧?像这种简单的东西,现在已经被做完了吧,剩下的,你认为还能靠建模来解决
吗?据我所知,从watson and crick后,好像没有哪个生物学家靠建
模来解决一个重要问题吧?现在所谓的建模,只不过是总结已有的一小部分结果,还不
一定用的上。离解决真正的大问题,还差得远。而且,这些大问题能不能被建模,还是
一个问题。

dsDNA的
c****r
发帖数: 576
10
来自主题: Biology版 - 浅谈生物信息的职业发展规划
这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
我觉得职业发展应该是广、深必备。
广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
广而不深的后果是没有确定的研究方向,总是给别人作工具;
深而不广的后果是在当今数据爆炸的时代发展机会少。
难点有以下几点,难度依次增加:
1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些
场合更高效一些。
2. 学习各种生物知识:一方面是书本知识,其主要功夫是在业余时间的利用上;另一
方面是实践知识,来自于生物实验室,交流为主。
3. 同时还得学习相关数学知识:这绝对是个难点,会编程不等于懂数学。
4. 某一个方面深入。这里说的方向必须是生物研究的方向,而不是生物信息的方向。
我觉得以上几点都达到的话,从读博士起大概需要5-10年时间。
生物信息全才=生物+统计+建模+数据库+软件。
(建模指动力学上的,不是指统计建... 阅读全帖
g******o
发帖数: 4042
11
【 以下文字转载自 Military 讨论区 】
发信人: guaguabo (GuaGuaBo), 信区: Military
标 题: 矿大“女学霸”被保送清华生物系直博
发信站: BBS 未名空间站 (Sun Jan 12 18:10:54 2014, 美东)
又一个学霸毁了
=======
矿大“女学霸”被保送清华直博生
时间: 2014-1-9 来源: 中国徐州网-彭城晚报 编辑:尚靖凯 前往徐州社区参与讨论
核心提示: 大学期间,60余门课程平均分93.7分,其中44门达到90分以上,其中3
门为100分,10门为99分,学习成绩排名专业第一,发展素质分排名专业第一,四、六
级一次性600+通过,全国英语竞赛一等奖,国际数学建模大赛二等奖,连续三年获得国
家奖学金……在同学们的眼里,赵杰是个名副其实的“学霸”。
中国徐州网-彭城晚报讯 (记者 李小委) 大学期间,60余门课程平均分93.7分,
其中44门达到90分以上,其中3门为100分,10门为99分,学习成绩排名专业第一,发展
素质分排名专业第一,四、六级一次性600+通过,全国英语竞赛一等奖,国际数学建模
大赛二等奖... 阅读全帖
b*****h
发帖数: 3386
12

这一句很奇怪。你似乎又把模型和机理对立起来了。
根据已知机理建模,再根据模型探索未知机理。这是科研的常识。
没有几个科研是纯粹根据数据,没有已知legacy input, 建模的。
当然,中医很牛比,根据哲学阴阳五行就建模了。
j***h
发帖数: 4412
13
多多支持。我一直认为详图深化做过3年左右,再转到设计就会工资更高,或者是自己
接活,做。记得
以前在北京公司的现在他们一个团队都出来自己做了,还不错就成立公司。愿大家加油
,多挣钱,前
途更平摊。。
作者: 广航钢构 时间: 2011-3-4 20:12
真诚邀请朋友来我们公司!如果你符合要求,工资5000-8000,年终奖另计。
广州广航船舶钢构件制造有限公司
标题: 讨论下钢结构详图工资 [打印本页]
作者: zjthss 时间: 2010-12-6 10:57 标题: 讨论下钢结构详图工资
先后在两家钢构公司做过,详图工资都还可以,北京的一家详图组长工资,底薪5000+
提成,年薪大
概能到10万。浙江的一家,详图部门年薪平均7万左右。
大家都讨论下,详图设计的待遇。。。
作者: 空杯子 时间: 2010-12-14 14:39 标题: 待遇
你说的详图具体主要工作是什么?拆图或者是节点计算,或者两个都干?
作者: 新人新气象 时间: 2010-12-14 15:10
钢结构里面详图几乎是最没用前途的职业,除非你有惊人的体力,跟做鸭差不了多... 阅读全帖
g******6
发帖数: 782
14
来自主题: CivilEngineering版 - 准备换工作,大家给我把把关
不是 if care about or not, 这种modeling/analysis experience没有多少market
value, 公司里一般中级的工程师不适合做这种赃活,因为人家rate 高,但又不能给本
科生干,毕竟建模还是需要有研究生学历背景的,公司一般把这一类的赃活派给fresh
graduate 干,你一干就是五年了。公司把你这么定位的。
回头说说赃活的本质,modeling/analysis主要就是把图纸上的一根根构件建模,用STAAD
或SAP跑跑,说白了就是杆件的简化建模,技术含量不高,最后是纯体力活,你干了几
年,估计连一个完整的桥梁设计过程都没有参与,还不如一个本科生干了五年设计,人
家五年已经能够独立 lead a project. 所以,我说modeling/analysis experience没
有多少market value,你也够不上中级的位置,虽然你的工资已经到了。
不仅桥梁如此,我有一个朋友PHD 毕业就去做high rise building 也是如此,他从来
没有完整设计过一幢房子,以这样的背景很难走出去找到一个中级的位置,他自己都... 阅读全帖
a*******s
发帖数: 393
15
来自主题: CivilEngineering版 - 准备换工作,大家给我把把关
very good and insightful advice.
Mark Mark!

不是 if care about or not, 这种modeling/analysis experience没有多少market
value, 公司里一般中级的工程师不适合做这种赃活,因为人家rate 高,但又不能给本
科生干,毕竟建模还是需要有研究生学历背景的,公司一般把这一类的赃活派给fresh
graduate 干,你一干就是五年了。公司把你这么定位的。
回头说说赃活的本质,modeling/analysis主要就是把图纸上的一根根构件建模,用
STAAD
或SAP跑跑,说白了就是杆件的简化建模,技术含量不高,最后是纯体力活,你干了几
年,估计连一个完整的桥梁设计过程都没有参与,还不如一个本科生干了五年设计,人
家五年已经能够独立 lead a project. 所以,我说modeling/analysis experience没
有多少market value,你也够不上中级的位置,虽然你的工资已经到了。
不仅桥梁如此,我有一个朋友PHD 毕业就去做high rise building ... 阅读全帖
c****r
发帖数: 576
16
来自主题: Mathematics版 - Mathematical biology
你可以到生物版上问的,那边做相关研究的人更多。
生物背景的转到建模,比较有难度,因为数学基础不是一天两天就能打好的。你可以转
到生物统计或做进化相关的研究,更容易,而且目前也挺热门。
实验室同时做实验和建模,我觉得这是趋势,现在大家都喜欢冠名为"systems
biologist";不过也得看研究内容,有的领域更强调数据分析,主要是统计上的,而不
是建模。
P*****T
发帖数: 292
17
这只是其一
另一点是数学本身不建模,大多学科真正困难之处未必在数学而是在建模
经济大多数问题可能也是这样
再举一个更大的问题,人是怎么思考的?如何去建立这个模型?
可能n年(n可能会很大)后这个问题解决了并不用到特别艰深的数学
但就这个问题的建模难度来说,目前来看是没有任何科学家摸到了皮毛
P*****T
发帖数: 292
18
这只是其一
另一点是数学本身不建模,大多学科真正困难之处未必在数学而是在建模
经济大多数问题可能也是这样
再举一个更大的问题,人是怎么思考的?如何去建立这个模型?
可能n年(n可能会很大)后这个问题解决了并不用到特别艰深的数学
但就这个问题的建模难度来说,目前来看是没有任何科学家摸到了皮毛
g*****l
发帖数: 424
19
来自主题: Mathematics版 - 数据科学之江湖兵器谱 (转载)
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
g****t
发帖数: 31659
20
来自主题: ME版 - 关于FEA找工作的疑问
我说的这个水壶,开始没有图纸,形状都不知道,
怎么找中专生建模?
另外,例如水壶的热力学方面,非线性方面,
忽略掉还是不忽略,这些建模方面的约束问题,中专生能做?
最后,玻璃是弹性的,应该比塑料容易处理吧?

别的我不知道,国内五粮液酒厂的酒瓶子建模就是大专生做的,
我同学大学毕业拿不到毕业证的回四川五粮液干的就是这个,
水平比中专生能高很多是吧?
D*****I
发帖数: 8268
21
来自主题: ME版 - 【征文】:我与机械工程
最后几段完全不能苟同
画法几何机械制图都是培养的对于零件和装配的空间想象能力
你不能因为自己的因素就觉得那个没有用。你后来理解了就是因为在建模的过程中逐渐
练习了这个空间想象能力。其实很多的建模方法也就是大脑理解三视图的过程计算机化
了而已,还不是对一个sketch进行extrude或者revolve而已。
不会三视图,拿到张图纸怎么办?还要去建模一下不成?

业。
z***c
发帖数: 2959
22
来自主题: Quant版 - 脑子卡壳了,请指点
修改一句话:他可能计算错了,但结论可能还是对的,不会影响整个文章
我下面具体讲讲这个问题吧。
金融里面有个puzzle叫做disposition effect
就是大部分小股民在股票一涨就急着卖掉,股票跌了不愿意卖。
这个是不合理的,因为两点,一是考虑税,应该反过来做,二是
卖掉的股票通常会继续涨,跌了的会继续跌。mean reversion要超出
通常的持有期才会发生。
这个一直被认为和prospect theory有关,这个theory讲人赚了钱就
厌恶风险,亏了就变得喜爱风险继续赌一把,所以就有disposition
这个理论拿了Nobel奖,(看着似乎不复杂,但衍生出来的理论很牛,
尤其是一个中国人在2001年做出巨大贡献,使得原提出者2002年拿了
Nobel)
这个想法流行了20年,但一直没有人真正去建模,直到06年被人严格
建模求解,发现是错的:
按照Prospect theory,人应该股票涨了留着,股票跌了赶紧卖
这个建模求解过程蛮复杂的,结论就是disposition和prospect无关。
我说的这个文章更绝,他只是简单做了下数值模拟,发现如果是
prospect
l*******n
发帖数: 5
23
请问,那里可以找到可以下载的数据(health care area)? 我想下载来做一些建模练习。
我想成为health care 领域的data analyst,or data modeler, 请问我应该做哪些准备
,例如,请指出常用的数据建模统计工具,帮我指出哪里可以下载的health care 建模
的文章,health care 的一些教程等。
请知道的,不吝赐教,非常感谢!
o******6
发帖数: 538
24
☆─────────────────────────────────────☆
lookforin (look) 于 (Thu Jun 25 12:45:56 2009, 美东) 提到:
请问,那里可以找到可以下载的数据(health care area)? 我想下载来做一些建模练习。
我想成为health care 领域的data analyst,or data modeler, 请问我应该做哪些准备
,例如,请指出常用的数据建模统计工具,帮我指出哪里可以下载的health care 建模
的文章,health care 的一些教程等。
请知道的,不吝赐教,非常感谢!
☆─────────────────────────────────────☆
papertigra (长工胖头猪) 于 (Thu Jun 25 15:48:32 2009, 美东) 提到:
都是保密的。如果哪里可以下载,FBI就找上门了
☆─────────────────────────────────────☆
firstquant (IS) 于 (Thu Jun 25 17:14:0
a***g
发帖数: 2761
25
数学里也许有随机对应这个名字也许没有
但是这个不是数学对统计进行指导的必须条件
吴喜之以前讲报告的时候我听过他对统计学的认识
有一个观点我个人来说很赞同
他说统计有很多种统计文化
其中一个叫数据建模文化还有一个叫算法建模文化
管用数据建模文化最核心最传统的就是回归啦这些东西
那么大多的研究者还会想围绕无偏估计来研究模型
那么就要引入分布了嘛
从这里也自然要运用概率论
而分布是什么呢
是关于随机变量的函数也好算子也好它是一个对应了吧
那么随机变量又是什么呢
通常来说我们只关注一般数据的话
随机变量就是概率空间到实数的映射
这又是一个对应
那么合成的关系来看对应关系在这里已经成立了
一般也不会思考什么随机对应的关系
这算是我对其中一个问题的讨论
第二个就是什么是统计
其实我也算学统计的了
我本科学统计
研究生也学
不过到现在我比较不知道统计什么
当然这里不排除我资质的问题
我所感觉到的就是一个个统计方法一个的实际处理
没有用的不能处理好数据的统计方法有什么用呢
没有意义的
统计是什么这种问题本身值得关心么
还不如看看有什么新鲜的事
统计方法根据不同应用背景而需要各自不同的变化
遇到一个问题
y*****n
发帖数: 5016
26
来自主题: Statistics版 - 关于在银行做risk analysis
risk analysis 是一个相当模糊的词,如果单从risk analyst的title上看,既可能是
data analyst (即只做一些数据的工作和简单的统计分析,不涉及建模), 也可能是
statistician/modeler(主要工作是建模和统计分析), 还可能是business analyst
(既不需要做太多的数据工作也不需要建模和复杂的统计分析,主要是做一些比较直观
的商业分析)… 所以,你要看具体的job description来确定是哪一方面。
y*****n
发帖数: 5016
27
来自主题: Statistics版 - 统计作marketing方向的发展前途
金融+商业领域的统计分析和建模是一通百通的, marketing的统计分析和建模经验,
在转向credit risk 统计分析和建模的时候是完全可以被认可的。
p**********r
发帖数: 91
28
来自主题: Statistics版 - 统计&精算
想问问大家意见
本来因为想找工作更宽一点 所以考了几门精算 现在找到了一个统计建模的工作 精算
可能就暂时不继续找了
我想问 一般以后想找mid-level的建模工作 精算考试还会不会有帮助?还是只有保险
公司的建模会比较有用?(主要在考虑要不要继续考下去)
另外统计和精算大家觉得哪个以后工作比较有security.现在唯一一点我觉得精算不好
的是只能EB3因为一般本科就行了。
o****o
发帖数: 8077
29
来自主题: Statistics版 - C1 电话面经 (转载)
【 以下文字转载自 JobHunting 讨论区 】
发信人: cosx (MAT), 信区: JobHunting
标 题: C1 电话面经
发信站: BBS 未名空间站 (Sat Mar 2 13:23:32 2013, 美东)
周四上午做的Capital One电话面试,和大家分享
Technical question:
1, presidential poll. Obama 52%, Romney 49%, margin error 3%. What is your
conclusion?
2, Hypothesis testing. New mailing campaign vs. old mailing campaign
3, What is p-value?
4, What is alpha level?
其他的问题会穿插在你的回答中间,记不太清楚了。
Business case:
一个大学需要拉赞助,但只有有限的budget,改如何建模?可以向interview你的人随
便问问题,获取你建模所需要的信息。我问的是有关Alumni的问题,估计应该是朝这个
方向回答。
... 阅读全帖
n****n
发帖数: 11
30
现在大家都说大数据,个人翻了翻一些资料,发现相关的内容大致有两类:
1-Map-Reduce:就是用所谓的Pig /Hive/Hbase来调用Hadoop系统里众多Cluster的一
个不断搜索,查询,分类和整理的过程。这个过程的性质和现在大家普遍所熟悉的SQ
L功能相似,只不过是针对更大的量(PB/TB)和更复杂的结构(来自Web log/网络交
易/Social/甚至物理终端设备)。所以Map + Reduce就是个便于在这些数据中不断查,
不断合并的过程。
整理完的结果可以生成现在的RDBMS(彻底淘汰RDBMS是需要相当勇气的)。也就是说,
基本上,一旦数据整理完成,还是依然可以采用现在的方式来做模型,Predictive
Modeling, Scoring, Forecasting. 该怎么,就怎么,方法和程序不会太变化。尤其
是在金融行业,面对行业准则和政府法规,很难有大的变化在这上面。可能影响到的职
业或许会是:Business Intelligent, DBA, Database Programmer..etc 以数据准备
、整理和规范化作为主要职业的。这些是统计建模的... 阅读全帖
S*********1
发帖数: 105
31
来自主题: Statistics版 - 面经和教训
楼主最近被迫休假在家,今天想写下自己的经历希望对找工作的同胞有所帮助和启发.
楼主生统小硕毕业后因为家庭的原因一直在学校做生物统计工作,去年3月中决定找工业
界工作,当时只投了为数不多的几份工作,很快就拿到了一个保险公司程序员的OFFER,楼
主老公是名校的AP,平时主要是楼主带娃,就不想花太多时间在找工作上,取消了离家很
近的一个大药厂biostatistician的面试,从了保险公司的OFFER.
楼主去了保险公司才发现这份工作不适合自己,几乎很少学到新东西,几个月下来发现自
己的PROGRAMMING SKILL反倒退了.但是楼主还是幸运的,楼主进的组是保险行业里建模
技术方面数一数二的,楼主在建模方面学到了很多东西,为了能很快转组,楼主在业余时
间包括在公交上都在看文章看资料.因为楼主的SAS编程本来就不错,今年REVIEW的时候
老板给了很高的评价,并提到很快会PROMOTE楼主.这时候楼主的朋友告诉楼主他们组有
OPENING,楼主权衡了一下,决定冒险试试,楼主最坏的打算就是转组不成,没有PROMOTION
,楼主知道老板不支持欧转到MODELER POSITION,决定和... 阅读全帖
L********r
发帖数: 6
32
来自主题: Statistics版 - 近期有人去Wells Fargo面试吗?
我申请的位置是 Analytical Consultant 3, 在MO. 4/3到公司网站申请这个位置。4/
15收到HR 的email说他们决定给我机会走下一步程序,同时发来一份三页纸的表格,叫
我填更详细的自我介绍,我一看和Job description 一模一样。 老老实实填了,4/17
(deadline)把表格寄过去,几天过去了,一点消息都没有,但奇怪的是在公司的网站
上,四五天前同一个城市出来一个新位置Analytical Consultant 5,但是Job
description 和我申请的一模一样,这是什么情况呀?没看上我,又重新开始相亲了,
还是Wells Fargo 招聘程序本来就很慢。 我看见网上有人说他们家有群面,就是几个
应聘者在同一间屋子里轮流回答面试官的问题,是真的吗,哪让我这种不爱在人多的情
况下讲话的人怎么准备呀?
另外,这个位置不需要建模,主要用到SQL 和一些数据分析。要求比较多reporting 和
presentation。 我没有PHD学位,半路出家统计硕士,现在在一个大公司建模,有
10年工作经验,不是银行,没有用很高,大,上的建模方法... 阅读全帖
g*****l
发帖数: 424
33
来自主题: Statistics版 - 数据科学之江湖兵器谱 (转载)
【 以下文字转载自 DataSciences 讨论区 】
发信人: greatel (灵致), 信区: DataSciences
标 题: 数据科学之江湖兵器谱
发信站: BBS 未名空间站 (Sun Oct 9 16:57:10 2016, 美东)
【注】原发于微信公众号:data_wisdom
数据江湖,风起云涌。各路英豪,群雄逐鹿。
这是一个数据科学最好的时代,也是数据江湖最乱的时代。
那么在这么一个特殊的江湖里面浪,有什么兵器是值得我们去关注的呢?这篇文章列举
了一些常用方法(刀剑),并不涵盖工具与平台。就先让我们一起去看看这个排名不分
先后左右的兵器谱。
数据科学家Vincent Granville博士发表博文列举了数据科学家常用的45种技术。这是
个很适合初学者去逐个了解的列表。当然,这并不代表数据科学(统计学)的全部。虽
然他并没有提出自己的详细总结,但是有志于学习数据科学的同学不妨初步有个印象,
有不太熟悉的topic可以进一步去了解一下。另外我在后面也补充了我认为也值得学习
的领域,很多人都会在日常的数据实践中用到。多学有益于身心健康。
首先需要说明的是,这些技术... 阅读全帖
s***s
发帖数: 7178
34
分人
画画出身的觉得建模累
建模出身的搞一个这种写意的模也就半小时,剩下调材质打光不挑的话也就1小时撑死
小样大样,调整
出图就是点一下渲染
回头扔ps里调调色彩明暗
熟手估计怎么着2小时也够了
这种比赛,不管手绘还是建模
难的是创意
拼技术就输了
s***s
发帖数: 7178
35
分人
画画出身的觉得建模累
建模出身的搞一个这种写意的模也就半小时,剩下调材质打光不挑的话也就1小时撑死
小样大样,调整
出图就是点一下渲染
回头扔ps里调调色彩明暗
熟手估计怎么着2小时也够了
这种比赛,不管手绘还是建模
难的是创意
拼技术就输了
n****n
发帖数: 11
36
现在大家都说大数据,个人翻了翻一些资料,发现相关的内容大致有两类:
1-Map-Reduce:就是用所谓的Pig /Hive/Hbase来调用Hadoop系统里众多Cluster的一
个不断搜索,查询,分类和整理的过程。这个过程的性质和现在大家普遍所熟悉的SQ
L功能相似,只不过是针对更大的量(PB/TB)和更复杂的结构(来自Web log/网络交
易/Social/甚至物理终端设备)。所以Map + Reduce就是个便于在这些数据中不断查,
不断合并的过程。
整理完的结果可以生成现在的RDBMS(彻底淘汰RDBMS是需要相当勇气的)。也就是说,
基本上,一旦数据整理完成,还是依然可以采用现在的方式来做模型,Predictive
Modeling, Scoring, Forecasting. 该怎么,就怎么,方法和程序不会太变化。尤其
是在金融行业,面对行业准则和政府法规,很难有大的变化在这上面。可能影响到的职
业或许会是:Business Intelligent, DBA, Database Programmer..etc 以数据准备
、整理和规范化作为主要职业的。这些是统计建模的... 阅读全帖
e**********y
发帖数: 49
37
来自主题: DataSciences版 - 说说浅学ML的感受
我觉得做好marching learning还是要对统计和建模理解透彻,基本就不是一个fresh
phd可以干好的活,没有几年的处理经验,很难有那种数据建模的直觉。 基本统计系的
博士做理论多,做应用也不一定顶用,做cs的做算法可以,但是建模也不一定行。 现
在是刚开始,所以都可以,但是后面估计还是要分开的
e**********y
发帖数: 49
38
来自主题: DataSciences版 - 说说浅学ML的感受
我觉得做好marching learning还是要对统计和建模理解透彻,基本就不是一个fresh
phd可以干好的活,没有几年的处理经验,很难有那种数据建模的直觉。 基本统计系的
博士做理论多,做应用也不一定顶用,做cs的做算法可以,但是建模也不一定行。 现
在是刚开始,所以都可以,但是后面估计还是要分开的
E**********e
发帖数: 1736
39
刚进入这一行, 没有大牛带。 所以只能从书上的开始学习。只不过书上也是泛泛而谈
。不同的case,建模过程还是有点不一样。
lasso 的k fold可以决定一个shrinkage。 自己也可以选一个。这本质上没有不同。
最后实在40-50个变量效果最好(对应的auc大,变量少)。你这个方法对应的只是一个
model。 但是本身不能用来说你找到了一个好的model。 cross validation 是用来检
查你的modeling 是不是可行,是不是robust。一旦cross validation的model check
好的话, 就可以用数据一,二和三建立最后的model,用来预测将来的data。
现在用数据一和二来建模, 我完全同意,sample size 比较小。 不过cross
validation 是尽量避免用数据一和二来预选变量(从原来的1000多原始变量),这不
是我说的, machine learning 上建议的,最好用unsupervise的的方法选变量(就是
不要看response variable), 同时我建模过程中也察觉到这一点。
我估计大银行的mode... 阅读全帖
E**********e
发帖数: 1736
40
刚进入这一行, 没有大牛带。 所以只能从书上的开始学习。只不过书上也是泛泛而谈
。不同的case,建模过程还是有点不一样。
lasso 的k fold可以决定一个shrinkage。 自己也可以选一个。这本质上没有不同。
最后实在40-50个变量效果最好(对应的auc大,变量少)。你这个方法对应的只是一个
model。 但是本身不能用来说你找到了一个好的model。 cross validation 是用来检
查你的modeling 是不是可行,是不是robust。一旦cross validation的model check
好的话, 就可以用数据一,二和三建立最后的model,用来预测将来的data。
现在用数据一和二来建模, 我完全同意,sample size 比较小。 不过cross
validation 是尽量避免用数据一和二来预选变量(从原来的1000多原始变量),这不
是我说的, machine learning 上建议的,最好用unsupervise的的方法选变量(就是
不要看response variable), 同时我建模过程中也察觉到这一点。
我估计大银行的mode... 阅读全帖
m********o
发帖数: 233
41
上中学的时候,我的物理老师问我:“你说,学好物理的关键是什么?",我说:“不
知道。" 然后她告诉我,是学习建模的的方法;后来我上大学后,才发现建模不仅仅
是学习和研究物理的方法,在很多领域也是研究经济和社会科学的基本方法之一。
方舟子有这样的概念来研究这些文章,可是他建立的模型不够完善,有些原因结果比较
牵强,甚至有吹毛求疵之嫌,这是他不能让所有人信服的原因。
可是,去用这样的方法考虑问题没有什么错误,没什么好耻笑的。
还有就是模型的使用是否得当,即使一个好的模型,它也只能解决一个问题或一部分问
题,不是万能的。需要指出的是,鲁迅先生受过高等教育,他自认为成绩平平,未落第而已,
十分谦虚自勉;而且,这样一个重要历史人物,负面评价也是层出不穷的,更何况如今
的小辈们。所以用鲁迅先生成绩不优秀能写文章来作为韩寒是个天才,天生精通文墨的反证
也是很难让人信服的。
是是非非专靠网络很难断定,因为网络本身就是虚幻的世界;物质的真假还需呈堂供证以
辨黑白。
c***s
发帖数: 70028
42
记者近日从湖南卫视内部获悉,导演组顺应观众呼声增设的复活赛已提上日程,将为黄贯中、杨宗纬等淘汰歌手设计复活专场,得票最高者进入半决赛参与“歌王”角逐。更意外的是,此前因告假深陷退赛风波的齐秦,原定今日回归,在演出前几日再度告假“闪退”。
一场略显乌龙的停播风波,让《我是歌手》话题度持续攀升。自1月开播以来,这档“零宝典”引进节目在本土化移植过程中,收视率一路飙升,从“专业歌手走上PK台打响生存战”到“哭泣姐、经纪人过于抢镜”,好评、剧透乃至非议也随之被不断放大。记者近日从湖南卫视内部获悉,导演组顺应观众呼声增设的复活赛已提上日程,将为黄贯中、杨宗纬等淘汰歌手设计复活专场,得票最高者进入半决赛参与“歌王”角逐。更意外的是,此前因告假深陷退赛风波的齐秦(上图),原定今日回归,在演出前几日再度告假“闪退”。
惊喜 增设复活赛,淘汰歌者返场角逐
从黄贯中到杨宗纬,《我是歌手》两轮淘汰下来,勇于舍掉拿手歌曲的歌手接连失利,在观众中引发轩然大波,节目组也因此陷入质疑。不过,黄贯中与杨宗纬的真性情表现,一夜之间收获不少新粉丝,纷纷要求“复活”。记者日前从导演组一位内部人士获悉,尽管韩国原版并没有复活... 阅读全帖
i***s
发帖数: 39120
43
雪白的衬衫、阳光的笑容、时尚的发型,魅力足以闪耀整个舞台!“科学是我唯一的评判标准。”他说。全场掌声雷动。我手捧电脑,在黑暗的后台,几乎落泪。
他是魏坤琳。作为北京大学心理学系副教授、博士生导师,凭借阳光的外表和过硬的资历,魏坤琳在校园中早已颇有名气。如今,他以科学评审的身份加盟江苏卫视《最强大脑》——国内少见的一档专注于传播脑科学知识和脑力竞技的节目,更是令他成为国内电视屏幕上少见的科学明星。
回想三年前,我为“未来光锥”做科学星探时和他第一次约见,他拖着箱子从芝加哥直接抵达北大。“我要把你包装上舞台做演讲,还要采访你,让你成为科学家明星。”我手舞足蹈的设想着,他则一边不顾疲惫地演示实验室的各种装置,一面反复叮嘱我:“不要让人家觉得我总在玩啊!”
科学家本来不好写,庆幸的是,魏坤琳这三年,真的“玩”起来了。
用游戏帮助病人康复
虽然我和魏坤琳认识已经三年,但当我想为他做一个全面的采访和报道时,拿着他丢给我6个不同领域的论文,还是犯了愁:这些论文各自相对独立,既有基础研究,也有应用技术,怎么把他们穿成一条线索,真是为难。还是让我沿着记忆的线索,来简略描述我所知道的他的研究吧。
魏坤琳2... 阅读全帖
j********e
发帖数: 61
44
来自主题: Military版 - 闲谈GDP - (转贴)
转自西西河,作者:老广
闲谈GDP-前言
国民经济核算的帽子很大, 但主要还就是GDP统计。 所以老广也就只要以侃GDP统计为
主。实际上上次统计局重估GDP, 老广就冒了个泡, 还欠了文债. 欠债还钱, 天经地义.
所以这个系列也是为了还当时的债. 尽管欠的谁我早忘了。
只所以老广对GDP多说几句, 主要是10年本人读研时的课题有关. 开题时, 同学们都去
找有前途的课题, 比如金融啦, 资产评估之类的课题. 同宿舍的哥们就做了八一队资产
评估. 老广也顺便偷窥了一下郝董的财务信息. 老广当时也是血还有一点温乎, 毕竟咱
是经历过风波的, 平时总琢磨中国向何处去这类的大道理, 所以就选择了计量经济的课
题, 研究中国的宏观经济. 要建模, 就要摸数据, 老广建的模, 是粗制滥造, 其实
这也不能怪我, 作过中国宏观经济模型的大概都知道在中国建模是自己找罪受。老广
就受了两年罪, 不过受罪是受罪, 不过对中国的宏观经济数据倒是上下十八摸了一遭
。正脸没敢瞅,怕吓着自己, 但凹凸之处,还是了解的。就记忆所及,向大家作个交
代。
闲谈GDP (2)
开始GDP是估算得出的,真正统计上来的还
s*******y
发帖数: 988
45
闲谈GDP-前言. 40 老广 2006-11-12 14:36:38
国民经济核算的帽子很大, 但主要还就是GDP统计。 所以老广也就只要以侃GDP统
计为主。实际上上次统计局重估GDP, 老广就冒了个泡, 还欠了文债. 欠债还钱, 天经
地义. 所以这个系列也是为了还当时的债. 尽管欠的谁我早忘了。
只所以老广对GDP多说几句, 主要是10年本人读研时的课题有关. 开题时, 同学们
都去找有前途的课题, 比如金融啦, 资产评估之类的课题. 同宿舍的哥们就做了八一队
资产评估. 老广也顺便偷窥了一下郝董的财务信息. 老广当时也是血还有一点温乎, 毕
竟咱是经历过风波的, 平时总琢磨中国向何处去这类的大道理, 所以就选择了计量经济
的课题, 研究中国的宏观经济. 要建模, 就要摸数据, 老广建的模, 是粗制滥造,
其实这也不能怪我, 作过中国宏观经济模型的大概都知道在中国建模是自己找罪受。
老广就受了两年罪, 不过受罪是受罪, 不过对中国的宏观经济数据倒是上下十八摸了
一遭。正脸没敢瞅,怕吓着自己, 但凹凸之处,还是了解的。就记忆所及,向大家作
个交代。
作者:chnmb 回复日期:2
w*********g
发帖数: 30882
46
目前的地质武器(以及气象武器),在技术上还有着极大的局限性,就是只能采用四两
拨千斤的技巧,在大自然原有的基础上稍稍改变一下,因势利导,利用地壳原有的地质
裂隙和已经积聚在地壳中的能量,可以人为地改变一下地震发生的时间;可以让地壳积
能量一次性释放得多一点,从而增加地震的强度;如果这个裂隙和能量积聚带有一千公
里长,甚至可以稍稍改变一下地震的发生点,可以不一定是发生在这个裂隙中最脆弱的
地点。但不可能在没有条件的地点人为制造一场地震,也就是说,并不能做到指哪打哪。
目前,使用地震武器的主要过程和技术原理如下:
第一阶段,侦察阶段,其实就是地球物理勘探,与探矿类似,主要是探明地球板块
中应力积聚的位置、大小,地壳的薄弱位置,以及地下岩层的主要成份与结构。前几年
经常爆料,有外国研究人员在中国进行非法地质探测,当时很多人以为是为美国的卫星
地图进行实地校准,其实不是,实际上就是为地震武器攻击作探测。要知道,美国的卫
星地图并不需要到那么多地方进行校准的。
第二阶段,计算机建模。将侦察所得数据在超大型计算机中建模,并需加载天文、
气象实时资料,因为这对于地震的发生也有很大影响。这个工作,最近... 阅读全帖
R********n
发帖数: 5904
47
看了半天除了标注啥都没有。懂图像处理的可以做个三维建模,比对当时的照片和视频。
关键是,登月是有人还是无人。如果照片和3维建模不吻合,就更能证实作弊。
l******t
发帖数: 55733
48
来自主题: Military版 - 计算机干不过人类的游戏
电脑围棋突破的关键在形势分析建模。现在没有专业人士去建模,所以计算机就不会判
断。和计算力不是那么正相关。
l*******o
发帖数: 5673
49
原文地址:http://news.yahoo.com/chinese-supercomputer-named-worlds-fastest-005600823.html#
正文翻译:
原创翻译:龙腾网 http://www.ltaaa.com 翻译:英雄贵姓 转载请注明出处
论坛地址:http://www.ltaaa.com/bbs/thread-209786-1-1.htmlBEIJING (AP) — A Chineseuniversity has built the world's fastest supercomputer, almostdoubling the speed of the U.S.machine that previously claimed the top spot and underlining China'srise as a science and technology powerhouse. The semiannual TOP500 listing of theworld's fastest supercomputers released Monda... 阅读全帖
r***r
发帖数: 417
50
所有的音都可以准确地定位,就像米源器定义1米有多长一样。音阶并不是演绎者脑袋
里面定的。精确导致容易数字化,数字化了可以建模,建模可以找pattern,有了
pattern就可以创作,这一系列操作要运用理科的知识才行。逻辑是这样的,这么短的
文章读了连逻辑都没搞清,智商堪忧啊。
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)