由买买提看人间百态

topics

全部话题 - 话题: 数据处理
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
m*l
发帖数: 507
1
其实做水资源这方面。大部分工作是数据处理。真正到计算,一般是由有经验的工程师
把关。
数据处理和水资源关系不大,主要是gis和数据库。
如果excel用的不熟悉的话,可以加强一下。
有计算机基础的可以学一点数据库sql什么的。
有可能的话,最好学一下gis。
至于那个软件,大部分都很简单。真正难的是hydraulics和hydrology理论。
g******e
发帖数: 210
2
做数据处理也不容易找到工作。因为有些数据是保密的。公司也不会招一个PhD做
简单的数据处理的。
w********h
发帖数: 12367
3
来自主题: Macromolecules版 - 对话施一公及其团队 (转载)
【 以下文字转载自 Biology 讨论区 】
发信人: tfmm (不是mm), 信区: Biology
标 题: 对话施一公及其团队
发信站: BBS 未名空间站 (Mon Aug 24 07:06:02 2015, 美东)
看一作小姑娘讲的,的确真够拼的啊!
发信人: feimeng (梧桐树,三更雨,不知多少春秋), 信区: TsinghuaCent
标 题: 对话施一公及其团队:世界级难题是如何破解的
发信站: 水木社区 (Mon Aug 24 13:15:21 2015), 站内
8月21日凌晨,一位德国同行的电话,打乱了清华大学生命科学学院院长施一公的工作计
划。这位德国同行,刚刚看到了《科学》在线发表的施一公团队撰写的两篇关于剪接体
结构及其工作机理的研究长文。
这几天,有关施一公的“新闻”不断。6天前的8月18日,他的研究团队刚刚在《自然》
在线发表了一篇研究长文,首次揭示了分辨率高达3.4埃的人体γ-分泌酶的电镜结构,
为理解阿尔茨海默症的发病机理提供了重要基础。翌日,他拟任清华大学副校长的任命
,进入公示期。
然而,这一次,施一公说,这两篇论文带给他的兴奋,超... 阅读全帖
w********h
发帖数: 12367
4
【 以下文字转载自 Military 讨论区 】
发信人: cfcyl (残废草原狼), 信区: Military
标 题: 鳖国科学院规划的有望实现创新跨越的重大突破(60 个)
发信站: BBS 未名空间站 (Fri Sep 2 06:09:07 2016, 美东)
8月31日,中国科学院发布“十三五”发展规划纲要,未来五年,中科院将围绕基础前
沿交叉、先进材料、能源、生命与健康、海洋、资源生态环境、信息、光电空间等八大
领域,提出60项有望实现跨越发展的重大突破和80项重点培育方向(均不含国防科技创
新),涉及器官修复与再造、大气灰霾追因与控制等多项与民生直接相关的创新方向。
有望实现创新跨越的重大突破(60 个)
(一)基础前沿交叉(8 个)
. 数学与交叉方向
(1)Langlands 纲领和千禧数学问题。通过数论、表示 论、代数几何和调和分析等多
个分支交叉融合研究,培育凝练 能够引导数学方向发展的数学问题与猜想,争取在
Langlands 纲领、Riemann 猜想、BSD 猜想等重大数学难题的若干方向上 取得与国际
数学科学大奖同等水平的成果。
. 物理与交叉方向
... 阅读全帖
w********h
发帖数: 12367
5
【 以下文字转载自 Military 讨论区 】
发信人: cfcyl (残废草原狼), 信区: Military
标 题: 鳖国科学院规划的有望实现创新跨越的重大突破(60 个)
发信站: BBS 未名空间站 (Fri Sep 2 06:09:07 2016, 美东)
8月31日,中国科学院发布“十三五”发展规划纲要,未来五年,中科院将围绕基础前
沿交叉、先进材料、能源、生命与健康、海洋、资源生态环境、信息、光电空间等八大
领域,提出60项有望实现跨越发展的重大突破和80项重点培育方向(均不含国防科技创
新),涉及器官修复与再造、大气灰霾追因与控制等多项与民生直接相关的创新方向。
有望实现创新跨越的重大突破(60 个)
(一)基础前沿交叉(8 个)
. 数学与交叉方向
(1)Langlands 纲领和千禧数学问题。通过数论、表示 论、代数几何和调和分析等多
个分支交叉融合研究,培育凝练 能够引导数学方向发展的数学问题与猜想,争取在
Langlands 纲领、Riemann 猜想、BSD 猜想等重大数学难题的若干方向上 取得与国际
数学科学大奖同等水平的成果。
. 物理与交叉方向
... 阅读全帖
b**********a
发帖数: 930
6
绝对第一个,任何药厂的化合物在in vitro测定后高活性化合物就进入in vivo的PK实
验,而in vivo的数据处理通常都由有PK经验而且有PhD的人来做,因为涉及到化合物的
代谢模型种类等很需要理论的东西,一般人都做不了此事。在动物PK参数的确定对后面
的研发起到很重要的作用。
你完全不用做实验,就是进行数据处理。不要犹豫,就选择这个吧。
x****h
发帖数: 300
7
好吊啊!
人家也没一定想玩数据处理,只是也许偶尔碰到一些数据处理而已,用matlab或origin
,只要知道用哪些函数,几分钟就可以搞定的问题。
居然为了一个拟和,还要去“了解“参数拟和的基本思路,还要去看什么numerical
recipes,比较搞笑
B*G
发帖数: 13438
8
来自主题: Physics版 - 王牧告闻海虎造假一事
密立根的数据处理不严谨这难道不已经是公认的了么,他那个年代,有情可原。这个博
主现在提密立根,还有啥数据处理的艺术,是要打自己脸么?搞材料的又不是做动物实
验,数据上不应该有这种模糊地带。79个点里面以集中的25点为中心画俩圈,剩下的数
据都不要,这比密立根狠多了。
E*******1
发帖数: 3464
9
来自主题: Physics版 - 王牧告闻海虎造假一事
我觉得闻的问题是,缺乏对数理统计的常识。不知道他是啥背景的,看来长材料这类学
科确实是无脑黑砖窑体力活,连基本的数据处理都不会。他这个做法,确实有操纵,但
不至于说是作假,因为他把灰色地带删了,这个本身应该放在error bar里面的。我觉
得即使不删,基本的物理现象木有问题,你想纳米这些破烂东西,噪声大了去了,
domain就那么小点,本来就木有多大意义我觉得,比起最后的数据处理估计实验中得到
数据的误差比这都大。大家就是灌个水,又不是什么定乾坤的物理实验,王这有点抓人
小辫,挺无聊的。
虽然不是这个专业的,但我知道大多数做纳米的,都这玩意,一块板上就那么一丁点好
的结构,拍张照,看上去很牛逼的样子,其实那机构是有产率还是个fluctuation都不
一定,比起这个,闻的工作也不比谁差
B*G
发帖数: 13438
10
来自主题: Physics版 - 王牧告闻海虎造假一事
密立根的数据处理不严谨这难道不已经是公认的了么,他那个年代,有情可原。这个博
主现在提密立根,还有啥数据处理的艺术,是要打自己脸么?搞材料的又不是做动物实
验,数据上不应该有这种模糊地带。79个点里面以集中的25点为中心画俩圈,剩下的数
据都不要,这比密立根狠多了。
E*******1
发帖数: 3464
11
来自主题: Physics版 - 王牧告闻海虎造假一事
我觉得闻的问题是,缺乏对数理统计的常识。不知道他是啥背景的,看来长材料这类学
科确实是无脑黑砖窑体力活,连基本的数据处理都不会。他这个做法,确实有操纵,但
不至于说是作假,因为他把灰色地带删了,这个本身应该放在error bar里面的。我觉
得即使不删,基本的物理现象木有问题,你想纳米这些破烂东西,噪声大了去了,
domain就那么小点,本来就木有多大意义我觉得,比起最后的数据处理估计实验中得到
数据的误差比这都大。大家就是灌个水,又不是什么定乾坤的物理实验,王这有点抓人
小辫,挺无聊的。
虽然不是这个专业的,但我知道大多数做纳米的,都这玩意,一块板上就那么一丁点好
的结构,拍张照,看上去很牛逼的样子,其实那机构是有产率还是个fluctuation都不
一定,比起这个,闻的工作也不比谁差
m********g
发帖数: 46
12
看来R的一个缺点是不能做大数据处理。那你觉得什么比R好,适合大数据处理?
Machine learning的东西哪些被看不起?难道你导师有很多更高明的办法?
f*****8
发帖数: 1
13
来自主题: Statistics版 - 求助:关于选择offer和潜在的offer
现在学校的一个部门让我对他们的数据做一些数据处理和统计分析,夏天的一个part
time project。
同时另外有一个比较大的公司有意向要给我offer summer internship,什么每小时多
少钱啊,relocation不是问题啊,能马上就做啊,都谈了不是问题;但是因为我是F1身
份,他们谈到如果internship完了要转正了,这个身份问题会比较难满足permanent职
位的要求,所以又拿去跟经理讨论,还没暂时有给我offer,说要take few days to
hear from the manager。
大家也都知道,这个经济危机的年头能有一个公司的实习机会不容易。很想去公司实习
,而且又是很match的搞统计分析建模数据处理,有experienced statistician带着,
不但能学到东西,而且又能积攒实际公司的经验。
这样的情况很头疼。公司的intern职位,经过面试之后对我感兴趣,想要我,但是因为
身份问题悬着,offer还不知道啥时候能下来,能否最终下来,学校的部门又在那催我
能尽快签掉。不知道该怎么办好。
如果学校哪个部门夏天的project
s*****n
发帖数: 2174
14
来自主题: Statistics版 - 怎样用R找出unique的record
你肯定是什么地方没弄对.
我的那个code和oloolo给的本质是一样的, 唯一区别是我是返回绝对值最大的数值(比
如ABS返回-5) 而oloolo给的code是返回最大的绝对值(ABS返回5), 按照你原帖的要求,
我那个更符合要求一些. 至于你说fold全变成NA, 肯定是你数据处理没搞对. 你可以
参考下面的code, 我把后面的数据处理也给你加上了. 50000行, 应该瞬间完成. 如果
你需要的是ABS返回5, 那就把tapply那行换成oloolo的code就好了.
data <- data.frame(
symbol = as.character(paste(
sample(LETTERS, size = 50000, replace = T),
sample(LETTERS, size = 50000, replace = T),
sample(LETTERS, size = 50000, replace = T),
sep = "")),
fold = sample(-15:15, size = 50000, replace
a********s
发帖数: 188
15
第二轮确实是技术面试,HR的人说了,相信技术类问题较多。
对于SAS,问的问题是偏数据处理呢还是模型? 看过一些SAS interview questions,
基本都是些数据处理,data step, function, statement, proc report, mean,
summary 之类的,很少涉及模型部分,例如proc reg, proc logistic等等。
统计的问题,不知道大家有什么好的资源没有? 在网上搜了一下,interview
question比较少见。。。

predictive
站,
等等。
l****u
发帖数: 199
16
来自主题: Statistics版 - RA工作内容写在CV上
主要的工作是处理或说准备数据,就是把那些不能分析的原始数据处理成可分析数据
。譬如DUPLICATE,数据的合并,SUBSET等。
分析多是一些descriptive的东西,包括FISHER,CHI-SQUARE。SURVIVAL ANALYSIS
类的活老板自己有想法用那个模型做分析,我只是按要求做结果出来,再写出分析结果。
问题1:这样的情况,在CV上写data management or analysis or what by using SAS?
Or how to descripe these experience.
问题2:有个project做了一年多了,另外几个就是几个星期到几个月。一年多的有时候
要到当地去收集一些相关的数据,主要是数据处理,数据一直在更新。短的project是
数据已有,只是按要求处理。这2类RA工作,CV上需要详略的区别吗?
问题3:老板申请了FUNDING项目,前期的数据准备工作我都完成了,申请上有我的名字
,不知道最终能不能拿到FUNDING,这样的要写在CV上吗?
硕士
多谢帮忙!!
y****d
发帖数: 432
17
来自主题: Statistics版 - [分享]SPSS中文视频教程--不容错过
简单说明:
有操作演示、也有讲解,还是不错的(是MM在讲,还有背景音乐,学着也不累)
包含内容:
第一部分 数据处理
第二部分 描述性统计
第三部分 数据分析
第四部分 因素分析
第五部分 回归分析
第六部分 相关分析
第七部分 专题讲座
详细介绍:
第一部分 数据处理
数据检查
数据输入
数据整理
第二部分 描述性统计
连续性变量的统计
非连续性变量的描述统计
正态性检验
第三部分 数据分析
方差分析
项目分析
信态分析
第四部分 因素分析
因素分析简介
因素分析原理
因素分析操作说明
因素分析实例
第五部分 回归分析
回归分析相关概念
回归模型选择
回归模型应用-路径分析
回归模型诊断
第六部分 相关分析
相关系数与数据类型
相关与回归
相关实例演示
相关散点图
第七部分 专题讲座
正态性检验
缺失值处理
标准差与标准误
卡方检验
t检验_方差分析_回归分析的综合比较
spss制图
集中量与频数分布的形态关系
均数比较
七种常用交互式绘图
四种重要抽样分布图
随机变量和固定变量
随机数生成
统计决断的两类错误及其控制
因素负荷矩阵旋转
原始分转化为... 阅读全帖
A**P
发帖数: 260
18
FE和学统计的干的不是一回事。SAS 大部分是以数据处理为主的而不是 algorithm。在
insurance,finance里面要找以大量数据处理为主的范围。比如说health insurance里
大量的claim data,信用卡里大量的transaction数据。这些东西,FE的人是没法或者
不屑去干的。但是公司的benefit design 或者anti-fraud的部门都有需要。
A**P
发帖数: 260
19
FE和学统计的干的不是一回事。SAS 大部分是以数据处理为主的而不是 algorithm。在
insurance,finance里面要找以大量数据处理为主的范围。比如说health insurance里
大量的claim data,信用卡里大量的transaction数据。这些东西,FE的人是没法或者
不屑去干的。但是公司的benefit design 或者anti-fraud的部门都有需要。
F******n
发帖数: 160
20
这个在某种程度上是个开放式的问题,现在都还有很多人在研发更新的方法和模型。当
然有很多已经建立的常规方法和工具。
首先这个应该和用C或者C++没太大关系,因为C、C++是通用性的语言工具而已。和具体
的软件可能有点关系,如果某种语言实现了处理大数据的模型和框架。真正有关系的应
该是关于大数据处理的模型框架和算法思想,说说我知道的吧。
关于模型框架方面的,最常规的就是并行计算模型。对于像特拉字节级别的大数据,多
进程的并行计算模型(比如老的MPI)和基于类似思想发展出来的新框架(谷歌的
MapReduce)都可以帮助大型数据处理。比如说,如果R实现了和并行计算包接口的功能
,就会有用。当然还有很多新的工具都针对大型数据的,比如最新的,Apache开源的
Hadoop。
关于算法思想上的,就是指的计算数据结构优化,统计算法的scalability。比如说你
可以用常规PCA来处理成千上万的数据点,但是如果数据点总量是特拉字节级别的,巨
大数量的协变量,你没法一次性读入到内存,更别说来一次运行PCA算法,所以你得批
量递增式的处理,要自己构造批量递增式的算法,但保证和一次性的PCA有一致的结... 阅读全帖
p***r
发帖数: 920
21
来自主题: Statistics版 - 求教:CS转统计
CS 独立性很强,专业毕业出来就是搞CS的,再多的我也不了解了。
统计是个附属性的行业,尤其是硕士出来,大多作数据处理,外加一点点统计应用,但
更多的是相关行业知识在就业之后还要不断学习,比如医药,你就会在药厂,医学院作
数据整理工作,金融相关,你就会在银行,信用卡公司作数据处理工作。我也刚工作以
后的路也不太了解,但感觉是统计进入任何一个领域都不难,但是在某个领域内你都不
是专家,只是辅助而已,至于上升空间,我觉得以后的造化根统计专业本身关系就不大
了。不想CS,可以更加精专。
另外,CS的就业市场确实是比统计要容易很多,当然我现在的感觉是统计一旦找到了
第一份工作,后面的工作也不难找了。
综上所述,统计是一门很宽泛的专业,学完之后并不能帮搂住在毕业后的求职上有更明
确的定位。如果搂主喜欢统计,可以学,但是如果对以后的就业领域有明确的目标,不
妨直接去学个相关的专业,比如finance, health care 这些专业也要学统计知识,工
作中要用到的都能学得到.Bless
p********a
发帖数: 5352
22
来自主题: Statistics版 - [合集] 求教:CS转统计
☆─────────────────────────────────────☆
sukides (bmh) 于 (Sun Aug 14 18:11:42 2011, 美东) 提到:
在本版转了半天,发现CS和统计真是一个大坑,冒险再挖一个,希望大家给些建议。
女友是国内top2的cs master,准备今年申请明年过来。初步确定准备申个master然后
找工作,但没定是继续读cs还是转统计。
转统计主要是基于几点考虑,一是看版上大家说统计的工作轻松,比较适合女生;二是
因为对比了我们现在考虑的几个项目(芝大和西北),发现统计的学费相对便宜;三是
学了统计可能就业面就广一些。
她本人没有特别偏好。请教一下大家,对于这样有cs背景(国内本科+国内硕士)的女
生,从来美国找工作(prefer在芝加哥)和以后职业前景考虑,是应该统计还是cs?
☆─────────────────────────────────────☆
wingwinfly (wingwinfly) 于 (Sun Aug 14 19:28:16 2011, 美东) 提到:
CS找工作比统计容易多了 你自己... 阅读全帖
y***n
发帖数: 51
23
mitbbs太烂了。我花了半小时给你敲得回复总说验证码错误。 然后什么都没了。长话
短说吧:
1.找统计工作前能攒到相关经验最好,没有也要想办法弄点数据处理经验,不如HR那关
都很难拿过。可以去医院或医学院老师那里找volunteer,或者找个有intern/
practicum requirement 的program。 你看看这个吧:A Modern Approach to
Regression with R (Springer Texts in Statistics) By Simon J. Sheather。 这本
书的网站上有code和数据,动动手
2. 想在医院做,看看clinical trial & mixed-effect model
3.另外两本书找其他工作有帮助: data mining/machine learning
4. 如果你是男生,或许不会喜欢统计数据处理工作,我前同事就是。有条件可以考虑
去转math finance.我身边很多人转这个方向,
j***3
发帖数: 20
24
来自主题: Statistics版 - 大妈求助:接受offer还是继续找工
找工4个多月,最近有一个offer,不知是否应该接受,也对自己找工方向有疑问,上来
请教各位前辈。
我的背景:
1. Social science 方向,但是对数据处理很感兴趣。Ph.d.期间做了一些项目都与数
据处理有关,主要用SAS。有处理大型数据的经验。几年前拿到SAS BASE programmer
证书,最近拿了SAS advanced programmer 证书。SAS Proc sql 很熟。Sql server会
一些但没什么经验。Communication skills 一般。
2. 我想找data analyst, sas programmer之类的工作,但是发现此类工作很多需要
healthcare, insurance, market research方面的背景,但是这些背景我没有。
3. 几年前修过几门statistics的课,但是现在需要pick up。所以statistical
programmer 的工作对我来说难度较大。
4. Ph.d.刚毕业,但是已属大龄。Ph.d. 期间有了宝宝,照顾孩子耽误一些时间,毕业
时已是大龄。
最近的offer在西雅图(... 阅读全帖
L*********1
发帖数: 278
25
来自主题: Statistics版 - 学校申请,是被拒了吗?
申请了两学校的硕士项目,一个学校据了,原因是材料到太晚了,超DDL近一个月,建
议先non degree seeking 上课,数理统计12。我是跨专业的,所以觉得可行。但是要
一年,因为这个学校没春季录取。
另一个学校没截止日期,工资效率很慢,材料上上周刚从国际学生办公室到转到系里,
昨天等不了了,因为之前那个学校问我要不要先上课。我就发邮件给系里老师问有没有
出录取结果,她回复Yes, we made a recommendation at the Department level, and
the file has been routed back a few days ago.The final decision will come
from ISO,If you do not hear any news in 1-2 weeks, I suggest that you
contact ISO again.
看到这话我感觉不好,今早电话ISO了,对方说她没权和我说录取结果,等信吧,要么
去问系里。这个就是被拒
的节奏吗?
我本科根本没想学统计,后来在工作中由于做数据处理分析,... 阅读全帖
a******c
发帖数: 291
26
关于SQL和统计职位。
- 我同行中大家都会SQL,但还没有听说一个有SQL Certification,估计这是给数据库
管理的人(类似于DBA或Data Controller)使用,而他们几乎都是Computer Science专
业的毕业生。假如你是申请statistician或data scientist的职位,不需要考这个证书。
- 你只需在网上下载一些简单的教程书(前面已经提到)。网上还有一些SQL的互动教
程,可以动动手,多练几次,估计也就花一天的时间即可,你就可以在简历的Computer
Skills上加上SQL。
- SQL是最最简单的数据处理工具,简直可以说“没有任何技术含量”,只做数据连接
和加减乘除,因此大学里几乎不教(大概除了商学院的MIS专业之外)。你修统计课时
,教授也不会提。但SQL却是最最常用的数据处理工具,可以说用途比SAS还要广。你在
简历上注明懂SQL,等于给自己增加了很多机会。另外,SAS和SQL是很好的结合。
- 假如你可以使用SAS,也可以熟悉一下PROC SQL用法,然后在简历里注明自己懂SQL。
- SQL有多个版本,如MS SQL, ... 阅读全帖
a******c
发帖数: 291
27
关于SQL和统计职位。
- 我同行中大家都会SQL,但还没有听说一个有SQL Certification,估计这是给数据库
管理的人(类似于DBA或Data Controller或SQL Developer)使用,而这些人几乎都是
Computer Science专业的毕业生。假如你是申请statistician或data scientist的职位,
只是SQL的end user,不需要考这个证书。
- 你只需在网上下载一些简单的教程书(前面已经提到)。网上还有一些SQL的互动教
程,可以动动手,多练几次,估计也就花一天的时间即可,这样就可以在简历的
Computer Skills上加上SQL。
- SQL是最最简单的数据处理工具,简直可以说“没有任何技术含量”,只做数据连接
和加减乘除,因此大学里几乎不教(大概除了商学院的MIS专业之外)。你修统计课时
,教授也不会提。但SQL却是最最常用的数据处理工具,可以说用途比SAS还要广。你在
简历上注明懂SQL,等于给自己增加了很多机会。另外,SAS和SQL是很好的结合。公司
里往往用SQL来取数据,做报表,而一旦要建模和做比较复杂的分析,... 阅读全帖

发帖数: 1
28
来自主题: Statistics版 - 五月毕业的统计master求内推&建议
不好意思,回复晚了!收到第一个回复好开心~~
我感觉还可以,实习和上学一直用的R,stringr, dplyr, ggplot2, sqldf,
RandomForest, xgboost, foreach, apply之类的用的都挺熟。因为实习需要, 所以
需要读大量前人写的代码,并且写很多if else保证程序能跑过各种可能的情况,优化
算法提高速度这样,也经常帮老板debug,写function,写自动的小程序满足数据处理
和画图任务。课上会用R做数据处理和关于statistical learning的project。也用R做
过Kaggle的projects,成绩还行。
感觉现在接触的东西比较固定,还是有很多新的要学的~~您觉得R的水平对找工作很有
帮助吗?
w*****3
发帖数: 910
29
Link:
http://mp.weixin.qq.com/s?__biz=MjM5MDAxMjgyMA==&mid=200071904&
医疗行业是可穿戴设备市场潜力最确定,未来将被“颠覆”得最彻底的领域。随着新技
术的创新,医疗行业的各个细分领域,包括诊断、监护、治疗、给药等各个环节都将全
面开启智能化。
国泰君安研报认为,移动互联网、可穿戴设备、大数据的新技术正在颠覆我们对医疗的
认知结构,传统的医疗器械和医院的商业模式或将被全面颠覆,国内大量优秀的企业将
全面进军新医疗领域,是未来投资的方向之一。具体内容如下:
1.医疗行业:颠覆进行时
“颠覆”正成为今年度实业界和资本市场的关键词,基于移动互联、穿戴式设备、大数
据等新一代技术正在快速颠覆各行业的生存业态,在迅猛发展的医疗领域,这些新兴技
术与新商业模式的结合正在全面颠覆我们以往对医疗的认知结构,可以预见,医疗的各
个细分领域,从诊断、监护、治疗、给药都将全面开启一个智能化的时代,结合商业医
疗保险机构,全新的医院、患者、保险的多方共赢商业模式也在探索中爆发,基于医疗
大数据平台的诊断与治疗技术也将把个性化医疗推向一个前所未有... 阅读全帖
f**d
发帖数: 768
30
来自主题: Neuroscience版 - 谈谈对IBM Blue Brain Project看法吧
请大家都谈谈对BLUE BRAIN PROJECT的看法,
Henry的用意是好的,充分利用所有的实验数据,重构大脑的皮层数学模型,探讨
皮层工作的机制和智力产生的基础。
但个人认为该计划有荒谬之处。
一个计划好与坏,在于现实与否。
他提出这个计划,其实就是全世界范围的理论和实验的神经科学家都一起合作,
2015年都根本不可能完成复制猕猴的大脑,更不可能解析皮层工作机制。
换句话说,想法是好的,--想搞个数学模型,搞清楚大脑是怎么工作的
(---谁不想阿!)。但这里头的每个小步骤都或者是当前最热的领域,但还
根本没搞清楚怎么回事;或者就是技术手段根本没到位--有待实验技术上有了突破
才行。所以HENRY的做法形成的结果就是,以一个IDEA,赢得数亿美金赞助,然后
做着数百个实验室都想完成的事情,结果就是10年后做出的东西是个脑模型简化版--
现在已经有N个这样的简化版--人家都是没花多少钱搞出来的。
当然不可否认,认真做,钱又多,能够得出很多有意思的中间结果。
但要点是,不能因此忽悠大家,说你要做什么事情了,然后还希望把整个世界的神经科学
方面的资源都拿来为你服务。
以下是几年前的报道... 阅读全帖
m*********r
发帖数: 119
31
来自主题: DataSciences版 - 想转行Data Science, 求建议
关注这个版很久了 看到这个版很活跃
版主和其他朋友也一直给很多人建议和支持
今天弱弱说明下自己的情况求建议
目前是PhD在读 方向是Cognitive Science
明年毕业 两年前决定不走学术道路
后来发现Data Science是个不错的方向
自己也博士期间做的东西多多少少也有些相关吧
自己目前的技能有:
统计方面有一般的统计,Bayesian Analysis,Statistical Modeling
编程方面主要是computational language,包括Matlab, R和python比较熟练
数学方面小白,就一般的大学高等数学的知识
计算机方面也很小白,除了上过一门machine learning的课程和基本的算法知识(而且
忘得很快。。。)
自己的research上用的数据分析是一般的统计分析和数学建模,没有与大数据处理相关
的经验;当然,准备在博士论文中争取添加对于比较大的online dataset的行为分析
我对自己的认识是:
对于数据处理和分析自己是喜欢的;enjoy machine learning的东西,希望以后工作中
可以多多学习和运用;对于大数据... 阅读全帖
p********y
发帖数: 6
32
来自主题: DataSciences版 - 物理驴:我有机会搞搞data scientist吗
物理屁挨着地,现在做一个research工作,工资低,月光,过几年就40了,天天混这样
的日子真心烦,做faculty没希望,工资也没有希望大涨,可怜的每年加2%吧。
有一些C++编程经验,自己编过数据处理程序,我Phd我POSTDOC做了很多数据处理的工
作。现在工作空闲时间有,想学习,不知从哪入手。个人想自学统计和数据库,再在编
程语言上花点功夫。问题是这样学下去几年后一个这样的中年人有可能找个数据相关的
工作吗,大家说说吧,先谢了您那。
m***r
发帖数: 359
33
来自主题: DataSciences版 - 大数据日报 2015年2月楼
大数据日报 2015-02-25
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-02-25/short.html
1) 【我为什么选择MongoDB】 by @IT技术博客大学习
关键词:数据库, MongoDB, NoSQL
【我为什么选择MongoDB】 大概在08年,那时候nosql的概念特别热,最早的那批开源
项目好多参考google bigtable来设计,我也关注过其中的几个,比如hypertable,
couchdb之类,阅读了一些相关的文档和... 详见: [1]
[1] http://blogread.cn/it/article/3662?f=wb
2) 【Apache HBase高可用性的新阶段】 by @LUPA开源社区
关键词:计算框架, 数据库, Hadoop, HBase
【Apache HBase高可用性的新阶段】Apache HBase... 阅读全帖
m***r
发帖数: 359
34
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-16
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-16/short.html
1) 【神经网络语言模型】 by @火光摇曳Flickering
关键词:深度学习, 算法, 自然语言处理, Geoffrey Hinton, 神经网络
[我们是这样理解语言的-3]神经网络语言模型 | 火光摇曳 本文根据神经网络的发展历
程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003
]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变
形。 [1]
[1] http://t.jiathis.com/7tzZg
2) 【利用文本和可读性特征分类垃圾邮件】 by @iB37
关键词:会议活动, 算法, 资源, 自然语言... 阅读全帖
m***r
发帖数: 359
35
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-16
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-16/short.html
1) 【神经网络语言模型】 by @火光摇曳Flickering
关键词:深度学习, 算法, 自然语言处理, Geoffrey Hinton, 神经网络
[我们是这样理解语言的-3]神经网络语言模型 | 火光摇曳 本文根据神经网络的发展历
程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003
]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变
形。 [1]
[1] http://t.jiathis.com/7tzZg
2) 【利用文本和可读性特征分类垃圾邮件】 by @iB37
关键词:会议活动, 算法, 资源, 自然语言... 阅读全帖
I**********y
发帖数: 38
36
来自主题: DataSciences版 - 刷kaggle对找工作有用么?
顶, 我和楼主一个心态。
目前同时学习基于Python的数据科学基础知识,同时一有时间就熟悉Java。
因为本科是物理,所以有C/C++基础(所以学习Java没那么抵触),而且基于Matlab的
数据处理和coding因为职业关系一直在做,所以对coding本身不排斥(尽管Matlab不是
很好的通用语言)。
本人从事基础科学研究,对未来美国的基础研究前景不看好,尤其新政府上台削减研究
经费。
我觉得好的数据处理的能力在任何行业都是必需的。
给自己半年时间,假设本行业在半年年不存在,怎样找到一个下一个工作。
从长远来看,觉得数据科学可能就是所有学科的必修知识。就像物理和数学一样。
p*****g
发帖数: 6270
37
http://yule.baidu.com/feidian/news/2009-02-03/175555212583.html
湖南卫视·百度娱乐沸点2008年度盘点 第二次公布榜单(2007.12.01-2008.09.30)
最热门内地女歌手
评选最热门内地女歌手的奖项,百度更推崇那些专注于歌坛的、纯粹的好声音。因
此,2008年度之内,歌手及其单曲、专辑作品在百度MP3搜索的数据,是湖南卫视?百度
娱乐沸点2008年度盘点中,评判“最热门内地女歌手”奖项的唯一标准。
同时,为了保证公正和全面,对于歌手之前发行、且仍有较高检索量的专辑和单曲
,百度按照时间顺序进行了合理的数据处理,同时对于有合唱内容的专辑和歌曲也进行
了合理的数据处理。
百度期望找到那些2008年最好最纯粹的声音,只唱给热爱且懂得的人听。
第1名 张靓颖 百度搜索:438,486,360次
第2名 周笔畅 百度搜索:378,705,351次
第3名 李宇春 百度搜索:321,639,396次
第4名 谭维维 百度搜索:286,328,157次
第5名 韩晶 百度搜索:112,813,605次
07年底,张靓颖发行E
G*******m
发帖数: 16326
38
把数据处理一下,看起来毫无规律。
净增加人口,年平均是1258万/年。
59年到64年,净增加人口,年平均也是1220万/年。
统计数据明显是有问题的。
年份 净增加人口 加速度
55 1249
56 1288 39
57 1602 * 314
58 1138 -464
59 1685 547
60 -698 -1383
61 249 947
62 1816 1567
63 2306 510
64 1949 -357
n*******e
发帖数: 1141
39
http://news.163.com/10/1026/02/6JT0C4QV0001124J.html
国家测绘局证实网络地图数据来自国外卫星
2010-10-26 02:56:41 来源: 新京报(北京)
核心提示:日前,有网友在其博客上称,“天地图”使用的卫星地图并非具有“自主知
识产权”,称数据应该是来自美国DigitalGlobe公司,而谷歌地图就是使用该公司的高
分辨率的商业图像数据。10月25日,国家测绘局有关人士回应称,“天地图”卫星图像
确实来自商业卫星。
新京报10月26日报道 国家测绘局的“天地图”刚推出,就遇到了网友的质疑。
日前,有网友在其博客上称,“天地图”使用的卫星地图并非具有“自主知识产权”。
昨日,国家测绘局有关人士回应称,“天地图”卫星图像确实来自商业卫星,“天地图
”自主知识产权指的是“服务软件”而并非“数据资源”。
质疑
“天地图”是否具有自主产权
今年10月21日,国家测绘局宣布,中国公众版国家地理信息公共服务平台“天地图”网
站正式开通。而在报道中,这一网站被称为“中国自主研发的网络地图服务网站”。
10月22日晚,一位网友发文指出,他对“天... 阅读全帖
p*********g
发帖数: 9527
40
【 以下文字转载自 Joke 讨论区 】
发信人: wagmal (超级偶像,工藤静香), 信区: Joke
标 题: ▓▓四万亿伪币,诚心求购嫦娥二号拍到的地球照片▓▓
发信站: BBS 未名空间站 (Sun Nov 7 18:11:55 2010, 美东)
▓▓四万亿伪币,诚心求购嫦娥二号拍到的地球照片▓▓
哪位贴出来,我给他四万亿伪币。
嫦娥二号拍摄 的第一幅地球照片已传回
2010-10-03 07:09:00 来源: 青年报(上海) 跟贴 2 条 手机看新闻 前晚7点25分星
箭分离之后,嫦娥二号独自在茫茫太空中飞行了一整夜,昨天凌晨3点39分钟左右,用
自己携带的一部监视相机拍下它的第一幅摄影作品,也就是之前所说的“地月成像”中
的对地成像。12点25分,北京航天飞行控制中心科技人员对嫦娥二号成功实施首次地月
转移轨道中途修正。
本报记者 胥柳曼 综合报道
昨天凌晨3点39分拍下首张地球照片
前晚6点59分57秒,在四川西昌卫星发射中心,嫦娥二号卫星在长征三号丙火箭的托举
中成功发射。卫星发射之后,跟踪、测控、调整成了重要的接力赛。北京航天飞行控制
中心一直在实时跟踪监... 阅读全帖
v******s
发帖数: 272
41
来自主题: ChinaNews版 - 中国帮美国掩盖月球事实!
这一定有极其惊人的内幕,怪不得嫦娥2号发射后,
NASA老板往中国跑。看看下面这两个小道和正道
消息:
小道消息,爆料了爆料了,路边社消息,嫦娥探月工程发现神秘物体 与NASA发现的一
样。说在月亮上发现了不可思议的东西鸟,内部产生了巨大的分歧,国家有关的领导也
来看过了,很是TMD的震惊,终于知道米国人害怕的是什么鸟,里面有个重量级别的人
物想公开,但是反对的力量很大!
嫦娥工程地面应用系统总设计师李春来做客人民网科技访谈
国航空航天局(NASA)曾涂抹月球照片,隐藏月球秘密?嫦娥工程地面应用系统总设计
师李春来、副总设计师刘建军在做客人民网科技频道“航天望站―嫦娥会客厅”
时给出了意料外的答案----可能是数据解压时产生的模糊,而非人为。
李春来表示,月图上有涂抹的痕迹,很可能不是人为的,而是数据处理时形成压缩,在
解压缩率比较高的情况下有些细节会被涂抹掉。他解释说,因为数据的信息量太大,40
万公里不可能和近地卫星的码速率一样传下来,只能用压缩的方法,然后再解压,在这
个过程中会有一些信息的丢失,如果细看,可能就会看到一些涂抹。
刘建军补充说,因为网络传输的需要,也会产生压... 阅读全帖
U*E
发帖数: 3620
42
【 以下文字转载自 Military 讨论区 】
发信人: hfyhl (I am legend), 信区: Military
标 题: ▓▓四万亿伪币,诚心求购嫦娥二号拍到的地球照片▓▓ (转载)
发信站: BBS 未名空间站 (Sat Nov 13 23:15:08 2010, 美东)
发信人: wagmal (超级偶像,工藤静香), 信区: Joke
标 题: ▓▓四万亿伪币,诚心求购嫦娥二号拍到的地球照片▓▓
发信站: BBS 未名空间站 (Sun Nov 7 18:11:55 2010, 美东)
▓▓四万亿伪币,诚心求购嫦娥二号拍到的地球照片▓▓
哪位贴出来,我给他四万亿伪币。
嫦娥二号拍摄 的第一幅地球照片已传回
2010-10-03 07:09:00 来源: 青年报(上海) 跟贴 2 条 手机看新闻 前晚7点25分星
箭分离之后,嫦娥二号独自在茫茫太空中飞行了一整夜,昨天凌晨3点39分钟左右,用
自己携带的一部监视相机拍下它的第一幅摄影作品,也就是之前所说的“地月成像”中
的对地成像。12点25分,北京航天飞行控制中心科技人员对嫦娥二号成功实施首次地月
转移轨道中途... 阅读全帖
h***i
发帖数: 89031
43
来自主题: ChinaNews版 - 海日,tgbqaz, euv 进来一下
赫赫
你们说说你们都是干什么工作的,算你们不是中宣部派来得
昨天出来一个说做数据处理的,问问怎么做sampling李可就逃跑了
g*********r
发帖数: 542
44
来自主题: ChinaNews版 - 国内人一个很奇怪的论点
他好像最开始说过, 他的收入主要来自两部分
1. 他上学期间有个专利, 吃专利费
2. 给一个啥公司做些数据处理? ( 记不清了,就是谢类似的东西) ,挣些钱
后来还有人说他的网站也有收入,不清楚具体情况
g*********r
发帖数: 9366
45
来自主题: ChinaNews版 - [合集] 国内人一个很奇怪的论点
☆─────────────────────────────────────☆
grasshopper (大肚子哥哥 (singing crickets)) 于 (Mon Jan 2 14:26:47 2012, 美东) 提到:
就是 “ 你一个美国大学的生物化学博士, 不好好做科研....."
靠, 为啥美国大学的博士就得去做科研?
为啥你们这些学这个那个的就可以去开公司办企业,写书走穴当领导? 莫非你们大学
专业是CEO管理和精英管理?
还不是看方舟子打假出了名,羡慕嫉妒恨呗
☆─────────────────────────────────────☆
bibicat (bibicat) 于 (Mon Jan 2 15:01:35 2012, 美东) 提到:
国内人吗,觉得出国读博士的都是科学家
肘子在美国估计还真混得不怎么样,主要靠给国内报刊杂志写写文章和写中文科普书籍
拿稿酬为生
不过现在成为名人了,随便一个讲座的出场费就不少,书出了20多本来,土豆上都有视
频专栏了,估计年收入怎么也超过$20w了吧
肘子回国还是对的,多年逃税在美国被IRS查到不得了... 阅读全帖
s*****n
发帖数: 1636
46
美国北加州的斯坦福大学,研究人员刚刚利用世界上最大的超级计算机运行了一个应用
程序,通过一百多万个处理器核处理了相关信息。
约瑟夫·尼科尔斯及其研究小组是第一个利用劳伦斯·利弗莫尔国家实验室的“红
杉IBM蓝基因/Q型”超级计算机运行活动代码的研究团队。“红杉”超级计算机总共包
括150多万个处理器核,该研究小组利用的处理器核有一百万稍多一些,模拟了试验性
喷气式发动机所产生的噪音量,在这个过程中显然创造了一项超级计算机纪录。
以前,尼科尔斯及其他研究小组成员从来没有在超过20万处理器核的计算机上运行
过这个代码。为了使“红杉”的软件达到最优化,在过去几周的时间里,研究小组跟劳
伦斯·利弗莫尔国家实验室的研究人员进行了密切合作。“起初我也不知道能否正常运
行,”尼科尔斯说。
分布式计算工具的开放资源,如Hadoop,利用的是非常便宜的商品硬件。试验表明
,尽管这些开放资源已经发展起来,但是以前的超级计算机群所提供的数据处理平台仍
然要大得多。最大的Hadoop集群可能包括大约8800个处理器核。
超级计算机的工作原理是把非常大的问题分解为较小的问题,然后把这些小问题分
布在许多机器和许... 阅读全帖
z**********e
发帖数: 22064
47
来自主题: Detective版 - 奇人, 奇事, 奇文 (縮寫 ) (转载)
【 以下文字转载自 Joke 讨论区 】
发信人: laocat (猫老), 信区: Joke
标 题: 奇人, 奇事, 奇文 (縮寫 ) (转载)
发信站: BBS 未名空间站 (Sat May 17 18:32:25 2014, 美东)
发信人: gogo2004 (挑灯看剑), 信区: Chicago
标 题: 奇人, 奇事, 奇文 (縮寫 )
发信站: BBS 未名空间站 (Mon May 12 20:14:42 2014, 美东)
话说早在2001年的时候,出过件轰动一时的案子:曾经轰动全世界的高瞻间谍案。
2001年2月11日上午,高瞻和她的丈夫薛东华及五岁儿子安德鲁一家三口结束了在中国
的三星期探亲行程,在北京国际机场准备登上美国西北航空公司的飞机返回美国前,被
穿便衣的北京市国家安全局人员拦住。
26天后的3月8日,薛东华获释。他立刻与儿子安德鲁飞回美国。薛东华回到美国后积极
遊說人权组织、媒体、国会议员,呼吁他们营救高瞻。3月21日开始,包括CNN在内的美
国各大媒体都在最重要的显著位置,或最重要收视时段,连篇累牍地报道高瞻被拘事件
,几乎所有重量级的主流报纸都... 阅读全帖
c***s
发帖数: 70028
48
上海人口普查结果将于4月中下旬公布,早报记者从昨天下午召开的2011年上海统计工作会议上获悉,普查结果显示上海人口“出乎意料”地激增。虽然没有透露具体数值,但上海市统计局局长王志雄表示,上海人口激增幅度高于北京。
人口激增幅度高于北京
去年,我国进行了第六次人口普查,此次普查的主要目的是查清10年来我国人口在数量、结构、分布和居住环境等方面的变化情况。
据上海市统计局有关人士透露,本市的人口普查结果将在我国人口普查结果公布后予以公布,大约时间为今年的4月中下旬,而就目前掌握的普查结果来看,上海人口的“激增”是非常厉害的,程度甚至高于北京。
每年新增人口60多万?
关于最新的上海人口数据,统计局方面正式经审核的数据将在4月中下旬发布,目前不便对媒体公开。不过,有关专家曾透露,上海人口已经达到了2300万左右,大大超出此前媒体常说的“上海总人口2000万”。上海“两会”期间,市政协委员、华东师范大学社会发展学院院长,人口研究所的丁金宏教授就曾表示,“去年11月份上海人口普查中,登记人口总数达到2300万人,其中户籍人口近1400万,流动人口超过900万。”
据丁金宏教授介绍,2000年上海... 阅读全帖
c***s
发帖数: 70028
49
约翰眯起眼睛,跟记者比划:“植入脑部的芯片,确切地说,相当于人民币的五角币大小。”
脑子转转,手脚就能动起来,想做什么就做什么。如果有这样的神奇装备,您是不是马上想到――闭目养神之际,排山倒海的工作立马完成?眼珠一转的当口,满汉全席全上桌?别光顾着偷懒,如果这样的装备能给像前中国男排主力汤淼一样的瘫痪病人一点帮助,会不会更温馨点?
昨天,美国布朗大学脑科学研究所所长、布朗大学神经科学及工程系教授约翰?多诺霍来到浙江大学,接受兼职教授的聘书。他怎么个牛法?用约翰儿子的话来介绍他:“老爹的研究,玩的是《黑客帝国》里的矩阵革命――人脑接口机器,动动脑子就能控制机器。”
瘫痪病人大脑植入芯片
生活基本能自理
现实生活中真有这么一批前沿科学家,他们的工作就是致力于大脑信息的解码。被试者只需要动动脑筋,就可以控制电脑和机械肢。当然,与电影里天马行空不同的是,他们做的脑机接口技术研究(brain machine interface),并不是协助被试验的人参与人机混战,而是通过这种装置,帮助瘫痪病人重新迎来生活的曙光。
能不能让汤淼一样的瘫痪病人生活自理?抱着做好事的目的,昨天下午记者赶到浙大紫金港校... 阅读全帖
c***s
发帖数: 70028
50
一直有这个感觉,美日是同盟,可是美国对于日本的各个方方面面的监视一直没有放松,从政界开始几乎遍布各个方面。苦于是一直没有明确的证据,虽然有鸠山内阁时向美国通风报信的日本外务省的中级官员,但是这也是透露出来的个例。这次在关于日本地震的报道中,我却发现了可以获得有关信息。首先是在3月11日日本地震以后,福岛核电站受到了海啸的毁灭性打击,但是开始时日本政府只是要求一号机组周围3公里人员避难,接着1-4号机组因冷却水停止发生了熔融现象,最后发生了4号,3号机组的爆炸。这时日本政府要求所有在福岛核电站20公里范围内的民众避难,在20-30公里的居民在家避难。与此同时美国国务院却做出了与日本政府指示不同的决定,以美国驻日本大使的名义要求所有在福岛核电站80公里范围内的美国公民全部撤离避难。现在从美国大使馆内传来的内部消息,美国是根据独自的情报源做出了这个80公里避难的决定。独自情报源是什么呢?为何没有相信日本政府提供的情报,也没有相信东京电力提供的情报呢?这是因为以上两处提供的放射性泄漏情报,放射性量的可信程度很低。
福岛核电站
核扩散的问题
美国发布的针对美国公民的避难劝告是在3月17日清晨,当... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)