d****n 发帖数: 12461 | 1 【 以下文字转载自 Statistics 讨论区 】
发信人: songkun (告别棒球场), 信区: Statistics
标 题: 说说Facebook的Data Scientists职位
发信站: BBS 未名空间站 (Thu Nov 27 03:01:39 2014, 美东)
Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
第二种说.
先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/
Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
engineering, pm, analysts (data scientist), product designers. 所以整个
Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
scientist, 是general hiring pool, 不分组的, 进来以后再allocate. 这点上和
engineers, PMs 什么的都相同. 之所以要这样, 是为了让analytics保持独立性, 更好
的为产品提供insights,而不完全受product的制约, 换句话说, 你的老板是analytics
head, 而不是你工作的那个product的head. 再有就是这样会形成analytics community
, 容易share resources, best practices, 等等.
再说data scientists的日常工作组成, 基本分四项
(1) data pipelines, 这包括各种ETL, 处理数据, reporting, dashboard 等等
(2) product operation, 包括监测和产品的走向, own key metrics, 和各种ad hoc的
product support. 这种可以简单概括成被动分析, 就是有人问你关于产品问题, 你得
回答.
(3) strategic analysis, 各种exploratory的分析, 提供insight来帮助产品set
roadmaps. 这种可以简单概括成主动分析, 就是没人问你问题, 你自己要问你合适的问
题, 并且回答, 主动为产品提供发展方向.
(4) cross functional influencing. 有了insights, 要和另外几大pillars打交道(
eng, pm等等), 所以influencing必不可少.
可以想想, 每个产品的analysts, 都是和那个产品的团队坐在一起的, 而不是和你老板
坐在一起. 同一个analytics team里的人, 往往是分散坐在不同的楼里, 而你老板可能
是坐在他最involve的一个产品那个组里. Analytics team有weekly meeting, 但是你
更多的时候是meet同一product team里的人.
再说data scientists面试的要点.
(1) 有"一定"的技术能力, Python + big data (比如Hive/SQL). R也可以, 但是很多
面试题用R来做恐怕有些困难, 会Python是很有帮助的. 不需要啃算法书, CS面试那种
算法题不会考. 我们只需要知道你有独立handle data的能力, 遇上事情能有技术能力
unblock你自己. 光会SQL是不行的.
(2) 有"极好"的分析能力, 这是analysts的本质, 也是面试的重点. 给你一个问题(
open ended), 看能不能 think analytically and structurally. 随便举个例子: 怎
么用FB数据分析日本核电站爆炸的影响. 这里要自己formalize这个问题, 提出假设,
思考可以用哪些数据, 怎么分析, 没有某些数据怎么替代 等等一系列步骤.
(3) 有"极好"的product sense. 因为实际工作中, 很多时候没人问你问题, 你要自己
问问题, 问正确的问题, 需要对产品有很好的理解. 这里也举个例子: 假如印度的某个
城市停电三天, 你觉得对FB会有哪些影响, 这些影响对Twitter会如何? 回答这个问题,
先得对行业和产品有一定了解, 否则根本无从下手.
当然一些其他的东西, 比如对数字的敏感度, 交流的能力等等很重要, 但是哪些都表现
在上面这些回答当中.
很大程度上, FB的data scientists需要的是通才, 而不是专才, 从上面这些问题就能
看的出来. 这也是为什么我们招进来的人什么背景的都有. 背景可以千差万别, 但是上
面三条都一定满足. 对于学统计的人, 尤其是对互联网行业比较陌生的, 可能在
product sense方面会有些challenge. 我们也面试过很多统计PhD, 有些人回答很好,
有些人就一塌糊涂, 最后的差别并不在于统计, 而是分析头脑和product sense. 这里
要说一点, 大多数中国人都比较适合回答close-ended questions(这个和咱们的教育背
景有关), 纠结于"怎么分析". 很多时候遇上"分析什么" 这种 open-ended questions
反而不知如何下手.
最后明确一下, FB现有大量的data scientists空缺, 刚兴趣的请自己申请, 也可以找
FB的朋友推荐. 因为我个人也是hiring manager之一, 也是interviewers之一, 所以我
不负责推荐.
https://www.facebook.com/careers/department?req=a0IA000000CyDjDMAV
最后说点题外话. 这个版上稍微老点的人恐怕都知道我, 我来FB之前在Google工作了7
年半. Google是个给钱多还不累的地方. FB可完全不是, FB比Google忙的多的多的多的
多, 整个公司都是这个文化. 对于mediocre performer, Google更tolerant, 而FB很多
就直接fire了. 所以追求work life balance的, 基本就不要考虑FB了.
Google是很好的公司, 也有很多牛人, 但也有很多不干活的人在公司的各个角落. FB可
以说基本没有, 至少整个analytics org一百多人, 我还没发现任何一个人有任何一点"
混"的迹象. Analytics从director到
manager到IC, 都是要做IC活的. 光管人耍嘴皮子, 在FB是吃不开的. 我老板director,
基本每天也就睡4,5个小时, 剩下时间全在工作, 又management, 又自己分析东西. 很
大程度上, FB这么大的公司, 能保持这种模式, 也算是奇迹了. 以前我在Google的时
候, 基本天天泡在这个版, 可是现在可能一两个月都不来一次了, 实在是没时间, 有时
一天忙到最后都渴的不行饿得不行了, 才发现自己一天忙得都没喝口水的时间. | H****E 发帖数: 254 | 2 可以说一下招进去的学历上面,phd, ms, bachelor的百分比么? | c********h 发帖数: 330 | 3 搜过linkedin上fb ds,phd貌似没有想象的多。很惊讶的看见很多bs in art, music啥的
尤其是就没几个phd in stat
【在 H****E 的大作中提到】 : 可以说一下招进去的学历上面,phd, ms, bachelor的百分比么?
| P**********k 发帖数: 1629 | 4 看了一下,只有那个core data scientist是需要phd的
其他的ds都好像bs就可以。。。
啥的
【在 c********h 的大作中提到】 : 搜过linkedin上fb ds,phd貌似没有想象的多。很惊讶的看见很多bs in art, music啥的 : 尤其是就没几个phd in stat
| c********h 发帖数: 330 | 5 嗯,fb的core ds比较像research scientist的感觉。
【在 P**********k 的大作中提到】 : 看了一下,只有那个core data scientist是需要phd的 : 其他的ds都好像bs就可以。。。 : : 啥的
| n*****3 发帖数: 1584 | 6 其他的ds sounds just like a business analyst,
as long as you are smart, open mind. BS/MS would be sufficient .
【在 P**********k 的大作中提到】 : 看了一下,只有那个core data scientist是需要phd的 : 其他的ds都好像bs就可以。。。 : : 啥的
| t******g 发帖数: 2253 | 7 现在很多或者绝大部分data scientist就跟business analyst很类似。传统的BA主要是
relational database加SAS,现在很多data scientist只不过数据库换成比如hadoop,
再加些基本统计软件比如R或者python的操作。
【在 n*****3 的大作中提到】 : 其他的ds sounds just like a business analyst, : as long as you are smart, open mind. BS/MS would be sufficient .
|
|