由买买提看人间百态

topics

全部话题 - 话题: statsguy
首页 上页 1 2 3 4 下页 末页 (共4页)
S******y
发帖数: 1123
1
Data Science Training
Classes will be conducted via Skype. You will see my screen throughout the
class.
==>Python for Data Scientist Class <==
http://www.eventbrite.com/e/python-for-data-scientist-tickets-2
You can choose Python I or Python II depending your prior Python level :
Python I
- Installing Python
- Numbers and Expressions
- Variables
- Statements
- Modules
- Strings
- Lists and Tuples
- Dictionary
- Conditionals, Loops and other statements
- Hands on coding (Lab:reading data and parse... 阅读全帖
S******y
发帖数: 1123
2
Data Science Training
由硅谷高科技公司任职的资深数据科学家亲自任教
Real-world example and coding will be included.
课程注重 牢固清晰的概念以及极强的实用性。
Classes will be conducted via Skype. You will see instructor's screen during
the class.
已有多位同学成功转行/转型,通过课程 认真掌握课程资料 实践工业界实例,加上
networking, 在旧金山市及湾区找到心仪的Data Scientist 工作。
==> Hadoop/Hive for Data Scientist Class <==
http://www.eventbrite.com/e/hadoophive-for-data-scientist-class
Hadoop/Hive培训课包括
- Installation
- Hadoop 架构及原理
- Hive 语法及实例
- Map/Reduce 原理及实例
==>Python for Data Scienti... 阅读全帖
S******y
发帖数: 1123
3
Yes 四月及五月的Python/R/Hadoop/Tableau课 are open to registration
let me know if you are interested :--)
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
4
为什么不考虑industry 的机会呢?
建议不要再读了 人生太短 世界很大 趁年轻去赚钱吧!
新年快乐!
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
l*******o
发帖数: 71
5
来自主题: Statistics版 - 给今年毕业的同学们出一个主意
楼主,你们培训班都教什么?
[在 StatsGuy (StatsGuy) 的大作中提到:]
:如条件许可 不妨试试搬到SF湾区 作为local candidate找工作
:可以比较容易拿到面试
:...........
S******y
发帖数: 1123
6
来自主题: Statistics版 - 给今年毕业的同学们出一个主意
我们长期提供Python/R/Hadoop/Tableau实战培训课程,由在硅谷科技公司任职多年的
数据科学家及数据工程师任教。
Classes will be conducted via Skype. You will see instructor's screen
throughout the class.
==> Hadoop/Hive for Data Scientist Class <==
http://www.eventbrite.com/e/hadoophive-for-data-scientists-tick
Hadoop/Hive培训课包括
- Installation
- Hadoop 架构及原理
- Hive 语法及实例
- Map/Reduce 原理及实例
==>Python for Data Scientist Class <==
http://www.eventbrite.com/e/python-for-data-scientist-tickets-2
You can choose Python I or Python II depending your ... 阅读全帖
S******y
发帖数: 1123
7
来自主题: Statistics版 - 五月毕业的统计master求内推&建议
If you are in San Francisco Bay Area, please contact me.
StatsGuy
mr.statsguy AT gmail
http://www.mitbbs.com/article_t0/Statistics/31393841.html
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
8
平心而论, 做 data science 确实比做马工要有意思
最近招人经常碰到马工想转做data science 的
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
9
if you have a competing offer, you can ask them to match it
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
10
找人内推有几个优点:
1)可以面试前了解公司该组 的内部情况, 从而有的放矢的准备
2)里面帮你内推的人可能成了你的朋友 甚至“盟友”
3)帮你内推的人会提醒你要注意的问题,甚至面试陷阱
找人内推 不是简单把简历丢给人家 说声谢谢就结束了,而是要争取跟他(她)聊一聊
, 对简历有什么建议,面试要注意什么。人家给你简历建议 要用心听。我管这个叫做
“深度内推”。
你不问,人家可能也不会花时间跟你讲.
Data Science 与 business 靠的很近,每个公司都不太一样。 这一点与码工有很大
区别。
盲目海投 搞不好把以后内推的路给堵了。 你网上投的简历进入candidate system, 后
面想帮你内推的就不一定能被系统接受了(至少一半以上的公司的系统是这样)。
祝猴年事事顺利 每个人都找到心仪的工作!
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
S******y
发帖数: 1123
12
industry路子宽一些吧
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
13
来自主题: Statistics版 - Summaer statistical meetings in China
赞一个
中国发展太快了
听说在国内作统计分析的人 车载斗量 数量上直追富士康的工厂员工
--------------------------
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
https://www.eventbrite.com/e/python-for-data-scientist-tickets-
2016年DS找工小贴士 系列之四 : 面试coding关
http://www.mitbbs.com/article_t/Statistics/31394591.html
2016年DS找工小贴士 系列之三:Different data scientists
http://www.mitbbs.com/article_t/Statistics/31394519.html
2016年DS找工小贴士 系列之二 你的简历
http://www.mitbbs.com/article_t0/Statistics/31394405.html
2016年DS找工小贴士 系列之一 :要... 阅读全帖
S******y
发帖数: 1123
14
我们High-Tech公司在湾区面试candidates 也是一票否决
有时也觉得比较残酷 不过这也是没办法的事
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
==>Python for Data Scientist Class <==
https://www.eventbrite.com/e/python-for-data-scientist-tickets-
2016年DS找工小贴士 系列之四 : 面试coding关
http://www.mitbbs.com/article_t/Statistics/31394591.html
2016年DS找工小贴士 系列之三:Different data scientists
http://www.mitbbs.com/article_t/Statistics/31394519.html
2016年DS找工小贴士 系列之二 你的简历
http://www.mitbbs.com/article_t0/Statistics/31394405.... 阅读全帖
S******y
发帖数: 1123
15
对换工作帮助不一定大
对公司内部升职可能有帮助
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
分享: 从SAS 到 Python 与 R
http://www.mitbbs.com/article_t/Statistics/31361999.html
也谈为什麽要学习Python
http://www.mitbbs.com/article_t/Statistics/31389997.html
==>Python for Data Scientist Class <==
https://www.eventbrite.com/e/python-for-data-scientist-tickets-
2016年DS找工小贴士 系列之四 : 面试coding关
http://www.mitbbs.com/article_t/Statistics/31394591.html
2016年DS找工小贴士 系列之三:Different data scientists
http://www.mitbb... 阅读全帖
S******y
发帖数: 1123
16
来自主题: Statistics版 - 如何从质上提升自己SAS的水平?
This paper provides a good guideline for you -
http://www2.sas.com/proceedings/sugi31/123-31.pdf
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
https://www.eventbrite.com/e/python-for-data-scientist-tickets-
分享: 从SAS 到 Python 与 R
http://www.mitbbs.com/article_t/Statistics/31361999.html
也谈为什麽要学习Python
http://www.mitbbs.com/article_t/Statistics/31389997.html
2016年DS找工小贴士 系列之四 : 面试coding关
http://www.mitbbs.com/article_t/Statistics/31394591.html
2016年DS找工小贴士 系列之三:Differen... 阅读全帖
S******y
发帖数: 1123
17
来自主题: Statistics版 - 数据挖掘的咨询公司 (转载)
想法不错
技术都不是问题
sales 是关键
有没有比较铁的客户关系网?有一个单就能起一个公司
在美国做生意 建立关系上的挑战程度 不亚于中国
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
分享: 从SAS 到 Python 与 R
http://www.mitbbs.com/article_t/Statistics/31361999.html
也谈为什麽要学习Python
http://www.mitbbs.com/article_t/Statistics/31389997.html
https://www.eventbrite.com/e/python-for-data-scientist-tickets-
2016年DS找工小贴士系列之五:该入哪一行?
http://www.mitbbs.com/article/Statistics/31395289_0.html
2016年DS找工小贴士 系列之四 : 面试coding关
http://www.mitbbs.com/artic... 阅读全帖
S******y
发帖数: 1123
18
来自主题: Statistics版 - 数据挖掘的咨询公司 (转载)
西部的高科技公司自己的技术力量强,喜欢用 open source 故很少请consultant
倒是Consultant(vendor based)在东部和中西部的传统行业比较多一些
------------------
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
分享: 从SAS 到 Python 与 R
http://www.mitbbs.com/article_t/Statistics/31361999.html
也谈为什麽要学习Python
http://www.mitbbs.com/article_t/Statistics/31389997.html
S******y
发帖数: 1123
19
来自主题: Statistics版 - 数据挖掘的咨询公司 (转载)
我有在两家以上咨询公司做过Consultant的经历.
没做过Consulting Business 的童鞋如果想听故事,我这里随手就一大把... 呵呵 :-)
--------------------------------------------------------
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about
分享: 从SAS 到 Python 与 R
http://www.mitbbs.com/article_t/Statistics/31361999.html
也谈为什麽要学习Python
http://www.mitbbs.com/article_t/Statistics/31389997.html
2016年DS找工小贴士系列之五:该入哪一行?
http://www.mitbbs.com/article/Statistics/31395289_0.html
2016年DS找工小贴士 系列之四 : 面试coding关
http://www.mitbbs.com/art... 阅读全帖
S******y
发帖数: 1123
20
来自主题: Statistics版 - 8-Weekend Data Science Bootcamp (Summer 2016)
Looking forward to working closely with you in the classes!
Cheers,
StatsGuy


: Thanks StatsGuy!

: I have registered for the Bootcamp :--)

: Looking forward to the classes!

b*****s
发帖数: 11267
21
来自主题: Statistics版 - 准备归海,求内推SAS Programmer职位
也有可能很多银行都把title名字改了
[在 StatsGuy (StatsGuy) 的大作中提到:]
:There are less and less SAS Programmer职位 in the US each year
:http://www.mitbbs.com/article_t/Statistics/31395829.html
S******y
发帖数: 1123
b*****s
发帖数: 11267
23
来自主题: Statistics版 - 准备归海,求内推SAS Programmer职位
也有可能很多银行都把title名字改了
[在 StatsGuy (StatsGuy) 的大作中提到:]
:There are less and less SAS Programmer职位 in the US each year
:http://www.mitbbs.com/article_t/Statistics/31395829.html
S******y
发帖数: 1123
S******y
发帖数: 1123
25
来自主题: Statistics版 - 数据科学家成抢手人才
http://www.ftchinese.com/story/001068554#adchannelID=2100
数据科学家成抢手人才
美国学者格斯特林表示,5年内所有软件应用都将内置智能,使数据科学家成为“认知
”技术经济的关键工作者。
2016年7月25日 06:06 英国《金融时报》 理查德•沃特斯 报道
对于一个理应奇缺人才的领域,数据科学似乎在快速造就大批新专家。不久前,1600人
出席了华盛顿大学(University of Washington)机器学习教授卡洛斯•格斯特林(
Carlos Guestrin)执掌的公司Turi在旧金山主办的一次数据科学峰会,表明数据科学引
起的兴趣是多么的浓厚。
格斯特林提出,所有软件应用在5年内都将需要内置的智能,使数据科学家——经过培
训,能够对海量数据进行分析的人员——成为这一新兴“认知”技术经济中的关键工作
者。
无论这种关于数据科学即将无处不在的预测正确与否,目前已有一些核心的关键应用依
赖机器学习,最主要的是推荐程序、欺诈探测系统、预报工具和旨在预测顾客行为的应
用。
把直到不久以前还专属于研究科学家... 阅读全帖
y********o
发帖数: 104
26
来自主题: Statistics版 - 统计硕士求内推 明年5月份毕业
谢谢您的回复。
Data Scientist都要博士毕业的吧,我就一小硕,也不敢奢望很多呢。


: There are many hedge funds in CT

: But not sure if they are hiring many quants/data scientists this year

: Many hedge funds have been doing poorly this year

: On the other hand, you might want to look into data scientist
positions in

: insurance industry in Hartford

: Best,

: StatsGuy

: http://www.statsguy.net/

: ====================================

: 注:笔者为多年工业界经验的资深 Principal Data Scientist 现任职于SF湾区
一家高
阅读全帖
S******y
发帖数: 1123
27
sas 考试 is of little use here in 旧金山湾区
-StatsGuy
欢迎浏览Python/R/Hadoop实战速成课网页-
http://www.statsguy.net
http://plus.google.com/+statsGuyMITBBS/about
S******3
发帖数: 66
28
不要这样武断,各人情况不同。牛人都去做DS了,编程不行的MM正好有机会靠SAS做点
低薪的金融data analyst / programmer之类的


: sas 考试 might be of little use here in 旧金山湾区

: -StatsGuy

: 欢迎浏览Python/R/Hadoop实战速成课网页-

: http://www.statsguy.net

: http://plus.google.com/ statsGuyMITBBS/about

S******y
发帖数: 1123
29
来自主题: Statistics版 - facebook data science/analytics组职位
Don't be too excited
A lot of people on this forum 收到了Facebook recruiter的信; it does not mean
much...
Recruiters are working hard to find candidates so they usually cast a big
net; they will be fired if they cannot produce enough candidates
The interview process will be long and difficult requiring a lot of patience
; full of turns and surprises...
most of candidates will be eliminated at certain point over the long
interview process...
After you are hired, you will be required to go through a "f... 阅读全帖
S******y
发帖数: 1123
30
来自主题: Statistics版 - Data Science Bootcamp 春季班招生
有兴趣的同学请与我联系
谢谢
[email protected]/* */
-------------------------------------------
我们的实用Data Science课程与工业界密切相关, 由业界资深的Data Scientists亲授.
我们历届毕业的同学们中 很多成功的进入湾区的多家公司 最近又有同学成功入职一线
大数据公司. Congratulations!
Registration for Spring'17 Data Science Bootcamp is now open!
Seats are limited.
If you are interested, please contact me via inbox or
email [email protected]/* */
Regards,
StatsGuy
http://www.statsguy.net/services.html
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
31
来自主题: Statistics版 - 实用DS课程 Data Science Bootcamp
我们的实用Data Science课程与工业界密切相关, 由业界资深的Data Scientists亲授.
已成功举办多期。我们历届毕业的同学们中 很多成功的进入湾区的多家公司 最近又有
同学成功入职一线大数据公司. 有兴趣的同学请与我联系. [email protected]/* */
Registration for The Data Science Bootcamp is now open!
Seats are limited. If you are interested, please contact me via inbox or
email [email protected]/* */
StatsGuy
http://www.statsguy.net/services.html
http://plus.google.com/+statsGuyMITBBS/about
-------------------------------------------
数据科学家成抢手人才
http://www.mitbbs.com/article_t0/Stati... 阅读全帖
S******y
发帖数: 1123
32
来自主题: Statistics版 - Python for Data Scientist class this Saturday
We are offering a one-time class "Python for Data Scientist" this Saturday
4/22. It covers both Python concepts and coding exercises to solve real-
world problems in industry.
If you are interested, please email [email protected]/* */ ASAP.
Thanks!
StatsGuy
http://www.statsguy.net/
S******y
发帖数: 1123
33
来自主题: Statistics版 - 与Macro相关的字符函数
用Python处理字符 非常简明
-StatsGuy
http://www.statsguy.net/
S******y
发帖数: 1123
S******y
发帖数: 1123
35
-希望这几点对在校同学有帮助-
距离毕业还有一两年就要规划实习
因为很多公司对已毕业学生不再给实习机会
找工作竞争愈发激烈 一年比一年竞争多
有实习经验在简历上 成为有力的敲门砖
实习经验 不一定必须大公司 有比没有强 (大小公司 医疗中心 学校各个学院包括商
学院 法学院 data analysis 等等)
不一定要实习期做过高大上模型 你实际在向雇主展示你的主动
proactiveness and effort!
祝大家都能早日找到心仪的工作!
-StatsGuy
[E-mail: mr.statsguy AT gmail]
分享: 从SAS 到 Python 与 R
http://www.mitbbs.com/article_t/Statistics/31361999.html
工作市场总结
http://www.mitbbs.com/article_t/DataSciences/21013.html
也谈为什麽要学习Python
http://www.mitbbs.com/article_t/Biology/31882445.html
DS找工小贴士系列之六:技术不是全部
ht... 阅读全帖

发帖数: 1
36
谢谢指教
请问一般ds职位招聘会考一般的软件算法题吗?我是指码工的算法题而不是ml或dl
一直很奇怪那些原来生物专业的怎么混进大公司ds行当的
[在 StatsGuy (StatsGuy) 的大作中提到:]
:probability
:statstics/ML
:Python/R/SQL
:Hadoop/Hive/Pig
:projects you have done
:soft skills
:business problem solving
S******y
发帖数: 1123
37
来自主题: DataSciences版 - 分享两个data scientist职位的面经
my python/hadoop class covers hadoop streaming in python
statsguy
m*********[email protected]
实战速成Python/R/Hadoop课程-
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
38
来自主题: DataSciences版 - [2016] 工作市场总结 (转载)
【 以下文字转载自 Statistics 讨论区 】
发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: [2016] 工作市场总结
发信站: BBS 未名空间站 (Sun Sep 4 11:20:42 2016, 美东)
Data Science 做为北美工作市场上一个为数不多的亮点之一 今年以来仍然处于快速増长
2016转眼过去大半
今年工作市场发生了几个变化:
科技公司招聘需求仍然强劲。FLAG等大型科技公司仍在扩大招收DS和统计师 hiring
bar is now significantly higher。越来越强调动手coding之重要性 (两年前 我曾
在本坛上发帖强调过coding 对于统计专业同学之重要)
初创公司大半资金开始吃紧 招人开始减缓(优步等几家除外)
传统企业开始普遍意识DS重要性 从manufacturing 到consumer healthcare都在开data
science openings 但数量是细水长流型 比如-
Property and Casualty 类保险公司 从单纯强调精算 到接纳采用大数... 阅读全帖
S******y
发帖数: 1123
39
来自主题: DataSciences版 - [2016] 工作市场总结 <更新> (转载)
【 以下文字转载自 Statistics 讨论区 】
发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: [2016] 工作市场总结 <更新>
发信站: BBS 未名空间站 (Sun Sep 4 11:20:42 2016, 美东)
Job trend: Data Scientists vs. SAS Programmers
(source: www.indeed.com)
Data Science 做为北美工作市场上一个为数不多的亮点之一 今年以来仍然处于快速増长
2016转眼过去大半
今年工作市场发生了几个变化:
科技公司招聘需求仍然强劲。FLAG等大型科技公司仍在扩大招收DS和统计师 hiring
bar is now significantly higher。越来越强调动手coding之重要性 (两年前 我曾
在本坛上发帖强调过coding 对于统计专业同学之重要)
初创公司大半资金开始吃紧 招人开始减缓(优步等几家除外)
传统企业开始普遍意识DS重要性 从manufacturing 到consumer healthcare都在开da... 阅读全帖
S******y
发帖数: 1123
40
【 以下文字转载自 Statistics 讨论区 】
发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: [秋季班开始] DataScience Bootcamp <已更新>
发信站: BBS 未名空间站 (Fri Jun 17 11:21:16 2016, 美东)
Job trend: Data Scientists vs. SAS Programmers
(source: www.indeed.com)
今年夏天我们又有同学成功拿到data scientist offer 顺利入职FLAG一线公司
Congratulations!!
-------------
有兴趣的同学请与我联系
谢谢
[email protected]/* */
-------------------------------------------
我们的实用Data Science课程与工业界密切相关, 由业界资深的Data Scientists亲授.
我们历届毕业的同学们中 很多成功的进入湾区的多家公司 最近又有同学成功入职FLAG
一线公司 cong... 阅读全帖
S******y
发帖数: 1123
c****t
发帖数: 19049
42
来自主题: Programming版 - matlab 和 R 的最大(根本)区别?
趴了。赵老师您认识StatsGuy? 没理由两个不同的人扯的差不多啊
l**********1
发帖数: 5204
43
来自主题: Biology版 - 如何做microarray的scatter plot图?
pls refer
> posted on FRIDAY, JULY 6, 2012
Fix Overplotting with Colored Contour Lines
I saw this plot in the supplement of a recent paper comparing microarray
results to RNA-seq results. Nothing earth-shattering in the paper - you've
probably seen a similar comparison many times before - but I liked how they
solved the overplotting problem using heat-colored contour lines to indicate
density. I asked how to reproduce this figure using R on Stack Exchange,
and my question was quickly answered b... 阅读全帖
S******y
发帖数: 1123
44
您问的问题很好, 回答起来沒有那么简单 :-)
最短平快的方法 sampling,把选的数据拿出来在R或Python里来分析(但有局限性)
Mahout 可以直接在hadoop上做数据挖掘,in batch jobs
尽量不要自己写,用现成open source
m*********[email protected]
实战速成Python/R/Hadoop课程-
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
45
try 一下 read.csv,并且注意用正确的options
若第一行不是header或data. 需skip那一行
若您急着上手R,我提供两小时的jump-start online class
谢谢!
m*********[email protected]
实战速成Python/R/Hadoop课程-
http://plus.google.com/+statsGuyMITBBS/about
S******y
发帖数: 1123
46
来自主题: Statistics版 - reading data into sas 问题
#Python 2.6 StatsGuy 2010-10-04
import re
locations = '''
New York
New York, NY
Irvine
Dallas'''
txt_lst = locations.split('\n')
txt_lst.remove('')
for item in txt_lst:
# pattern is - comma followed by two-letter state abbreviations
p = re.compile('[\s,.](NY|GA|AL|MS|FL|SC)')
m= p.search(item)
if m:
city, state = item.rstrip('\n').split(',')
else:
city = item.rstrip('\n')
state = 'N/A'
print 'City is: ' + city + '; State is: ' + state
#N... 阅读全帖
w******a
发帖数: 25
47
如果用classification tree或是Support Vector Machine或是KNN分析的话,training set and test set的data size太小,怎么分都是不够的.
请问statsguy,该怎么分呢?要bootstrap吗?
l******1
发帖数: 86
48
谢谢
StatsGuy, Actuaries,budmiller,还有被我confused的同学们!!!!!
w******a
发帖数: 25
49
StatsGuy方便把code也在这里贴一下吗?谢谢
S******y
发帖数: 1123
50
#StatsGuy 2010-09-17 Python2.6
#Fill in missing data with complementary data
missing = '''
a 1 . 1 3 1
a . 2 1 4 2
a . 4 5 2 8
a 1 5 2 3 .
b . 9 2 3 2
b 5 9 2 4 4
b . 3 . 5 3
c 2 . . . .'''
complete='''
a 1 2 1
a 2 2 2
a 3 4 8
a 1 5 6
b 1 2
b 5 2
b 3 4
c 2 3 4 7'''
NUMBER_OF_VARS = 5
dx={} #map to see which column is missing
d1={} #original missing data set
d2={} #complementary data set
lst = [0 for x in range(NUMBER_OF_VARS)] #0 - good column; 1- bad column for an id
missing_lst = missin
首页 上页 1 2 3 4 下页 末页 (共4页)