由买买提看人间百态
登录
首页
论坛
未名存档
话题女王
小圈子
马甲追踪
版面排名
流量曲线
水枪排名
发帖量曲线
发帖版面饼图
发帖时间柱图
关于本站
帮助
boards
本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字
访问原贴
DataSciences版
- 数字江湖的琅琊榜
相关主题
●
有谁做过kaggle walmart那个project
●
kaggle上有个
●
急,xgboost prediction的问题
●
Kaggle四月一号的题The Random Number Grand Challenge太搞笑了
●
windows下安装xgboost求助(还是不行……)
●
有没有人想报Cloudera的Data Scientist Certificate的
●
求教分类问题中预测概率的问题
●
kaggle上面的竞赛对找data scientist的工作帮助大吗?
●
请教:现在那些package实现gradient boosting tree比较好?
●
被layoff了
●
恭喜开版,发个刚看到的好玩的machine learning的图
●
kaggle的别人提交是看不见的?
●
[Kaggle Contest] Predict the 2014 NCAA Basketball Tournament
●
有谁在上UW的data science课吗?
●
【真心请教】选master project课题 - 有包子 (转载)
●
大家都怎么做kaggle 上面的题?
相关话题的讨论汇总
话题: 江湖
话题: 排名
话题: 数据
话题: kaggle
话题: 招数
进入DataSciences版参与讨论
1
(共1页)
H******Y
发帖数: 71
1
“白鹿原”好看,但沉重。太太说不如“楚乔传”,架空穿越剧,帅哥玛丽苏,轻松。
我瞧不起这种YY,可也乐意躲那里做个梦。
做梦可能比现实更重要,了不起的盖茨比就靠他梦中的黛西活着,他的黛西不是那个叫
黛西的女人。梦没了,他就死了。
今天说一个梦的弱化版:网上江湖。互联网上有一个数据科学家扬名立万的地方,叫
kaggle,本是一个澳大利亚的公司,后来被google收购。
kaggle隔三差五地搞competition,各路英雄竞相登台,大打出手,为江湖地位。每个
competition都有一个即时排名。排名前三的有钱拿,那是为一些疯子般的偏执者准备
的。
作为数据科学的菜鸟,我也报了一个,下了数据,一番折腾后,提交预测结果,1分钟
后,网上弹出排名。菜鸟的心慌如同初恋,不知江湖深浅啊。
开始成绩不理想,只能闭关修炼,再次出手,排名嗖地窜升,跳进top 10%,激动,不
再回顾排我后面的弱者,紧紧盯着那些领先者。
好景不长,转眼就是周末,我玩回来一上网,排名下了好几十位,网上高手多,一天不
学习,赶不上刘少奇。得,再度闭关。
我参加的是一个next basket的项目:商店里有购买历史,猜猜下次顾客来会买啥。问
题很简单,人心很复杂,购物很多时候是个随性的过程,买与不买都在一念间,一口断
定某个必买肯定是扯淡,只能猜个可能性。
虽然我也算一个IT专业人士,可睁眼到江湖上一瞧,落伍了。
行走江湖靠两条,一个是兵器,一个是招数。我们这代人在学IT时,兵器很粗糙,不少
时间用在打磨利器上,琢磨招数的时间相对偏少。
现在江湖变了,信息畅通,谁是屠龙刀,谁是倚天剑,一目了然。而且,虚拟江湖上的
兵器是不要钱的,完全free,无限copy。
目前数据科学排名第一的大杀器叫xgboost,高手武器库必备。自古英雄出少年,这个
杀器是华盛顿大学的一个华裔小孩子做出来的。自豪吧,华人。
稍摸着点江湖门道的人都会用xgboost,那真正的比试全靠招数,俗话叫点子。以前我
们瞧不起光有点子的人,因为点子离现实的距离很远。比如,有人吹牛要做一个亘古未
见的高楼,我们瞧不起他,他没法靠他一个人建楼。
现在不同了,只有想不出,没有做不出。在数据科学领域,尤其如此,好用的工具随手
可拾,只要点子好,搭建是相对容易的。这也是为什么江湖上少年英雄倍出,他们脑子
快点子新,稍微认真点,就能真的出东西。
那老江湖是不是没法混了?倒也不是,也有成精的。kaggle有一个总排名,数据科学的
琅琊榜,排名靠前的多是男的。象刘涛能进琅琊榜前十,贝微微在PK榜上靠前,这在数
字江湖里,基本上不可能,原因嘛,我猜是她们太漂亮。
数据琅琊榜有6万多人。先看排名第二的,是个俄罗斯人,住在莫斯科,有头像,白白
的,胖胖的,愣愣的。据说他是克格勃雇佣的国家级黑客。
他在网上泄露了一些初级武功,入门招数。打开研读,风格诡异。极简,在打字的数量
上;极深,在每行语句的能量上。
总排行榜的冠军是一个美国人,住在三藩,看上去是个正常人,因为他在正经公司就职
,airbnb。这人看面相,就是路人甲,没特点,记不住。
这两位看岁数都不算小,老江湖无疑。每个人功力都很深,可邪门的是,美俄还合作。
他俩经常联手,一起组队打competition,所到之处,无不披靡。
顶尖大神怎么赢?有人研究过,他们关键时刻会用组合武器,在细节上胜出。
这个数字江湖里有世界上最好的数据科学家。在kaggle上闯荡后,回头看自己公司内部
的data scenientist,才知道他们有多low。
虚拟江湖远远胜过现实。这让我怀疑一些根深蒂固的观念。什么时候都别忘记去江湖上
走走,世界很大,个人很小。
r**********d
发帖数: 510
2
写的太棒了
m******n
发帖数: 453
3
都是炫技而已,跟当年打星际的差不多,或者跟拳皇八神连发鬼步差不多的
因为实际工作中,根本没有公司会这么做的
1
(共1页)
进入DataSciences版参与讨论
相关主题
●
大家都怎么做kaggle 上面的题?
●
请教:现在那些package实现gradient boosting tree比较好?
●
Bayesian inference
●
恭喜开版,发个刚看到的好玩的machine learning的图
●
要不要继续当ds?
●
[Kaggle Contest] Predict the 2014 NCAA Basketball Tournament
●
请问哪里可以找一些免费的project练习?
●
【真心请教】选master project课题 - 有包子 (转载)
●
有谁做过kaggle walmart那个project
●
kaggle上有个
●
急,xgboost prediction的问题
●
Kaggle四月一号的题The Random Number Grand Challenge太搞笑了
●
windows下安装xgboost求助(还是不行……)
●
有没有人想报Cloudera的Data Scientist Certificate的
●
求教分类问题中预测概率的问题
●
kaggle上面的竞赛对找data scientist的工作帮助大吗?
相关话题的讨论汇总
话题: 江湖
话题: 排名
话题: 数据
话题: kaggle
话题: 招数
未名新帖统计
// 7月16日
#
版面
帖数(主题数)
-
全站
4871 (796)
1
Military
3777 (569)
2
Stock
341 (51)
3
Joke
117 (17)
4
History
116 (3)
5
Automobile
100 (9)
6
USANews
55 (9)
7
Midlife
45 (1)
8
Headline
41 (41)
9
Dreamer
33 (13)
10
FleaMarket
32 (20)
11
Living
30 (7)
* 这里只显示发帖超过25的版面,努力灌水吧:-)
历史上的今天
faintcat妹妹看进来~~
发表于12年前.
NSC, PD 1/7/2007, EB2, ...
发表于11年前.
[FBA求购]MJVE2 758 MJVM2 ...
发表于6年前.
老生常谈,归与不归
发表于10年前.
【申请】Seattle西雅图 版版主——申请人...
发表于9年前.
宝宝出生,头骨骨折,求祝福
发表于9年前.
求推荐舒缓优美的古典音乐
发表于11年前.
百分之一的北京人上北大 中国网友愤怒(转载)
发表于10年前.
新人带狗狗Bailey来报道
发表于12年前.
全世界最有价值的运动队
发表于10年前.
请问大切诺基的质量如何
发表于6年前.
TNND,军版全是BKC
发表于15年前.
Inception
发表于12年前.
微软的有些家属可真恶心,为了卖保险脸都不要了
发表于10年前.
每周坐高铁的苦逼来说说感受吧!!
发表于9年前.