由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - kaggle上那批人太逆天了
相关主题
总结一下kaggle比赛R语言,小笔记本,如何调参?
关于搞ML刷数据的职业前途Kaggle比赛禁止中国人参加
有没有大牛愿意牵头搞一个 deep learning projectZillow Prize讨论专用贴
数据科学碗2017廖方舟 李哲 金奖! (转载)
ML 需不需要搞懂那些数学求教 xgboost train error 非常小,咋回事
Kaggle 被买了准备向wdong大牛学习单干了
数据碗的结果出来了 weidong站上英雄榜了GAN是不是DL里面最活跃的领域?
Ai这个社团很多人是很坏的什么都别说了,刷题是王道,我要加入拳皇帮了
相关话题的讨论汇总
话题: kaggle话题: br话题: python话题: wdong话题: c++
进入Programming版参与讨论
1 (共1页)
w***g
发帖数: 5958
1
都不是易与之辈。要拿钱太太太难了。
现在还是前四,明天估计就不保了。
我不用上班已经很有优势了,最近两个星期全时间搞。
所有的活都推掉了,竟然还是搞不过他们。
l*******m
发帖数: 1096
2
你和你LP很牛,那些欧洲老时间也很多。还有些疯狂的能开几十个aws instances

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

e*******o
发帖数: 4654
3
牛逼
说实话我觉个kaggle拿钱,性价比奇低。
好多人一年干的活,也顶不上kaggle上5k的project。
适合wdong这样不以挣钱为目的的大牛。
等我下学期学学machine learning, 也去凑凑热闹。

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

e*******o
发帖数: 4654
4
话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。
n*****3
发帖数: 1584
5
能拿个 kaggle master ,
resume 上还是能增色不少奥

【在 e*******o 的大作中提到】
: 话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。
e*******o
发帖数: 4654
6
wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。

【在 n*****3 的大作中提到】
: 能拿个 kaggle master ,
: resume 上还是能增色不少奥

n******7
发帖数: 12463
7
wdong带人玩不?
选个项目
你指挥,我打杂
成不?
n*****3
发帖数: 1584
8
obama 也是有resume 的

【在 e*******o 的大作中提到】
: wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。
s*********d
发帖数: 531
9
膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚
的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking,
bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向..
l*******m
发帖数: 1096
10
进10%还是容易的,top10比较费劲

..

【在 s*********d 的大作中提到】
: 膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚
: 的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking,
: bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向..

相关主题
Kaggle 被买了R语言,小笔记本,如何调参?
数据碗的结果出来了 weidong站上英雄榜了Kaggle比赛禁止中国人参加
Ai这个社团很多人是很坏的Zillow Prize讨论专用贴
进入Programming版参与讨论
j**********3
发帖数: 3211
11
想想也很难吧?
n******7
发帖数: 12463
12
搜了一下关于kaggle的讨论
wdong不用纠结了,你和第一名的差距可能只是noise造成的
https://www.reddit.com/r/MachineLearning/comments/1v59e6/is_kag
way_to_get_noticed_by/
Ranking in the top 5 requires some experience/skill, but also luck. Very
often, the difference between the First and Fifth person is dataset noise.
This is why the positions rearrange so much when the hold out data is
released at the end of the competition.
不过这哥们儿又说:
Ranking in the top 20 or so for most competitions is fairly easy which is
why no one would notice or care. Most blackbox methods can put you in that
range when used correctly.
我怀疑他说的percentile
n******7
发帖数: 12463
13
thousands of hours... 这真是一年的工作时间了
I was active in contests before I got my full-time job as well (won a couple
of machine learning TC marathons and was top 20 in the netflix prize until
a couple months before the end when I started working and didn't have time)
- basically it was a tiny plus but nobody actively reached out to me, not to
mention it took thousands of hours of my time. Of course it did make the
interview itself a piece of cake. If I was hiring that would be part of how
I recruit.
e*******o
发帖数: 4654
14
没性价比可言
除非enjoy这个过程


: thousands of hours... 这真是一年的工作时间了

: I was active in contests before I got my full-time job as well (won a
couple

: of machine learning TC marathons and was top 20 in the netflix prize
until

: a couple months before the end when I started working and didn't have
time)

: - basically it was a tiny plus but nobody actively reached out to me,
not to

: mention it took thousands of hours of my time. Of course it did make
the

: interview itself a piece of cake. If I was hiring that would be part
of how

: I recruit.



【在 n******7 的大作中提到】
: thousands of hours... 这真是一年的工作时间了
: I was active in contests before I got my full-time job as well (won a couple
: of machine learning TC marathons and was top 20 in the netflix prize until
: a couple months before the end when I started working and didn't have time)
: - basically it was a tiny plus but nobody actively reached out to me, not to
: mention it took thousands of hours of my time. Of course it did make the
: interview itself a piece of cake. If I was hiring that would be part of how
: I recruit.

s*********n
发帖数: 34
15
楼主牛人啊。排名最高是第一,当前是第四。
n******7
发帖数: 12463
16
我本来想每天2小时,搞几个月就差不多了
不知道为什么要这么多时间
1000小时就够从头搞篇方法的bioinfo文章了
这还包括data processing, performance evaluation & comparison, manuscript
writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的?
可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比
已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。

a
prize
have
,

【在 e*******o 的大作中提到】
: 没性价比可言
: 除非enjoy这个过程
:
:
: thousands of hours... 这真是一年的工作时间了
:
: I was active in contests before I got my full-time job as well (won a
: couple
:
: of machine learning TC marathons and was top 20 in the netflix prize
: until
:
: a couple months before the end when I started working and didn't have
: time)

e*******o
发帖数: 4654
17
哈哈。
搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平
都不如你。
kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多
像wdong这样的phd,吃饱撑了,就是玩玩。

的?

【在 n******7 的大作中提到】
: 我本来想每天2小时,搞几个月就差不多了
: 不知道为什么要这么多时间
: 1000小时就够从头搞篇方法的bioinfo文章了
: 这还包括data processing, performance evaluation & comparison, manuscript
: writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的?
: 可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比
: 已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。
:
: a
: prize

w***g
发帖数: 5958
18
我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
而且还有我LD这个超强队友。
无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
很有一分钱逼死英雄汉的感觉。

【在 e*******o 的大作中提到】
: 哈哈。
: 搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平
: 都不如你。
: kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多
: 像wdong这样的phd,吃饱撑了,就是玩玩。
:
: 的?

l******n
发帖数: 9344
19
这就是学术界的做法,为了0.1%争个你死我活。为了这0.1%你要花90%的时间,工业应
用里谁会这样?

【在 w***g 的大作中提到】
: 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
: 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
: 而且还有我LD这个超强队友。
: 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
: 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
: 很有一分钱逼死英雄汉的感觉。

l*******m
发帖数: 1096
20
加油,你前面的是千年老四

【在 w***g 的大作中提到】
: 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
: 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
: 而且还有我LD这个超强队友。
: 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
: 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
: 很有一分钱逼死英雄汉的感觉。

相关主题
廖方舟 李哲 金奖! (转载)GAN是不是DL里面最活跃的领域?
求教 xgboost train error 非常小,咋回事什么都别说了,刷题是王道,我要加入拳皇帮了
准备向wdong大牛学习单干了看了几个kaggle的答题,有点迷惑了
进入Programming版参与讨论
w***g
发帖数: 5958
21
确实是千年老四,笑死我了。

【在 l*******m 的大作中提到】
: 加油,你前面的是千年老四
n******7
发帖数: 12463
22
我很好奇的查了一下这个竞赛以及排名
非常非常惊讶
明白你为啥会涉及bioinfo了
只能说,世界太小了
做人一定要多行善事,广结善缘。。。

【在 w***g 的大作中提到】
: 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
: 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
: 而且还有我LD这个超强队友。
: 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
: 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
: 很有一分钱逼死英雄汉的感觉。

g****s
发帖数: 340
23
牛!
e*******o
发帖数: 4654
24
生信确实有很多可搞的地方。
我目前的实验室搞到病人CSF中的一些 sample,测序,基本上没怎么好好用。这还是比
较top的医学院
给我的那点钱,我也没很大动力去搞。学术界我看这么下去,没啥好未来。

【在 n******7 的大作中提到】
: 我很好奇的查了一下这个竞赛以及排名
: 非常非常惊讶
: 明白你为啥会涉及bioinfo了
: 只能说,世界太小了
: 做人一定要多行善事,广结善缘。。。

W***o
发帖数: 6519
25
这比赛要到14号呢,wdong 加油,要挺住!!!
l*******m
发帖数: 1096
26
话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄
就是一个,他用.net + cuda

【在 w***g 的大作中提到】
: 确实是千年老四,笑死我了。
w***g
发帖数: 5958
27
这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
前面提交190个版本的很可能已经overfit排行榜了。
这人似乎也是自己有个business,所以上真名打广告来了。

【在 l*******m 的大作中提到】
: 话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄
: 就是一个,他用.net + cuda

w***g
发帖数: 5958
28
在别人手下冲锋陷阵确实没法调动人积极性。
钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
都打不过了。
现在正式宣告所有的办法都已经想尽了。freeze code了。
明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
第一应该还是python的。这次完了我也要全面转python了。
要有同学有兴趣我到时候把代码开源了。

【在 n******7 的大作中提到】
: 我很好奇的查了一下这个竞赛以及排名
: 非常非常惊讶
: 明白你为啥会涉及bioinfo了
: 只能说,世界太小了
: 做人一定要多行善事,广结善缘。。。

n******7
发帖数: 12463
29
学术界可以发论文
startup可以分股份
其他的确实动力不大了

【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

n******7
发帖数: 12463
30
kaggle 应该有完全blind的dataset做最后评估吧
不然暴力提交无数版本就行了

【在 w***g 的大作中提到】
: 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
: 前面提交190个版本的很可能已经overfit排行榜了。
: 这人似乎也是自己有个business,所以上真名打广告来了。

相关主题
[bssd]最近公司有人整我关于搞ML刷数据的职业前途
被opengl害惨了!有没有大牛愿意牵头搞一个 deep learning project
总结一下kaggle比赛数据科学碗2017
进入Programming版参与讨论
e*******o
发帖数: 4654
31
说的真对
做的好反而对自己没好处 一个活本来三天做好 你做了三分钟 老板慢慢觉得 只应该付
你三分钟的钱


: 在别人手下冲锋陷阵确实没法调动人积极性。

: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了

: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物

: 都打不过了。

: 现在正式宣告所有的办法都已经想尽了。freeze code了。

: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。

: 我是全C 版本。本来想借此役给C 打个翻身仗的。现在看来连C#都干部过了。

: 第一应该还是python的。这次完了我也要全面转python了。

: 要有同学有兴趣我到时候把代码开源了。



【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

l******n
发帖数: 9344
32
很牛,顶住
能问下是自己写的算法还是现成的算法tuning的?

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

n******7
发帖数: 12463
33
感兴趣,到时候好好学习一下
我用java搞了一年的统计计算啥的
觉得静态语言debug真好,就是java的统计/代数包太差了
经常有东西要自己看paper实现
正想开始学习C++
请问你转python是觉得C++ 做prototype效率太低吗?
不过python的各种库支持确实非常非常齐全

【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

w***g
发帖数: 5958
34
sklean里面东西很全,deep learning的软件大多也支持python。
C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛
反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的
python比较占便宜。

【在 n******7 的大作中提到】
: 感兴趣,到时候好好学习一下
: 我用java搞了一年的统计计算啥的
: 觉得静态语言debug真好,就是java的统计/代数包太差了
: 经常有东西要自己看paper实现
: 正想开始学习C++
: 请问你转python是觉得C++ 做prototype效率太低吗?
: 不过python的各种库支持确实非常非常齐全

w***g
发帖数: 5958
35
自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
现成算法tuning的话大家都会,很难进前几名吧。

【在 l******n 的大作中提到】
: 很牛,顶住
: 能问下是自己写的算法还是现成的算法tuning的?

h*****2
发帖数: 2070
36
能不能简单介绍一下,你们解决了什么实际问题?

【在 w***g 的大作中提到】
: 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
: 现成算法tuning的话大家都会,很难进前几名吧。

l******n
发帖数: 9344
37
厉害。其实这题和现在很多公司做的biomarker发面的研究很类似,我觉得如果这里结
果很好,说不定在biomarker预测疾病上很有借鉴作用

【在 w***g 的大作中提到】
: 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
: 现成算法tuning的话大家都会,很难进前几名吧。

n******7
发帖数: 12463
38
明白了
那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
不过总体确实不错了
考虑的python的 user base,应该会越来越好
要是python能强制type,debug能更给力些就完美了
跑半天报个错退出太痛苦了

【在 w***g 的大作中提到】
: sklean里面东西很全,deep learning的软件大多也支持python。
: C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛
: 反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的
: python比较占便宜。

w***g
发帖数: 5958
39
python跑半天推出我也深恶痛绝。这个应该通过写test case可以部分解决。
C++还有个恶心问题是编译实在太慢。我现在编译一次要好几分钟。

【在 n******7 的大作中提到】
: 明白了
: 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
: sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
: 不过总体确实不错了
: 考虑的python的 user base,应该会越来越好
: 要是python能强制type,debug能更给力些就完美了
: 跑半天报个错退出太痛苦了

a*f
发帖数: 1790
40
python的缩进坑还没填?

【在 n******7 的大作中提到】
: 明白了
: 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
: sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
: 不过总体确实不错了
: 考虑的python的 user base,应该会越来越好
: 要是python能强制type,debug能更给力些就完美了
: 跑半天报个错退出太痛苦了

相关主题
数据科学碗2017数据碗的结果出来了 weidong站上英雄榜了
ML 需不需要搞懂那些数学Ai这个社团很多人是很坏的
Kaggle 被买了R语言,小笔记本,如何调参?
进入Programming版参与讨论
a*f
发帖数: 1790
41
kaggle现在有没有什么简单上手的project可以练习练习?现在的比赛是不是都集中在
数据预处理算法和learning算法上面?

【在 w***g 的大作中提到】
: 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
: 前面提交190个版本的很可能已经overfit排行榜了。
: 这人似乎也是自己有个business,所以上真名打广告来了。

s*****r
发帖数: 550
42
kaggle 到底是怎么运作的啊?
是说第一名才能拿到钱么?
还有就是已经结束的比赛,是不是code不能share啊?
wiki上说 “ the competition host pays the prize money in exchange for "a
worldwide, perpetual, irrevocable and royalty free license [...] to use the
winning Entry", ”
可是如果我想用别人的算法,我从哪里下载他们的source code那

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

d*******r
发帖数: 3299
43
只有民间组织出好的盲审community+制度,才能不鸟学校的山头+门阀文化...

【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

s***o
发帖数: 2191
44
wdong的BSO贴,支持一下
a*f
发帖数: 1790
45
用Java做的一个三层网络运行了一下Customer Satisfaction,三十秒左右就内存溢出
了,是不是需要把不相关的column用算法先滤掉?
java.lang.OutOfMemoryError: GC overhead limit exceeded
java.lang.OutOfMemoryError: Java heap space
p**2
发帖数: 613
46
进来膜拜下大牛,俺周末吹了个牛逼,
拿了5k,完全没技术含量,
就是把2B用WP+plugin做的shopping cart
导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
客户很happy,大家都很愉快,除了2B很生气。

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

w***g
发帖数: 5958
47
你这个才真叫牛,不但拿了钱,别人还高兴。

【在 p**2 的大作中提到】
: 进来膜拜下大牛,俺周末吹了个牛逼,
: 拿了5k,完全没技术含量,
: 就是把2B用WP+plugin做的shopping cart
: 导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
: 客户很happy,大家都很愉快,除了2B很生气。

l*********s
发帖数: 5409
48
做马工可惜了啊

【在 p**2 的大作中提到】
: 进来膜拜下大牛,俺周末吹了个牛逼,
: 拿了5k,完全没技术含量,
: 就是把2B用WP+plugin做的shopping cart
: 导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
: 客户很happy,大家都很愉快,除了2B很生气。

ET
发帖数: 10701
49
给我介绍点活吧/我也擅长做shopping cart

【在 p**2 的大作中提到】
: 进来膜拜下大牛,俺周末吹了个牛逼,
: 拿了5k,完全没技术含量,
: 就是把2B用WP+plugin做的shopping cart
: 导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
: 客户很happy,大家都很愉快,除了2B很生气。

p**2
发帖数: 613
50
俺忽了个悠,又被楼上各路大神嘲笑了。
其实谈了一阵了,然后客户周末才决定弃用WP+Plugin,
俺也是小打小闹,勉强混个奶粉钱,如果哪天接到大活,一定分享。

【在 w***g 的大作中提到】
: 你这个才真叫牛,不但拿了钱,别人还高兴。
相关主题
Kaggle比赛禁止中国人参加求教 xgboost train error 非常小,咋回事
Zillow Prize讨论专用贴准备向wdong大牛学习单干了
廖方舟 李哲 金奖! (转载)GAN是不是DL里面最活跃的领域?
进入Programming版参与讨论
w***g
发帖数: 5958
51
刚才提交的时候可能犯了个在错误,估计要功亏一篑了。

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

K***s
发帖数: 2063
52
膜拜

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

v*******e
发帖数: 11604
53
python 3.5 有gradual typing,可以试试看,把心得告诉我们。

【在 n******7 的大作中提到】
: 明白了
: 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
: sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
: 不过总体确实不错了
: 考虑的python的 user base,应该会越来越好
: 要是python能强制type,debug能更给力些就完美了
: 跑半天报个错退出太痛苦了

l****u
发帖数: 1764
54
我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?

【在 a*f 的大作中提到】
: python的缩进坑还没填?
f********3
发帖数: 20
55
可以多敲几个空格嘛。。。
n******7
发帖数: 12463
56
这也怪python?
;键坏了好多语言就不能写了吧
{}键坏了就更多语言不能写了吧
还有,你的回车键坏了怎么办?

【在 l****u 的大作中提到】
: 我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?
n******7
发帖数: 12463
57
这个估计改不了了
也还好
编辑器都能处理
也就是影响一下代码文件大小

【在 a*f 的大作中提到】
: python的缩进坑还没填?
n******7
发帖数: 12463
58
看起来不错
我得现研究一下python 3.x的库支持如何了

【在 v*******e 的大作中提到】
: python 3.5 有gradual typing,可以试试看,把心得告诉我们。
s***o
发帖数: 2191
59
排第二了。不过好像排名重新计算了。咋回事?

【在 w***g 的大作中提到】
: 刚才提交的时候可能犯了个在错误,估计要功亏一篑了。
n******7
发帖数: 12463
60
好像很多team挂了

【在 s***o 的大作中提到】
: 排第二了。不过好像排名重新计算了。咋回事?
相关主题
什么都别说了,刷题是王道,我要加入拳皇帮了被opengl害惨了!
看了几个kaggle的答题,有点迷惑了总结一下kaggle比赛
[bssd]最近公司有人整我关于搞ML刷数据的职业前途
进入Programming版参与讨论
l****u
发帖数: 1764
61
只要对齐了就行, 空格也可以么?
我发现windows下一般的文本编辑器的tab缩进的距离好像和linux下vim的tab相差好大

【在 f********3 的大作中提到】
: 可以多敲几个空格嘛。。。
l****u
发帖数: 1764
62
没有回车也能写吧,只是比较难看

【在 n******7 的大作中提到】
: 这也怪python?
: ;键坏了好多语言就不能写了吧
: {}键坏了就更多语言不能写了吧
: 还有,你的回车键坏了怎么办?

w***g
发帖数: 5958
63
换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。

【在 n******7 的大作中提到】
: 好像很多team挂了
K***s
发帖数: 2063
64
希望大师得奖,然后给大家开个课讲讲

【在 w***g 的大作中提到】
: 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
: 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。

n******7
发帖数: 12463
65
你好像在这1%test set上稳排第二了
之前的第二掉了不少
之前的第三更是不见了,可见确实overfit了
好像是前三名都有钱?写着"in the money"

【在 w***g 的大作中提到】
: 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
: 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。

w***g
发帖数: 5958
66
因为之前那个版本leader board的ground truth release了,
那部分数据可以用来做训练集,所以有一部分人还在拿那个
数据和原有的数据合起来训练。去年第一名那组号称要训练
到deadline为止,所以还有不少牛组还没提交。
之前第二那组不知道怎么回事,感觉不正常。

【在 n******7 的大作中提到】
: 你好像在这1%test set上稳排第二了
: 之前的第二掉了不少
: 之前的第三更是不见了,可见确实overfit了
: 好像是前三名都有钱?写着"in the money"

w***g
发帖数: 5958
67
都不是易与之辈。要拿钱太太太难了。
现在还是前四,明天估计就不保了。
我不用上班已经很有优势了,最近两个星期全时间搞。
所有的活都推掉了,竟然还是搞不过他们。
l*******m
发帖数: 1096
68
你和你LP很牛,那些欧洲老时间也很多。还有些疯狂的能开几十个aws instances

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

e*******o
发帖数: 4654
69
牛逼
说实话我觉个kaggle拿钱,性价比奇低。
好多人一年干的活,也顶不上kaggle上5k的project。
适合wdong这样不以挣钱为目的的大牛。
等我下学期学学machine learning, 也去凑凑热闹。

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

e*******o
发帖数: 4654
70
话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。
相关主题
关于搞ML刷数据的职业前途ML 需不需要搞懂那些数学
有没有大牛愿意牵头搞一个 deep learning projectKaggle 被买了
数据科学碗2017数据碗的结果出来了 weidong站上英雄榜了
进入Programming版参与讨论
n*****3
发帖数: 1584
71
能拿个 kaggle master ,
resume 上还是能增色不少奥

【在 e*******o 的大作中提到】
: 话说wdong bioinfo搞得咋样了?随便搞搞都比搞这些竞赛影响大。
e*******o
发帖数: 4654
72
wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。

【在 n*****3 的大作中提到】
: 能拿个 kaggle master ,
: resume 上还是能增色不少奥

n******7
发帖数: 12463
73
wdong带人玩不?
选个项目
你指挥,我打杂
成不?
n*****3
发帖数: 1584
74
obama 也是有resume 的

【在 e*******o 的大作中提到】
: wdong这样的大牛,你要是跟人家要简历,那是侮辱人家。
s*********d
发帖数: 531
75
膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚
的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking,
bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向..
l*******m
发帖数: 1096
76
进10%还是容易的,top10比较费劲

..

【在 s*********d 的大作中提到】
: 膜拜大牛,感觉进top 10%已经很难了,上次做一个kaggle的项目,抽3天时间从早到晚
: 的搞,累了个半死。。。能指点下经验吗,现在会一些基本的ensemble了,stacking,
: bagging什么的,不知道进一步提高的点在哪,feature engineering完全找不到方向..

j**********3
发帖数: 3211
77
想想也很难吧?
n******7
发帖数: 12463
78
搜了一下关于kaggle的讨论
wdong不用纠结了,你和第一名的差距可能只是noise造成的
https://www.reddit.com/r/MachineLearning/comments/1v59e6/is_kag
way_to_get_noticed_by/
Ranking in the top 5 requires some experience/skill, but also luck. Very
often, the difference between the First and Fifth person is dataset noise.
This is why the positions rearrange so much when the hold out data is
released at the end of the competition.
不过这哥们儿又说:
Ranking in the top 20 or so for most competitions is fairly easy which is
why no one would notice or care. Most blackbox methods can put you in that
range when used correctly.
我怀疑他说的percentile
n******7
发帖数: 12463
79
thousands of hours... 这真是一年的工作时间了
I was active in contests before I got my full-time job as well (won a couple
of machine learning TC marathons and was top 20 in the netflix prize until
a couple months before the end when I started working and didn't have time)
- basically it was a tiny plus but nobody actively reached out to me, not to
mention it took thousands of hours of my time. Of course it did make the
interview itself a piece of cake. If I was hiring that would be part of how
I recruit.
e*******o
发帖数: 4654
80
没性价比可言
除非enjoy这个过程


: thousands of hours... 这真是一年的工作时间了

: I was active in contests before I got my full-time job as well (won a
couple

: of machine learning TC marathons and was top 20 in the netflix prize
until

: a couple months before the end when I started working and didn't have
time)

: - basically it was a tiny plus but nobody actively reached out to me,
not to

: mention it took thousands of hours of my time. Of course it did make
the

: interview itself a piece of cake. If I was hiring that would be part
of how

: I recruit.



【在 n******7 的大作中提到】
: thousands of hours... 这真是一年的工作时间了
: I was active in contests before I got my full-time job as well (won a couple
: of machine learning TC marathons and was top 20 in the netflix prize until
: a couple months before the end when I started working and didn't have time)
: - basically it was a tiny plus but nobody actively reached out to me, not to
: mention it took thousands of hours of my time. Of course it did make the
: interview itself a piece of cake. If I was hiring that would be part of how
: I recruit.

相关主题
Ai这个社团很多人是很坏的Zillow Prize讨论专用贴
R语言,小笔记本,如何调参?廖方舟 李哲 金奖! (转载)
Kaggle比赛禁止中国人参加求教 xgboost train error 非常小,咋回事
进入Programming版参与讨论
s*********n
发帖数: 34
81
楼主牛人啊。排名最高是第一,当前是第四。
n******7
发帖数: 12463
82
我本来想每天2小时,搞几个月就差不多了
不知道为什么要这么多时间
1000小时就够从头搞篇方法的bioinfo文章了
这还包括data processing, performance evaluation & comparison, manuscript
writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的?
可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比
已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。

a
prize
have
,

【在 e*******o 的大作中提到】
: 没性价比可言
: 除非enjoy这个过程
:
:
: thousands of hours... 这真是一年的工作时间了
:
: I was active in contests before I got my full-time job as well (won a
: couple
:
: of machine learning TC marathons and was top 20 in the netflix prize
: until
:
: a couple months before the end when I started working and didn't have
: time)

e*******o
发帖数: 4654
83
哈哈。
搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平
都不如你。
kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多
像wdong这样的phd,吃饱撑了,就是玩玩。

的?

【在 n******7 的大作中提到】
: 我本来想每天2小时,搞几个月就差不多了
: 不知道为什么要这么多时间
: 1000小时就够从头搞篇方法的bioinfo文章了
: 这还包括data processing, performance evaluation & comparison, manuscript
: writing, 这些都很费时间。就我的了解,这些上游和下游的东西kaggle都给你弄好的?
: 可能是不断的trial and error? 毕竟是跟人比,标准不断提高。发文章的话,只要比
: 已有的方法好就可以了。别人不服也只能跟着灌水,再发一篇。
:
: a
: prize

w***g
发帖数: 5958
84
我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
而且还有我LD这个超强队友。
无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
很有一分钱逼死英雄汉的感觉。

【在 e*******o 的大作中提到】
: 哈哈。
: 搞bioinfo,有domain knowledge 的壁垒,你只跟很少人竞争,这些人大部分可能水平
: 都不如你。
: kaggle 这个,卧槽,完全不一样。domain knowledge的壁垒几乎没有了,然后,很多
: 像wdong这样的phd,吃饱撑了,就是玩玩。
:
: 的?

l******n
发帖数: 9344
85
这就是学术界的做法,为了0.1%争个你死我活。为了这0.1%你要花90%的时间,工业应
用里谁会这样?

【在 w***g 的大作中提到】
: 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
: 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
: 而且还有我LD这个超强队友。
: 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
: 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
: 很有一分钱逼死英雄汉的感觉。

l*******m
发帖数: 1096
86
加油,你前面的是千年老四

【在 w***g 的大作中提到】
: 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
: 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
: 而且还有我LD这个超强队友。
: 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
: 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
: 很有一分钱逼死英雄汉的感觉。

w***g
发帖数: 5958
87
确实是千年老四,笑死我了。

【在 l*******m 的大作中提到】
: 加油,你前面的是千年老四
n******7
发帖数: 12463
88
我很好奇的查了一下这个竞赛以及排名
非常非常惊讶
明白你为啥会涉及bioinfo了
只能说,世界太小了
做人一定要多行善事,广结善缘。。。

【在 w***g 的大作中提到】
: 我也不是吃饱了撑的。我没啥credential,也要靠这个撑门面的。
: 而且这次奖金都快顶我一年工资了。确实是在时间允许范围内使出全身解数了。
: 而且还有我LD这个超强队友。
: 无奈敌人太强大了。我们底下那组kunsthart是去年第一,就在过去两天内
: 又提高了好多。我们昨天又刷高了一点点分数才勉强还没被干掉。
: 很有一分钱逼死英雄汉的感觉。

g****s
发帖数: 340
89
牛!
e*******o
发帖数: 4654
90
生信确实有很多可搞的地方。
我目前的实验室搞到病人CSF中的一些 sample,测序,基本上没怎么好好用。这还是比
较top的医学院
给我的那点钱,我也没很大动力去搞。学术界我看这么下去,没啥好未来。

【在 n******7 的大作中提到】
: 我很好奇的查了一下这个竞赛以及排名
: 非常非常惊讶
: 明白你为啥会涉及bioinfo了
: 只能说,世界太小了
: 做人一定要多行善事,广结善缘。。。

相关主题
准备向wdong大牛学习单干了看了几个kaggle的答题,有点迷惑了
GAN是不是DL里面最活跃的领域?[bssd]最近公司有人整我
什么都别说了,刷题是王道,我要加入拳皇帮了被opengl害惨了!
进入Programming版参与讨论
W***o
发帖数: 6519
91
这比赛要到14号呢,wdong 加油,要挺住!!!
l*******m
发帖数: 1096
92
话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄
就是一个,他用.net + cuda

【在 w***g 的大作中提到】
: 确实是千年老四,笑死我了。
w***g
发帖数: 5958
93
这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
前面提交190个版本的很可能已经overfit排行榜了。
这人似乎也是自己有个business,所以上真名打广告来了。

【在 l*******m 的大作中提到】
: 话说kaggle有3,4个深度学习民间高手,自己写framework到kaggle试水。这位老兄
: 就是一个,他用.net + cuda

w***g
发帖数: 5958
94
在别人手下冲锋陷阵确实没法调动人积极性。
钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
都打不过了。
现在正式宣告所有的办法都已经想尽了。freeze code了。
明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
第一应该还是python的。这次完了我也要全面转python了。
要有同学有兴趣我到时候把代码开源了。

【在 n******7 的大作中提到】
: 我很好奇的查了一下这个竞赛以及排名
: 非常非常惊讶
: 明白你为啥会涉及bioinfo了
: 只能说,世界太小了
: 做人一定要多行善事,广结善缘。。。

n******7
发帖数: 12463
95
学术界可以发论文
startup可以分股份
其他的确实动力不大了

【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

n******7
发帖数: 12463
96
kaggle 应该有完全blind的dataset做最后评估吧
不然暴力提交无数版本就行了

【在 w***g 的大作中提到】
: 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
: 前面提交190个版本的很可能已经overfit排行榜了。
: 这人似乎也是自己有个business,所以上真名打广告来了。

e*******o
发帖数: 4654
97
说的真对
做的好反而对自己没好处 一个活本来三天做好 你做了三分钟 老板慢慢觉得 只应该付
你三分钟的钱


: 在别人手下冲锋陷阵确实没法调动人积极性。

: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了

: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物

: 都打不过了。

: 现在正式宣告所有的办法都已经想尽了。freeze code了。

: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。

: 我是全C 版本。本来想借此役给C 打个翻身仗的。现在看来连C#都干部过了。

: 第一应该还是python的。这次完了我也要全面转python了。

: 要有同学有兴趣我到时候把代码开源了。



【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

l******n
发帖数: 9344
98
很牛,顶住
能问下是自己写的算法还是现成的算法tuning的?

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

n******7
发帖数: 12463
99
感兴趣,到时候好好学习一下
我用java搞了一年的统计计算啥的
觉得静态语言debug真好,就是java的统计/代数包太差了
经常有东西要自己看paper实现
正想开始学习C++
请问你转python是觉得C++ 做prototype效率太低吗?
不过python的各种库支持确实非常非常齐全

【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

w***g
发帖数: 5958
100
sklean里面东西很全,deep learning的软件大多也支持python。
C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛
反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的
python比较占便宜。

【在 n******7 的大作中提到】
: 感兴趣,到时候好好学习一下
: 我用java搞了一年的统计计算啥的
: 觉得静态语言debug真好,就是java的统计/代数包太差了
: 经常有东西要自己看paper实现
: 正想开始学习C++
: 请问你转python是觉得C++ 做prototype效率太低吗?
: 不过python的各种库支持确实非常非常齐全

相关主题
总结一下kaggle比赛数据科学碗2017
关于搞ML刷数据的职业前途ML 需不需要搞懂那些数学
有没有大牛愿意牵头搞一个 deep learning projectKaggle 被买了
进入Programming版参与讨论
w***g
发帖数: 5958
101
自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
现成算法tuning的话大家都会,很难进前几名吧。

【在 l******n 的大作中提到】
: 很牛,顶住
: 能问下是自己写的算法还是现成的算法tuning的?

h*****2
发帖数: 2070
102
能不能简单介绍一下,你们解决了什么实际问题?

【在 w***g 的大作中提到】
: 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
: 现成算法tuning的话大家都会,很难进前几名吧。

l******n
发帖数: 9344
103
厉害。其实这题和现在很多公司做的biomarker发面的研究很类似,我觉得如果这里结
果很好,说不定在biomarker预测疾病上很有借鉴作用

【在 w***g 的大作中提到】
: 自己写的算法。其中还有些新发明的黑科技。我也很好奇别人是怎么搞的。
: 现成算法tuning的话大家都会,很难进前几名吧。

n******7
发帖数: 12463
104
明白了
那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
不过总体确实不错了
考虑的python的 user base,应该会越来越好
要是python能强制type,debug能更给力些就完美了
跑半天报个错退出太痛苦了

【在 w***g 的大作中提到】
: sklean里面东西很全,deep learning的软件大多也支持python。
: C++不少东西得自己写。我感觉我更像做产品的,但是搞这种比赛
: 反正最后只看一个分数,连速度都不是很在乎。所以上糙快猛的
: python比较占便宜。

w***g
发帖数: 5958
105
python跑半天推出我也深恶痛绝。这个应该通过写test case可以部分解决。
C++还有个恶心问题是编译实在太慢。我现在编译一次要好几分钟。

【在 n******7 的大作中提到】
: 明白了
: 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
: sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
: 不过总体确实不错了
: 考虑的python的 user base,应该会越来越好
: 要是python能强制type,debug能更给力些就完美了
: 跑半天报个错退出太痛苦了

a*f
发帖数: 1790
106
python的缩进坑还没填?

【在 n******7 的大作中提到】
: 明白了
: 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
: sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
: 不过总体确实不错了
: 考虑的python的 user base,应该会越来越好
: 要是python能强制type,debug能更给力些就完美了
: 跑半天报个错退出太痛苦了

a*f
发帖数: 1790
107
kaggle现在有没有什么简单上手的project可以练习练习?现在的比赛是不是都集中在
数据预处理算法和learning算法上面?

【在 w***g 的大作中提到】
: 这哥们太牛了,他只提交了7个版本。他提交三个版本的时候就已经是前三了。
: 前面提交190个版本的很可能已经overfit排行榜了。
: 这人似乎也是自己有个business,所以上真名打广告来了。

s*****r
发帖数: 550
108
kaggle 到底是怎么运作的啊?
是说第一名才能拿到钱么?
还有就是已经结束的比赛,是不是code不能share啊?
wiki上说 “ the competition host pays the prize money in exchange for "a
worldwide, perpetual, irrevocable and royalty free license [...] to use the
winning Entry", ”
可是如果我想用别人的算法,我从哪里下载他们的source code那

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

d*******r
发帖数: 3299
109
只有民间组织出好的盲审community+制度,才能不鸟学校的山头+门阀文化...

【在 w***g 的大作中提到】
: 在别人手下冲锋陷阵确实没法调动人积极性。
: 钱少倒是其次,问题是东西做出来了功劳都是领导的。而且无形中提高了
: 领导对自己的expectation。孙猴子自从加入编制以后,就随便一个宠物
: 都打不过了。
: 现在正式宣告所有的办法都已经想尽了。freeze code了。
: 明天打包提交,然后拜佛求前几名的code在test set上多crash几个sample。
: 我是全C++版本。本来想借此役给C++打个翻身仗的。现在看来连C#都干部过了。
: 第一应该还是python的。这次完了我也要全面转python了。
: 要有同学有兴趣我到时候把代码开源了。

s***o
发帖数: 2191
110
wdong的BSO贴,支持一下
相关主题
Kaggle 被买了R语言,小笔记本,如何调参?
数据碗的结果出来了 weidong站上英雄榜了Kaggle比赛禁止中国人参加
Ai这个社团很多人是很坏的Zillow Prize讨论专用贴
进入Programming版参与讨论
a*f
发帖数: 1790
111
用Java做的一个三层网络运行了一下Customer Satisfaction,三十秒左右就内存溢出
了,是不是需要把不相关的column用算法先滤掉?
java.lang.OutOfMemoryError: GC overhead limit exceeded
java.lang.OutOfMemoryError: Java heap space
p**2
发帖数: 613
112
进来膜拜下大牛,俺周末吹了个牛逼,
拿了5k,完全没技术含量,
就是把2B用WP+plugin做的shopping cart
导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
客户很happy,大家都很愉快,除了2B很生气。

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

w***g
发帖数: 5958
113
你这个才真叫牛,不但拿了钱,别人还高兴。

【在 p**2 的大作中提到】
: 进来膜拜下大牛,俺周末吹了个牛逼,
: 拿了5k,完全没技术含量,
: 就是把2B用WP+plugin做的shopping cart
: 导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
: 客户很happy,大家都很愉快,除了2B很生气。

l*********s
发帖数: 5409
114
做马工可惜了啊

【在 p**2 的大作中提到】
: 进来膜拜下大牛,俺周末吹了个牛逼,
: 拿了5k,完全没技术含量,
: 就是把2B用WP+plugin做的shopping cart
: 导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
: 客户很happy,大家都很愉快,除了2B很生气。

ET
发帖数: 10701
115
给我介绍点活吧/我也擅长做shopping cart

【在 p**2 的大作中提到】
: 进来膜拜下大牛,俺周末吹了个牛逼,
: 拿了5k,完全没技术含量,
: 就是把2B用WP+plugin做的shopping cart
: 导入到我自己home made的shopping cart里去了,界面很PP,速度很快,
: 客户很happy,大家都很愉快,除了2B很生气。

p**2
发帖数: 613
116
俺忽了个悠,又被楼上各路大神嘲笑了。
其实谈了一阵了,然后客户周末才决定弃用WP+Plugin,
俺也是小打小闹,勉强混个奶粉钱,如果哪天接到大活,一定分享。

【在 w***g 的大作中提到】
: 你这个才真叫牛,不但拿了钱,别人还高兴。
w***g
发帖数: 5958
117
刚才提交的时候可能犯了个在错误,估计要功亏一篑了。

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

K***s
发帖数: 2063
118
膜拜

【在 w***g 的大作中提到】
: 都不是易与之辈。要拿钱太太太难了。
: 现在还是前四,明天估计就不保了。
: 我不用上班已经很有优势了,最近两个星期全时间搞。
: 所有的活都推掉了,竟然还是搞不过他们。

v*******e
发帖数: 11604
119
python 3.5 有gradual typing,可以试试看,把心得告诉我们。

【在 n******7 的大作中提到】
: 明白了
: 那跟我用java的感受差不多,虽然c++对ml的支持应该好不少
: sklearn去年用过一个月,主要用的Naive Bayes,功能支持上还是有些不完善的地方
: 不过总体确实不错了
: 考虑的python的 user base,应该会越来越好
: 要是python能强制type,debug能更给力些就完美了
: 跑半天报个错退出太痛苦了

l****u
发帖数: 1764
120
我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?

【在 a*f 的大作中提到】
: python的缩进坑还没填?
相关主题
廖方舟 李哲 金奖! (转载)GAN是不是DL里面最活跃的领域?
求教 xgboost train error 非常小,咋回事什么都别说了,刷题是王道,我要加入拳皇帮了
准备向wdong大牛学习单干了看了几个kaggle的答题,有点迷惑了
进入Programming版参与讨论
f********3
发帖数: 20
121
可以多敲几个空格嘛。。。
n******7
发帖数: 12463
122
这也怪python?
;键坏了好多语言就不能写了吧
{}键坏了就更多语言不能写了吧
还有,你的回车键坏了怎么办?

【在 l****u 的大作中提到】
: 我很好奇的是,如果我键盘的Tab键坏了,我就不能写python了?
n******7
发帖数: 12463
123
这个估计改不了了
也还好
编辑器都能处理
也就是影响一下代码文件大小

【在 a*f 的大作中提到】
: python的缩进坑还没填?
n******7
发帖数: 12463
124
看起来不错
我得现研究一下python 3.x的库支持如何了

【在 v*******e 的大作中提到】
: python 3.5 有gradual typing,可以试试看,把心得告诉我们。
s***o
发帖数: 2191
125
排第二了。不过好像排名重新计算了。咋回事?

【在 w***g 的大作中提到】
: 刚才提交的时候可能犯了个在错误,估计要功亏一篑了。
n******7
发帖数: 12463
126
好像很多team挂了

【在 s***o 的大作中提到】
: 排第二了。不过好像排名重新计算了。咋回事?
l****u
发帖数: 1764
127
只要对齐了就行, 空格也可以么?
我发现windows下一般的文本编辑器的tab缩进的距离好像和linux下vim的tab相差好大

【在 f********3 的大作中提到】
: 可以多敲几个空格嘛。。。
l****u
发帖数: 1764
128
没有回车也能写吧,只是比较难看

【在 n******7 的大作中提到】
: 这也怪python?
: ;键坏了好多语言就不能写了吧
: {}键坏了就更多语言不能写了吧
: 还有,你的回车键坏了怎么办?

w***g
发帖数: 5958
129
换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。

【在 n******7 的大作中提到】
: 好像很多team挂了
K***s
发帖数: 2063
130
希望大师得奖,然后给大家开个课讲讲

【在 w***g 的大作中提到】
: 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
: 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。

相关主题
[bssd]最近公司有人整我关于搞ML刷数据的职业前途
被opengl害惨了!有没有大牛愿意牵头搞一个 deep learning project
总结一下kaggle比赛数据科学碗2017
进入Programming版参与讨论
n******7
发帖数: 12463
131
你好像在这1%test set上稳排第二了
之前的第二掉了不少
之前的第三更是不见了,可见确实overfit了
好像是前三名都有钱?写着"in the money"

【在 w***g 的大作中提到】
: 换测试数据了,很多组还没算出来。这个只是最终440个样本中的3个测试的,
: 分数很不准。最终排名要下星期才会定。第一名很牛,我已经不抱任何希望了。

w***g
发帖数: 5958
132
因为之前那个版本leader board的ground truth release了,
那部分数据可以用来做训练集,所以有一部分人还在拿那个
数据和原有的数据合起来训练。去年第一名那组号称要训练
到deadline为止,所以还有不少牛组还没提交。
之前第二那组不知道怎么回事,感觉不正常。

【在 n******7 的大作中提到】
: 你好像在这1%test set上稳排第二了
: 之前的第二掉了不少
: 之前的第三更是不见了,可见确实overfit了
: 好像是前三名都有钱?写着"in the money"

K***s
发帖数: 2063
133
跌到第六了。
加油啊

【在 w***g 的大作中提到】
: 因为之前那个版本leader board的ground truth release了,
: 那部分数据可以用来做训练集,所以有一部分人还在拿那个
: 数据和原有的数据合起来训练。去年第一名那组号称要训练
: 到deadline为止,所以还有不少牛组还没提交。
: 之前第二那组不知道怎么回事,感觉不正常。

w***g
发帖数: 5958
134
正常情况我们应该能进前十。按规则上星期一以后就不能再调参数了的,
现在我觉得规则已经失效了。应该还有人在对着测试数据调。
明天排名应该还会大调整。

【在 K***s 的大作中提到】
: 跌到第六了。
: 加油啊

l*******m
发帖数: 1096
135
别瞎叫,没有双十字是拿不着奖的

【在 K***s 的大作中提到】
: 跌到第六了。
: 加油啊

w***g
发帖数: 5958
136
有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。
kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial,
但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。
我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了
几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。

【在 l*******m 的大作中提到】
: 别瞎叫,没有双十字是拿不着奖的
ET
发帖数: 10701
137
我还search 了下这个 xu bing, 很年轻的university of alberta的硕士生。北邮毕
业的。
你觉得他功底不错?

【在 w***g 的大作中提到】
: 有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。
: kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial,
: 但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。
: 我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了
: 几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。

n******7
发帖数: 12463
138
show me the money
感觉是玩SC的
你第一次玩就top 10,已经很NB了
比赛结束了麻烦给大家show下黑科技
我们长长见识

【在 w***g 的大作中提到】
: 有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。
: kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial,
: 但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。
: 我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了
: 几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。

I******y
发帖数: 176
139
mark 牛人贴~~~
w***g
发帖数: 5958
140
结果出来了,只排第9,真是无脸见江东父老啊。

【在 I******y 的大作中提到】
: mark 牛人贴~~~
相关主题
数据科学碗2017数据碗的结果出来了 weidong站上英雄榜了
ML 需不需要搞懂那些数学Ai这个社团很多人是很坏的
Kaggle 被买了R语言,小笔记本,如何调参?
进入Programming版参与讨论
s***o
发帖数: 2191
141
这个数代表什么,应该不是速度吧? C++还跑不过python>?

【在 w***g 的大作中提到】
: 结果出来了,只排第9,真是无脸见江东父老啊。
b***i
发帖数: 3043
142
这个到底干啥的?你给大家介绍一下?

【在 w***g 的大作中提到】
: 结果出来了,只排第9,真是无脸见江东父老啊。
l*******m
发帖数: 1096
143
可能ensemble不够多?cnn上套rnn的?

【在 w***g 的大作中提到】
: 结果出来了,只排第9,真是无脸见江东父老啊。
w***g
发帖数: 5958
144
就是输入一系列心脏的CT图片,要求把其中一个心室的大小算出来。
我没上ensemble。很肯能是攀错科技枝了。

【在 b***i 的大作中提到】
: 这个到底干啥的?你给大家介绍一下?
n******7
发帖数: 12463
145
还是几个老家伙厉害
历史成绩都不错
这个alex的搭档是他gf吧
这下可以求婚了

【在 w***g 的大作中提到】
: 结果出来了,只排第9,真是无脸见江东父老啊。
n******7
发帖数: 12463
146
Continuous Ranked Probability Score (CRPS)
https://www.kaggle.com/c/second-annual-data-science-bowl/detail

【在 s***o 的大作中提到】
: 这个数代表什么,应该不是速度吧? C++还跑不过python>?
n******7
发帖数: 12463
147
Keras.io 确实有些low啊
之前排第三,现在掉到快50了
琢磨这么一大帮人就忙着overfitting 刷战绩啊
想起以前有个人,每次CS战绩一不好,就立马退出清零重来
不熟悉的人一看这哥们儿老是杀人比被杀多,以为很厉害

【在 w***g 的大作中提到】
: 有几组拼着不拿奖,也要把排名调到第一。我觉得是抢广告位。
: kaggle上卖软件的有两批人,一个是Xu Bing,每次都来给个tutorial,
: 但是自己不参赛,这人很不错。还有就是keras.io。现在看来这批人手脚不怎么干净。
: 我们早已不报任何希望拿钱了,只求善始善终。上星期在第二名的广告位上呆了
: 几天,已经很不错了。现在第一那人看着也是老中,我觉得很有希望拿钱。

w***g
发帖数: 5958
148
上个图。因为原图太大,扣了一部分下来,并且转成了gif。心脏那部分有个虚线,
就是预测的内容。大致都能画个八九不离十,但是因为人长得很不一样,扫描效果
也不一样,所以各种corner case很多,全都要做准比较难。这个case我随便找
的,可以看到其实白色的部分没有全都圈进去,所以不是最准。给的groundtruth
和需要预测的是医生标注的心脏最大和最小时的体积,数据是心脏不同位置的切面
时间序列。每个切面预测了最大/最小圈以后算成面积,然后按位置累计起来变成
体积。
我等着看前几名的解法,应该会有有意思的东西。

【在 w***g 的大作中提到】
: 就是输入一系列心脏的CT图片,要求把其中一个心室的大小算出来。
: 我没上ensemble。很肯能是攀错科技枝了。

e*******o
发帖数: 4654
149
前10都很牛了。
本版应该没有可以跟wdong过招的了。

【在 w***g 的大作中提到】
: 结果出来了,只排第9,真是无脸见江东父老啊。
w***g
发帖数: 5958
150
第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了
segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个
contour画得好了。应该神经网络走到底的!
机器战胜人类的又一个实例!
相关主题
Kaggle比赛禁止中国人参加求教 xgboost train error 非常小,咋回事
Zillow Prize讨论专用贴准备向wdong大牛学习单干了
廖方舟 李哲 金奖! (转载)GAN是不是DL里面最活跃的领域?
进入Programming版参与讨论
K***s
发帖数: 2063
151
太牛了

【在 w***g 的大作中提到】
: 上个图。因为原图太大,扣了一部分下来,并且转成了gif。心脏那部分有个虚线,
: 就是预测的内容。大致都能画个八九不离十,但是因为人长得很不一样,扫描效果
: 也不一样,所以各种corner case很多,全都要做准比较难。这个case我随便找
: 的,可以看到其实白色的部分没有全都圈进去,所以不是最准。给的groundtruth
: 和需要预测的是医生标注的心脏最大和最小时的体积,数据是心脏不同位置的切面
: 时间序列。每个切面预测了最大/最小圈以后算成面积,然后按位置累计起来变成
: 体积。
: 我等着看前几名的解法,应该会有有意思的东西。

l*******m
发帖数: 1096
152
现在好像大家dropout用得少了,啥理由?

【在 w***g 的大作中提到】
: 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了
: segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个
: contour画得好了。应该神经网络走到底的!
: 机器战胜人类的又一个实例!

n*****3
发帖数: 1584
153
link?

【在 w***g 的大作中提到】
: 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了
: segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个
: contour画得好了。应该神经网络走到底的!
: 机器战胜人类的又一个实例!

n******7
发帖数: 12463
154
https://github.com/317070/kaggle-heart

【在 n*****3 的大作中提到】
: link?
p**r
发帖数: 5853
155
大神能推荐个神经网络的入门教程看看?

【在 w***g 的大作中提到】
: 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了
: segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个
: contour画得好了。应该神经网络走到底的!
: 机器战胜人类的又一个实例!

n*****3
发帖数: 1584
156
thanks!!

【在 n******7 的大作中提到】
: https://github.com/317070/kaggle-heart
n******7
发帖数: 12463
157
要GPU
玩不了了

【在 n*****3 的大作中提到】
: thanks!!
N*****m
发帖数: 42603
158
我啥都擅长,也介绍给我吧

【在 ET 的大作中提到】
: 给我介绍点活吧/我也擅长做shopping cart
t********e
发帖数: 1169
159
知道陈天奇这些既能拿奖又能造轮子让别人拿奖的有多牛逼了吧
h*i
发帖数: 3446
160
是啊。这明显是个知觉问题,目前知觉问题就是NN最好用。
其实很多看似推理的问题其实可以转成知觉问题,比如下棋啥的。

【在 w***g 的大作中提到】
: 第二名解法公布了。确实攀错科技枝了。我走了一半神经网络,最后还是做了
: segmentation(上面的图可以看见)。然后大量的时间就花到了怎么画那个
: contour画得好了。应该神经网络走到底的!
: 机器战胜人类的又一个实例!

1 (共1页)
进入Programming版参与讨论
相关主题
什么都别说了,刷题是王道,我要加入拳皇帮了ML 需不需要搞懂那些数学
看了几个kaggle的答题,有点迷惑了Kaggle 被买了
[bssd]最近公司有人整我数据碗的结果出来了 weidong站上英雄榜了
被opengl害惨了!Ai这个社团很多人是很坏的
总结一下kaggle比赛R语言,小笔记本,如何调参?
关于搞ML刷数据的职业前途Kaggle比赛禁止中国人参加
有没有大牛愿意牵头搞一个 deep learning projectZillow Prize讨论专用贴
数据科学碗2017廖方舟 李哲 金奖! (转载)
相关话题的讨论汇总
话题: kaggle话题: br话题: python话题: wdong话题: c++