由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 一道面试题,向本版求教一下。
相关主题
问一个关于clustering analysis的问题工作中遇到的一个现象,问问大家怎么解释 (转载)
问一道面试题[Data Science Project Case] Bias Correction
一道药厂computational biology的面试题big data一般用到的硬件会是什么架构
有关clustering问一道概率题, FACEBOOK, data scientitst考到得. (转载)
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?请教一道题目 (转载)
Science杂志一篇关于clustering的新文章 (转载)请教一个用R做cox regression的问题
我有大概80000~100000个左右的时间序列,希望对他们进行分类。请教一道面试题
有没有谁自己买服务器组建几个clusters跑hadoop大数据的?[Data Science Project Case] Fuzzy matching on names
相关话题的讨论汇总
话题: 面试题话题: 本版话题: twitter话题: 一道话题: group
进入DataSciences版参与讨论
1 (共1页)
s****e
发帖数: 1180
1
一道面试题,向本版求教一下。有一些 social data, data 是从 facebook, twitter
上找来的,是关于一些人有否喜欢一件产品,有这些人的 gender, age, country,而且
这些人都在 facebook, twitter 上表明他们喜欢这个产品了。 想根据这些数据,用一
些算法在数据上(或类似的东西),从而判别market 应该 target 哪个 group? group
是根据人的gender, age, country 分的,如 10-20, 20-40,40-60 age, sex, male
female, country usa, china, ...
向本版请教一下。多谢!:)
H*****l
发帖数: 1257
2
最基本的办法,就是一个简单的linear classification吧

twitter
group

【在 s****e 的大作中提到】
: 一道面试题,向本版求教一下。有一些 social data, data 是从 facebook, twitter
: 上找来的,是关于一些人有否喜欢一件产品,有这些人的 gender, age, country,而且
: 这些人都在 facebook, twitter 上表明他们喜欢这个产品了。 想根据这些数据,用一
: 些算法在数据上(或类似的东西),从而判别market 应该 target 哪个 group? group
: 是根据人的gender, age, country 分的,如 10-20, 20-40,40-60 age, sex, male
: female, country usa, china, ...
: 向本版请教一下。多谢!:)

c********h
发帖数: 330
3
楼主的数据都是like的人,没有negative instances

【在 H*****l 的大作中提到】
: 最基本的办法,就是一个简单的linear classification吧
:
: twitter
: group

o*********g
发帖数: 10
4
能不能先做个clustering看看?

twitter
group

【在 s****e 的大作中提到】
: 一道面试题,向本版求教一下。有一些 social data, data 是从 facebook, twitter
: 上找来的,是关于一些人有否喜欢一件产品,有这些人的 gender, age, country,而且
: 这些人都在 facebook, twitter 上表明他们喜欢这个产品了。 想根据这些数据,用一
: 些算法在数据上(或类似的东西),从而判别market 应该 target 哪个 group? group
: 是根据人的gender, age, country 分的,如 10-20, 20-40,40-60 age, sex, male
: female, country usa, china, ...
: 向本版请教一下。多谢!:)

l*******s
发帖数: 1258
5
关键是还得考虑抓数据时候的bias
比如喜欢上social media的貌似年轻人居多,那么在考虑target时就要想办法
normalize以下,否则,出来的结果肯定是20-30的人群。
1 (共1页)
进入DataSciences版参与讨论
相关主题
[Data Science Project Case] Fuzzy matching on names问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
有没有人想报Cloudera的Data Scientist Certificate的Science杂志一篇关于clustering的新文章 (转载)
[Data Science Project Case] Generate Categories for Product我有大概80000~100000个左右的时间序列,希望对他们进行分类。
only average statistics有没有谁自己买服务器组建几个clusters跑hadoop大数据的?
问一个关于clustering analysis的问题工作中遇到的一个现象,问问大家怎么解释 (转载)
问一道面试题[Data Science Project Case] Bias Correction
一道药厂computational biology的面试题big data一般用到的硬件会是什么架构
有关clustering问一道概率题, FACEBOOK, data scientitst考到得. (转载)
相关话题的讨论汇总
话题: 面试题话题: 本版话题: twitter话题: 一道话题: group