由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - training dataset和unbalanced dataset的设计
相关主题
pyspark subtract 如何使用?紧急求救: SMOTE-NC 处理categorical data for unbalanced class!!!
R 里面random forest score新的data有new level的问题请问有关t-test(包子酬谢!) (转载)
请问关于小的dataset evaluation的问题[Data Science Project Case] Parsing URLS
请教一道面试题Role mining
一个面试题(predictive model) (转载)DS需要会的手艺 真不少
请问今年有Big Data的短期training培训吗(美国)?借版面问个machine learning的问题
Insight Data Science Fellow Program 有人参加吗?求职要求clearance
凑热闹转发一篇自己写的博文,轻拍[Data Science Project Case] Topic Learning
相关话题的讨论汇总
话题: dataset话题: unbalanced话题: training话题: 设计话题: crime
进入DataSciences版参与讨论
1 (共1页)
g*********3
发帖数: 177
1
各位大神,有没有这方面的经验:
实际项目中,数据库的postive/negative data points是极度unbalanced的。比如
crime database里面有1million individual,crime有100(positive data point),剩
下的全部是negative data point。
需要用这些数据建立一个machine learning model来classify将来一些人的crime。
怎样设计training dataset呢?有什么好的统计或者ML的方法吗?
谢谢。
1 (共1页)
进入DataSciences版参与讨论
相关主题
[Data Science Project Case] Topic Learning一个面试题(predictive model) (转载)
datascientist几个基本问题请问今年有Big Data的短期training培训吗(美国)?
ask for help for R programming (转载)Insight Data Science Fellow Program 有人参加吗?
Data scientist / Machine Learning Engineer 相关面试题 (转载)凑热闹转发一篇自己写的博文,轻拍
pyspark subtract 如何使用?紧急求救: SMOTE-NC 处理categorical data for unbalanced class!!!
R 里面random forest score新的data有new level的问题请问有关t-test(包子酬谢!) (转载)
请问关于小的dataset evaluation的问题[Data Science Project Case] Parsing URLS
请教一道面试题Role mining
相关话题的讨论汇总
话题: dataset话题: unbalanced话题: training话题: 设计话题: crime