由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 有关归类
相关主题
求教! how to run python programs on a hadoop cluster请问哪些算法是可以用python写的,然后输入PMML
现在的大数据技术的价值和功用有些被夸大了我想写个survey报告 关于KNN classification algorithms
Data Scientist的编程能力spark 问题
求Google 的 Data Science 有关的位置内推 (转载)怎样能才能快速的找到KNN
Data scientist / Machine Learning Engineer 相关面试题 (转载)回馈本版~ 最近面的面经和收集来的面经~
求handle missing data的好方法[Data Science Project Case] Data Monitoring
刚入行新人的两个问题[Data Science Project Case]Future Income predicting
有人考虑过kaggle上这个预测CTR的题目么?应用统计硕士选课求教Data Science方向 (转载)
相关话题的讨论汇总
话题: 未知话题: sampling话题: 数据
进入DataSciences版参与讨论
1 (共1页)
I********2
发帖数: 244
1
关于KNN的doubt, 有一个数据, 可能被归于N类, N类的数据点大小比较不一样, 例如第
N0 类有10000个点, Nj 类中只有3个点 这样未知数据的k neighbor 好像总是归为大
类的多? 要如何处理?
同时,有没有方法是对大组做sampling, 在多少sampling的情况下,只要未知的点总是
在sample到的点的一定范围内,就认为未知点是这个大组的?
先谢过!
1 (共1页)
进入DataSciences版参与讨论
相关主题
应用统计硕士选课求教Data Science方向 (转载)Data scientist / Machine Learning Engineer 相关面试题 (转载)
suggestion on geospatial data? (转载)求handle missing data的好方法
datascientist几个基本问题刚入行新人的两个问题
how to split samples/data for A/B test有人考虑过kaggle上这个预测CTR的题目么?
求教! how to run python programs on a hadoop cluster请问哪些算法是可以用python写的,然后输入PMML
现在的大数据技术的价值和功用有些被夸大了我想写个survey报告 关于KNN classification algorithms
Data Scientist的编程能力spark 问题
求Google 的 Data Science 有关的位置内推 (转载)怎样能才能快速的找到KNN
相关话题的讨论汇总
话题: 未知话题: sampling话题: 数据