由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 一个经常会用到的问题,和推荐算法有点关系。想不到有什么直接简单的方法。
相关主题
[经验帖] 我是如何当上DS的请教一个用R做cox regression的问题
deep learning就是小团体 (转载)分析股票应该用那种算法?
求助:Hastie的书看不懂怎么办?刚知道有这个版。问一下nosql比sql好在哪里?
统计在data science里的地位数字破解算法
所谓的大数据big data一般用到的硬件会是什么架构
怎样实现 relational database,选 subset想请问以下F家DS的面经可以么?
技术电面感受&请教高大上的公司里的data scientist都做什么样的project?
请教几个问题最近觉得分类算法很多时候还是不靠谱啊
相关话题的讨论汇总
话题: subset话题: 子集话题: 看过话题: submatrix话题: min
进入DataSciences版参与讨论
1 (共1页)
s****h
发帖数: 3979
1
有个问题应该常见,可是想不好有什么现成的简单办法。
和推荐算法有点关系。
一群人,看过一堆书。
有完整的某人看过某书的信息
现在想拿到一个人,书,还有人书关系的子集,要求子集里每个人能看过不少于M本子
集里的书,子集里每本书不少于N个子集里的人看过。
好像唯一的方法就是狐狸分饼,越分越小。
while !(集合里所有人都看过M+本书,书都被N+人看过)

把不符合要求的书和人剔除出集合
c***z
发帖数: 6348
2
Any subset or min subset? For any subset, just use the mother set.
For min subset, it is the min submatrix of a binary matrix with respect to:
1. row.sum >= M
2. col.sum >= N
I would try dynamic programming but I am brain dead to think about the
details now.
A heuristic is to move a 2Mx2N submatrix around to see if we get lucky.
T*****u
发帖数: 7103
3
想法同上;第一个想法用graph表示书-人的关系,把小于m邻居的人node和小于n邻居的
书node一遍一遍的拆除,或者把满足的子集拆掉,基本一回事。如果这样的子集不止一
个(不相连的几个的合集),说不定有优势。
1 (共1页)
进入DataSciences版参与讨论
相关主题
最近觉得分类算法很多时候还是不靠谱啊所谓的大数据
R编程(RDeveloper)俱乐部: 提供R编程,R高性能算法,R统计分析(转载)怎样实现 relational database,选 subset
请大牛们推荐一些最新的classification的算法吧技术电面感受&请教
startup项目需要一个搞算法的朋友加盟或合作请教几个问题
[经验帖] 我是如何当上DS的请教一个用R做cox regression的问题
deep learning就是小团体 (转载)分析股票应该用那种算法?
求助:Hastie的书看不懂怎么办?刚知道有这个版。问一下nosql比sql好在哪里?
统计在data science里的地位数字破解算法
相关话题的讨论汇总
话题: subset话题: 子集话题: 看过话题: submatrix话题: min